Перевод и распознавание текста

Администратор
Андрей Столяров
Медаль
Сообщений: 252
Санкт-Петербург
141 день назад
Для перевода рекомендую использовать google-переводчик. Теперь в него можно загружать документы целиком.
Но есть один совет: сначала создать документ в Word, исправив в нём все переносы и ошибки.

Распознавание отлично выполняет FineReader. На сайте http://finereaderonline.com можно бесплатно при регистрации распознать 10 страниц. Распознаёт даже отфотографированные старые машинописные методички почти без ошибок!
Кроме графических документов распознавать можно и текстовые pdf-документы, это часто более эффективно, чем конвертация их в word, по причине того, что при конвертации формулы и некоторые рисунки превращаются беспорядочные наборы символов.
Если качество распознавания pdf-документа низкое, его можно предварительно превратить в картинки с высоким разрешением с помощью программы Adobe Acrobat Professional.

При работе в программе FineReader:
1) Проверить и исправить разбиение текста на блоки. Блоки формул переделать в картинки.
2) Проверить и исправить порядок блоков (Главное меню / Области / Перенумеровать области), иначе они в распознанном тексте будут расположены в неправильном порядке.
3) После распознавания использовать сохранение как простого текста без форматирования, но с картинками.

В Word:
1) Удалить мягкие переносы (в диалоге "Замена" это условный символ "^-").
2) В режиме отображения непечатаемых символов проверить все знаки абзаца и удалить лишние, которые разрывают предложения.
3) Проверить картинки и перенести их, если они разрывают предложения.
4) Проверить и исправить все подчёркнутые орфографические ошибки (F7).
5) Проверить и удалить лишние знаки "тире" в словах (образуются при распознавании знаков переноса)


Для подготовки изображений помимо Фотошопа, как ни странно, могу рекомендовать бесплатный Gimp. Программу нужно чуть-чуть освоить, но, если привыкнуть, он предоставляет мощный набор инструментов на все случаи жизни. Даже недавно делал GIF-анимацию.
Редактировалось: 7 раз (Последний: 24 декабря 2017 в 14:25)
Администратор
Андрей Столяров
Медаль
Сообщений: 252
Санкт-Петербург
141 день назад
Также в работе помогает мобильный телефон
1) распознавание голоса (встроенное)
2) распознавание текста с картинки
Хорошая бесплатная программа Text Fairy, но для адекватного распознавания русского языка пришлось удалить английский и немецкий.
https://play.google.com/store/apps/details?id=com.renard.ocr&hl=ru
Администратор
Андрей Столяров
Медаль
Сообщений: 252
Санкт-Петербург
141 день назад

Конвертация таблиц из pdf в Excel

pdftables.com
Перейти на форум:
Быстрый ответ
Чтобы писать на форуме, зарегистрируйтесь или авторизуйтесь.