Вытащить русский текст из файла PDF
5916
9
Уважаемые форумчане!
Пожалуйста, посоветуйте, как решить проблему - есть pdf файл, при попытке скопировать текст через буфер обмена в ворд - на выходе получается абракадабра... может быть, существует бесплатная, доступная и удобная программа, позволяющая извлечь русскоязычный текст из pdf-а в ворд.... пробовал разные варианты конвертеров из интернета.. все работают криво... то есть также выдают какую-то ботву вместо текста...
Muad Dib
Я finereader'ом пользуюсь. Правда, он не совсем бесплатен, но это преодолимо. После распознавания придется текст переработать до приемлемого вида.
kazik
Это как? *заинтересовано* :спок:
Muad Dib
может быть, существует бесплатная, доступная и удобная программа, позволяющая извлечь русскоязычный текст из pdf-а в ворд....
Сейчас попробовал открыть pdf с русским текстом в Sumatra PDF v0.7 (программа просмотра) - там выделил участок текста, затем Ctrl+C и Ctrl+V в Ворде - получается номальный текст, поддающийся редактированию без всякой конвертации.:улыб:
Неудобно, что знаки переноса тоже переносятся в текст и текст тоже переносится по строкам, но это меньшее зло.
Muad Dib
Когда копируете, попробуйте поменять раскладку клавиатуры.
sojuz
п.9
из пдф в блокнот, из блокнота в ворд...
Muad Dib
А на Гугле вас забанили?
:хехе:

Ну еще, как вариант, OpenOffice 3. У него есть импорт pdf.
А далее можно записать во многие форматы.
Muad Dib
когда копируете и вставляете текст, раскладка клавиатуры должна стоять русская, как при копировании, так и вставке