Главное > Pdf

Конвертирование PDF->TXT

(1/191) > >>

Dimitar Genchev:
Ищу программу для извлечения текста из PDF файл.
Dimitar Genchev

Переименовано из "Конвертирование PDF файла" в "Конвертирование PDF->TXT ".

57an:
Если pdf векторный, то попробуйте функцию "Сохранить как текст" в Adobe Reader 9.
Если растровый - то извлекать страницы-картинки, например вот этим комплектом и распознавать их в FineReader (что лучше) или CuneiForm (что бесплатнее).
Растровый от векторного легко отличить при сильном увеличении текста - векторный сохранит округлость букв, в растровом буквы будут "лесенкой".

monday2000:
Dimitar Genchev
Мне сложно что-то посоветовать, кроме сказанного 57an. Как вариант, можно перепробовать множество shareware программ по запросу "pdf to txt" в Google. ;)

57an:
Очень хороша для извлечения изображений из pdf программа
PDF Explorer 1.5.0.59-2 portable.
Главное - она сама определяет dpi извлекаемых картинок. Раньше такое было возможно только через Adobe Acrobat.

alexipp:
Adobe Acrobat.
Векторный pdf сразу можно сохранить в rtf или doc с сохранением картинок.
Для растрового с распознанным слоем можно извлечь картинки с помощью сохранения нужных страниц в tiff, а текст извлекается как для векторного pdf.

Навигация

[0] Главная страница сообщений

[#] Следующая страница

Перейти к полной версии