Я подготовил сравнительный пример декодирования PDF -> TIF:
http://www.djvu-soft.narod.ru/scan/pdf_dec.rar (48 КБ)
Там внутри:
- Файл Original.pdf - исходный векторный PDF-файл (1-страничный)
и ещё несколько DjVu-файлов, созданных из TIF'ов, декодированных из Original.pdf разными программами, а именно:
- ABBYY FineReader 8.0 Pro (300 dpi)
- GhostScript 9.01 (600 dpi)
- mupdf-0.8 (600 dpi)
- PDF X-Change Viewer 2.0 b54 (600 dpi)
(хотел ещё СканКромсатором декодировать - но он не умеет декодировать чисто векторные PDF).
Вопрос в том, какой DjVu-файл получился лучше, и, следовательно, какой программой лучше всего декодировать из PDF в TIF?
Понятно, что предпочтение следует отдавать свободно-бесплатным программам.
На этом примере каждый желающий может сравнить качество декодирования PDF->TIF, которое предоставляет та или иная программа. Я внимательно сравнил эти результаты и расположил программы-декодировщики по качеству:
1 Место: ИМХО - это PDF X-Change Viewer. Он подобрал максимально близкий фонт (к исходному) при декодировании. А также он довольно быстро работает.
2 Место: ABBYY FineReader 8.0 Pro. Но с существенными оговорками. Во-первых, я не смог настроить программу так, чтобы она выдавала 600-dpi растровое изображение. Получилось только 300-dpi растровое изображение. Во-вторых, потерялась информация о цвете букв. Там в исходном PDF одна запятая - красного цвета - так вот, сразу после открытия этого PDF в программе эта запятая уже была чёрная (а должна была остаться красной). Сказывается всё же назначение программы - OCR, так что для OCR цвет текста вообще не важен - вот он и не сохраняется.
Зато начертание букв почти столь же хорошее получилось, что и у PDF X-Change Viewer. Хотя - на 300 dpi - что весьма плохо.
3 Место: GhostScript 9.01. Начертание фонта оказалось не слишком совпадающим с оригинальным. Местами это очень заметно. Но зато скорость декодирования - высокая.
4 Место: mupdf-0.8. Самый скромный результат. Начертание фонта - наиболее далёкое от оригинального (по сравнению с другими результатами). Скорость декодирования - дикие тормоза (может, потому что я декодировал в PPM?) В общем, совершенно недостойно внимания.
Выводы:
1. Самая рекомендуемая программа для декодирования PDF -> TIF (под Windows) (в настоящий момент) - это PDF X-Change Viewer.
2. При декодировании PDF в TIF следует всегда указывать 600 dpi (а не 300 dpi). Это резко улучшает качество получаемого растрового изображения. При этом количество пикселей по длине и по ширине удваивается (по сравнению с 300 dpi).
3. Возможно, найдётся некая программа, которая превзойдёт PDF X-Change Viewer по качеству декодирования PDF -> TIF. Но будет ли она при этом свободно-бесплатной? Если она будет пиратской - не слишком ли экзотической и малодоступной она окажется?
Я ещё не пробовал Adobe Acrobat Pro и Foxit-программы.