Главное > Pdf

Стандарт PDF/X

(1/232) > >>

Eugeen1948:
1. Каким стандартам должен удовлетворять файл PDF, чтобы его без ошибок и проблем можно было бы прямо конвертировать в DJVU напр. с помощью Pdftodjvu LE v0.1).
2. Каким образом  можно исправить файл PDF, чтобы он соответствовал стандарту (напр. PDF/PDF/X-3:2002, стандарту ISO для обмена графическим содержанием). 

monday2000:
Вопросы сложные. Относительно ошибок Pdftodjvu LE v0.1 (и проблем преобразования PDF-DjVu) у меня есть только такая информация:

http://www.djvu-soft.narod.ru/scan/bookscan_pdf.htm

В проблемных случаях ничего не остаётся, кроме как использовать схему "PDF->TIF->DjVu".

Eugeen1948:
Проблема действительно сложная. Я конвертирую в DJVU сотни!!! гигабайт файлов PDF.
(книги и подшивки  журналов, в основном научных). В, примерно, 70% случаев срабатывает автомат  "Pdftodjvu LE v0.1" (очень удачная разработка, другие  аналоги реально хуже, а их я пробовал все). В оставшихся 30% нет общих правил, и действовать приходится нестандартно.
Ваша схема "PDF->TIF->DjVu" действительно универсальна, но хороша для небольших и средних файлов с невысоким разрешением и, к тому же, не поддается автоматизации (пакетированию).
Трудность здесь одна (и главная) - получить приемлемое качество при  размере, значительно меньшем, чем у PDF-файла.
Я, вроде бы, нащупал некий способ автоматизации конверсии "плохих"  PDF-файлов.
Способ использует пакетное преобразование по двум схемам с помощью Adobe Acrobat (лучше 9-ой версии).
1. Упрощения схема пакетного преобразования PDF-файлов в стандарт PDF/X с обработкой и проверкой файлов "на плохое содержимое". Эта схема хорошо работает для конверсии подшивок однотипных журналов. Но в общем случае дает сбои (видно не всё хорошо и безошибочно  в королевстве Adobe!!!). Но в 20% остатка этот подход срабатывает.
2. Усложненная схема пакетного преобразования PDF-файлов работает как PDF->PS->PDF/X.
 Хотя, казалось бы, все аналогично п. 1, но эта схема почему-то  дает 25-28% решения проблемы исправления PDF-файлов (почему - не понятно!).
Но все же проблемы остаются. И в этом смысле формат PDF я считаю недоработанным, не полностью стандартизированным. Где-то там сидят баги!

monday2000:
Eugeen1948
Можно ещё также попробовать http://any2djvu.djvuzone.org/ : загружаете туда PDF (или указывайте онлайн-ссылку) - и он конвертит в PDF.

--- Цитировать ---Но все же проблемы остаются. И в этом смысле формат PDF я считаю недоработанным, не полностью стандартизированным. Где-то там сидят баги!
--- Конец цитаты ---
И не говорите.  :) Похоже, идеального PDF-просмотрщика нет (разве что, быть может, адобовский).

Т.е. проблема создания конвертора PDF-> DjVu - это проблема 100% верного прочтения любого PDF-файла - а это оказалось слишком трудной задачей. :)

Я когда-то искал удобную программную библиотеку для работы с PDF. Вот даже статью написал об этом: http://www.djvu-soft.narod.ru/scan/mupdf_info.htm

Есть ещё одна малоизвестная утилита по теме:

pdftodjvu v7.1.15012 (1,19 МБ) http://www.djvu-soft.narod.ru/soft/pdftodjvu_v7_1_15012.rar

Это из последнего DEE (7) конвертор. Правда, он чисто консольный. Попробуйте его также.

Eugeen1948:
В принципе, есть средство преодоления багов в PDF - это перепечатывание файла с помощью PDF-принтера. Причем надо полностью удалить сжатие в любом виде. Правда есть большое неудобство (а может быть я недоразобрался?) - это интерактивный режим. Никак не удается подавить запрос на место сохранения результата печати, из-за этого невозможна пакетная обработка. И еще баг - при печати пропадают закладки, хотя в параметрах указано сохранение закладок.   http://any2djvu.djvuzone.org/  - "проглатывает" лишь  небольшие файлы. а сложные случаи вообще не "жует"!
pdftodjvu v7.1.15012  - я пробовал, но баги он не преодолевает, а соотношение Размер/Качество у него хуже, чем у Pdftodjvu LE v0.1! Удивительно, как новые разработки делают хуже старых!

Навигация

[0] Главная страница сообщений

[#] Следующая страница

Перейти к полной версии