Автор Тема: Стандарт PDF/X  (Прочитано 3522 раз)

Eugeen1948

  • Пользователь
  • **
  • Сообщений: 59
    • Просмотр профиля
    • E-mail
Стандарт PDF/X
« : 04 ёоЭм 2010, 14:11:29 »
1. Каким стандартам должен удовлетворять файл PDF, чтобы его без ошибок и проблем можно было бы прямо конвертировать в DJVU напр. с помощью Pdftodjvu LE v0.1).
2. Каким образом  можно исправить файл PDF, чтобы он соответствовал стандарту (напр. PDF/PDF/X-3:2002, стандарту ISO для обмена графическим содержанием). 

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Стандарт PDF/X
« Ответ #1 : 04 ёоЭм 2010, 15:38:39 »
Вопросы сложные. Относительно ошибок Pdftodjvu LE v0.1 (и проблем преобразования PDF-DjVu) у меня есть только такая информация:

http://www.djvu-soft.narod.ru/scan/bookscan_pdf.htm

В проблемных случаях ничего не остаётся, кроме как использовать схему "PDF->TIF->DjVu".

Eugeen1948

  • Пользователь
  • **
  • Сообщений: 59
    • Просмотр профиля
    • E-mail
Re: Стандарт PDF/X
« Ответ #2 : 04 ёоЭм 2010, 22:43:50 »
Проблема действительно сложная. Я конвертирую в DJVU сотни!!! гигабайт файлов PDF.
(книги и подшивки  журналов, в основном научных). В, примерно, 70% случаев срабатывает автомат  "Pdftodjvu LE v0.1" (очень удачная разработка, другие  аналоги реально хуже, а их я пробовал все). В оставшихся 30% нет общих правил, и действовать приходится нестандартно.
Ваша схема "PDF->TIF->DjVu" действительно универсальна, но хороша для небольших и средних файлов с невысоким разрешением и, к тому же, не поддается автоматизации (пакетированию).
Трудность здесь одна (и главная) - получить приемлемое качество при  размере, значительно меньшем, чем у PDF-файла.
Я, вроде бы, нащупал некий способ автоматизации конверсии "плохих"  PDF-файлов.
Способ использует пакетное преобразование по двум схемам с помощью Adobe Acrobat (лучше 9-ой версии).
1. Упрощения схема пакетного преобразования PDF-файлов в стандарт PDF/X с обработкой и проверкой файлов "на плохое содержимое". Эта схема хорошо работает для конверсии подшивок однотипных журналов. Но в общем случае дает сбои (видно не всё хорошо и безошибочно  в королевстве Adobe!!!). Но в 20% остатка этот подход срабатывает.
2. Усложненная схема пакетного преобразования PDF-файлов работает как PDF->PS->PDF/X.
 Хотя, казалось бы, все аналогично п. 1, но эта схема почему-то  дает 25-28% решения проблемы исправления PDF-файлов (почему - не понятно!).
Но все же проблемы остаются. И в этом смысле формат PDF я считаю недоработанным, не полностью стандартизированным. Где-то там сидят баги!

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Стандарт PDF/X
« Ответ #3 : 07 ёоЭм 2010, 09:22:51 »
Eugeen1948
Можно ещё также попробовать http://any2djvu.djvuzone.org/ : загружаете туда PDF (или указывайте онлайн-ссылку) - и он конвертит в PDF.
Цитировать
Но все же проблемы остаются. И в этом смысле формат PDF я считаю недоработанным, не полностью стандартизированным. Где-то там сидят баги!
И не говорите.  :) Похоже, идеального PDF-просмотрщика нет (разве что, быть может, адобовский).

Т.е. проблема создания конвертора PDF-> DjVu - это проблема 100% верного прочтения любого PDF-файла - а это оказалось слишком трудной задачей. :)

Я когда-то искал удобную программную библиотеку для работы с PDF. Вот даже статью написал об этом: http://www.djvu-soft.narod.ru/scan/mupdf_info.htm

Есть ещё одна малоизвестная утилита по теме:

pdftodjvu v7.1.15012 (1,19 МБ) http://www.djvu-soft.narod.ru/soft/pdftodjvu_v7_1_15012.rar

Это из последнего DEE (7) конвертор. Правда, он чисто консольный. Попробуйте его также.

Eugeen1948

  • Пользователь
  • **
  • Сообщений: 59
    • Просмотр профиля
    • E-mail
Re: Стандарт PDF/X
« Ответ #4 : 07 ёоЭм 2010, 14:22:59 »
В принципе, есть средство преодоления багов в PDF - это перепечатывание файла с помощью PDF-принтера. Причем надо полностью удалить сжатие в любом виде. Правда есть большое неудобство (а может быть я недоразобрался?) - это интерактивный режим. Никак не удается подавить запрос на место сохранения результата печати, из-за этого невозможна пакетная обработка. И еще баг - при печати пропадают закладки, хотя в параметрах указано сохранение закладок.   http://any2djvu.djvuzone.org/  - "проглатывает" лишь  небольшие файлы. а сложные случаи вообще не "жует"!
pdftodjvu v7.1.15012  - я пробовал, но баги он не преодолевает, а соотношение Размер/Качество у него хуже, чем у Pdftodjvu LE v0.1! Удивительно, как новые разработки делают хуже старых!

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Стандарт PDF/X
« Ответ #5 : 07 ёоЭм 2010, 14:49:23 »
Eugeen1948
Цитировать
Никак не удается подавить запрос на место сохранения результата печати, из-за этого невозможна пакетная обработка.
Можно попробовать разные PDF-принтеры. Вроде бы FinePrint имеет возможность пакетно печатать PDF (я сам не пробовал, просто кто-то говорил).
Цитировать
Удивительно, как новые разработки делают хуже старых!
Скорее, это просто криво сделанный конвертор. Думаю, он то ли не подхватывает профили, то ли просто криво сделан.
« Последнее редактирование: 07 ёоЭм 2010, 14:53:34 от monday2000 »