Проблема с импортом PDF в ScanKromsator

Главное > Pdf

(1/503) > >>

Wehrwolf:
Часто пользуюсь SK (5.92b) для перепаковки PDF в DJVU, но недавно столкнулся с такой проблемой: при попытке импорта PDF-файла с отсканированными в оригинальном виде книгами, какие часто присутствуют на западных сайтах вроде "archive.org", SK зависает или выдаёт ошибку "Acess violation at adress 00403410 in module 'ScanKromasator.exe'. Write of adress 00000000". При этом PDF-файл может быть как небольшой (11 Мб) так и побольше (32 Мб).

Подскажите пожалуйста, в чём причина подобного и как это можно побороть?

Прилагаю одну из подобных книг: http://rapidshare.com/files/449114521/4.pdf

----------------
У меня CPU Athlon X2 Dual Core 2,8 Ггц, 2 Гб RAM, WinXP SP3, свободного места на винте 100 Гб.

monday2000:
Wehrwolf
Преобразование PDF в TIF - это вообще проблема в общем случае. К сожалению, многие известные программы для декодирования PDF в TIF умеют корректно декодировать не любой PDF-файл.

У меня был случай, когда даже Adobe Acrobat Professional 9.4 не смог корректно декодировать PDF-файл, а Foxit Reader смог! :o ;D

Помимо правильности декодирования, ИМХО немаловажен такой параметр декодирования, как скорость.

Неплохие результаты во всех отношениях даёт свободно-бесплатный PDF-просмотрщик PDF Xchange Viewer http://www.tracker-software.com/product/downloads .

Он довольно неплохо декодирует и у него высокая скорость. Вот тот мой проблемный PDF-файл он декодировал почти правильно (а Adobe Acrobat некорректно).

ScanKromsator вообще не годится для цели декодирования PDF в TIF. Потому что СК умеет лишь только вытаскивать из PDF растровые картинки - и не умеет рендерить векторный PDF в растровое изображение. То есть, СК умеет декодировать в TIF исключительно растровые PDF (вроде Вашего) - а векторные - нет.

К тому же СК очень медленен - в плане декодирования PDF.

burunduchay:
В старых версиях СК насколько я знаю были проблемы с pdf сделанных гуглом и архивом.орг. В последней версии 5.4 это было исправлено. Версия была доступна только тестерам по запросу на форуме СК.
Скорость декодирования в СК хуже только на файлах, сжатых jpg2000. В остальных случаях она ничем не уступает другим утилитам декодирования. так как декодирование это разовый процесс то лишние 3-5 минут декодирования ничто по сравнению со временем которое тратится на обработку.
Кроме того, если pdf страница содержит сложное содержание, например текст и поверх несколько картинок, то СК в отличие от других программ воссоздаст такой же макет в своем задании используя зоны. В других программах вы получите эти файлы по отдельности либо слитые в одно изображение. В первом случае непонятно вообще что делать с этой кучей файлов из-за того что картинки будут по отдельности, во втором случае получите смешение содержимого которое приведет только к ухудшению качества. Еще один плюс - СК сохраняет прозрачность для извлеченных картинок, корректно превращая из в зоны произвольной формы. В других прогах информацию о прозрачности вообще не получишь.
Еще один плюс - при импорте страниц СК высчитывает dpi изображений включая и зоны и заносит их в извлеченные файлы. Другие проги в большинстве своем dpi не сохраняют и не определяют. Некоторые запрашивают его у пользователя, что говорит о том что они не извлекают картинки а тупо рендерят их с заданным разрешением.
СК действительно не импортирует векторные pdf. Непонятно, почему это так важно. СК обрабатывает сканы, но точно не векторные файлы которые и так имеют идеальное качество.
Если исходный pdf содержит только ч/б либо только цветные изображения без зон, то особой разницы чем их извлекать в общем случае нет. Но в СК это делать удобнее так как он сразу формирует задание, именует как надо извлеченные файлы и может импортировать в одно задание сразу несколько пдф файлов за раз. Кроме того, он может импортировать нужный диапазон страниц.

monday2000:
burunduchay

--- Цитировать ---В последней версии 5.4 это было исправлено.
--- Конец цитаты ---
Наверное, речь идёт о версии 5.94.

--- Цитировать ---Скорость декодирования в СК хуже только на файлах, сжатых jpg2000. В остальных случаях она ничем не уступает другим утилитам декодирования.
--- Конец цитаты ---
А, ну вот данный файл http://rapidshare.com/files/449114521/4.pdf как раз и сжат в JPEG2000 - возможно, поэтому СК и вылетал. По крайней мере, тормозил дико при декодировании.

--- Цитировать ---СК действительно не импортирует векторные pdf. Непонятно, почему это так важно.
--- Конец цитаты ---
Я придерживаюсь такой теории, что мы практически не в состоянии в общем случае постичь логику пользователя. Да мало ли почему он захочет поступить тем или иным образом? Вы предполагаете "здравый смысл" со стороны пользователя - но это ошибка. Человек может сотворить любую глупость - и ему свои мозги не вставишь.

Обычному пользователю "до лампочки" - векторный PDF или растровый. Вот ему нужно переделать PDF в DjVu (по неизвестной причине, пускай даже глупой) - и в случае векторного PDF СК не справится.

--- Цитировать ---то СК в отличие от других программ воссоздаст такой же макет в своем задании используя зоны.
--- Конец цитаты ---
Все эти плюсы, что Вы перечислили - это, конечно, хорошо. Но только вот таких программ вообще-то много - у которых есть тот или иной плюс в деле декодирования PDF в TIF - но при этом у каждой из этих программ имеется хотя бы один досадный "минус" - который сводит на нет универсализм того или иного декодера PDF. Вот и СК оказался одной из таких программ - с ошибкой вылетел у Wehrwolf, и не умеет декодировать векторный PDF.

Просто ИМХО таков уж сам по себе формат PDF - это такая дрянь, которую ни одна программа в мире не умеет правильно декодировать в TIF в общем случае. Даже Adobe Acrobat Pro оказался несостоятельным в этом отношении.

И поэтому напрашивается такой вывод, что необходимо иметь несколько разных декодеров PDF -> TIF - подбирая нужный на каждый сложный случай декодирования PDF -> TIF.

don555:

--- Цитата: monday2000 от 22 ДХТаРЫм 2011, 09:21:15 ---Wehrwolf

Неплохие результаты во всех отношениях даёт свободно-бесплатный PDF-просмотрщик PDF Xchange Viewer http://www.tracker-software.com/product/downloads .

Он довольно неплохо декодирует и у него высокая скорость. Вот тот мой проблемный PDF-файл он декодировал почти правильно (а Adobe Acrobat некорректно).

--- Конец цитаты ---

А что значит-"а Adobe Acrobat некорректно"?

Я никогда не обращал на это внимание.

Навигация

[0] Главная страница сообщений

[#] Следующая страница

Перейти к полной версии