Главное > Сканобработка

Сканирование книг: общие вопросы

(1/560) > >>

monday2000:
Данный топик создан для обсуждения любых общих вопросов касательно сканирования книг.

Не всегда можно определиться, к какой именно теме относится тот или иной вопрос по сканированию книг - вот как раз для таких общих моментов и задуман данный топик.

monday2000:
По поводу инструкции http://www.djvu-soft.narod.ru/scan/scan_and_share_1_07.htm :

Как известно, там предписано использовать формат TIF как основной рабочий формат для книгосканирования.

А я подумал: а почему не BMP? Чем так уж плох BMP для этой роли?

Обычно считается, что TIF предпочтительнее, чем BMP (для целей книгосканирования), т.к. у формата TIF есть беспотерьное сжатие LZW (для серого и цветного) и CCIT Fax G4 (для чёрно-белого).

Но так уж ли действительно необходимы эти виды сжатия (именно для целей книгосканирования)? Рассмотрим подробнее:

1. LZW. Казалось бы, имеет смысл, если мы собираемся на всякий случай сохранить сырые сканы на DVD-болванку. Но, так ли уж часто мы это делаем? И каков выигрыш в размере при LZW-сжатии?

Я могу сказать: иногда LZW не даёт вообще никакого выигрыша в размере. Пример: цветные сканы журнала "Техника-молодёжи". Ну сжал я эти сканы в LZW - чтобы записать на DVD-болванку - ну и что? Размер не уменьшился ни насколько.

2. CCIT Fax G4. Смысл этого сжатия вообще непонятен (для наших целей): разве кто-нибудь сохраняет готовые обработанные чёрно-белые сканы на DVD-болванку? По-видимому, это не имеет никакого смысла: сохранять на DVD-болванку (на всякий случай) имеет смысл только исходные необработанные серые (цветные) сканы. CCIT Fax G4 имеет смысл разве что для уменьшения потребления дискового пространства в процессе сканобработки.

А теперь о недостатках TIF по сравнению с BMP:

1. BMP никогда не имеет глюков с неподдерживаемыми тегами, как TIF. Все мы знаем, что нередко TIF, полученный от одной программы, не хочет воспринимать другая программа - и приходится "прогонять" эти TIF'ы пакетно через Irfan View, чтобы решить проблему (а в самых тяжёлых случаях, кстати, приходится перегонять TIF -> BMP!).

2. C BMP проще работать программно (винда его вообще напрямую поддерживает - даже Windows 98, а для поддержки TIF уже нужны доп. условия).

3. Интересно, LZW ведь требует некое время для кодировки/раскодировки в/из него? Это же должно давать некое замедление сканобработки (?).

4. И любому "чайнику" ИМХО проще иметь дело именно с BMP, нежели чем с TIF - т.к. BMP прост и понятен, как пареная репа, и всегда беспроблемно везде поддерживается (в Windows).

Отсюда вырисовывается общий вывод:

Я думаю, что можно в ScanAndShare спокойно рекомендовать сканировать не в TIF, а в BMP (или по выбору: в TIF или в BMP, а не только в TIF, как сейчас). А уже потом пусть сканобрабатывающие программы (ScanKromsator или Scan Tailor) "на лету" преобразовывают (в процессе сканобработки) насканенные BMP'шки в TIF'ы (ради экономии места за счёт CCIT Fax G4) - и то, если в этом действительно будет смысл.

T-ya:
А можно выложить страничку-пример, для которой LZW не дает уменьшения размера по сравнению с BMP? Для меня это удивительно.

monday2000:
T-ya
Да, действительно не смог я найти такой пример сейчас. :-[ Попробовал несколько разных сканов - везде LZW уменьшает размер.

Но я точно помню, что был у меня такой случай, когда LZW не уменьшал. Наверное, это просто был глюк той программы, которая сжимала в LZW.

monday2000:
gscan2pdf - какая-то программа под Linux для сканирования в Pdf/DjVu.

http://yandex.ru/yandsearch?text=gscan2pdf

Навигация

[0] Главная страница сообщений

[#] Следующая страница

Перейти к полной версии