Автор Тема: Выбор промежуточного формата сканобработки  (Прочитано 2536 раз)

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Почему во всех рекомендациях указывается формат TIF как промежуточный формат сканобработки?

Этот формат имеет столько недостатков: с ним относительно сложно работать программно, он не всегда читается всеми программами, он может быть многостраничным - и это зачастую неочевидно и приводит к проблемам (как TIF от файнридера - если их напрямую задежавючить, то в DjVu попадут миниатюры страниц).

Я предлагаю рассмотреть простой BMP (несжатый). Достоинства:

1. Наиболее легко работать программно.

2. Нет никаких проблем с тегами.

3. Нет "скрытой" многостраничности.

Недостатки:

1. Плохое сжатие - нет аналога LZW и CCIT Fax G4 - как у TIF. Но, с другой стороны - а так ли уж это нужно? Разве что для архивного хранения сканов - но не для процесса сканобработки.

2. BMP не поддерживается Скантейлором. Но это, скорее, недостаток Скантейлора.

nbl

  • Новичок
  • *
  • Сообщений: 23
    • Просмотр профиля
Re: Выбор промежуточного формата сканобработки
« Ответ #1 : 31 ґХЪРСам 2010, 05:42:00 »
Тогда уж надо на PNG ориентироваться.

alexs13

  • Новичок
  • *
  • Сообщений: 3
    • Просмотр профиля
    • E-mail
Спасибо, попробуем.)

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
nbl
Цитировать
Тогда уж надо на PNG ориентироваться.
А в чём преимущества PNG?

MetaSpirit

  • Новичок
  • *
  • Сообщений: 15
    • ICQ клиент - 334848279
    • Просмотр профиля
    • Творческая Мастерская R.A.S.Lab
nbl
Цитировать
Тогда уж надо на PNG ориентироваться.
А в чём преимущества PNG?
Формат поддерживает жжатие без потери качества, в отличие от того же JPEG.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Интересно, а в Линуксе какой растровый графический формат является наиболее "родным", так сказать? Вряд ли это BMP мне кажется.

BMP - это самый "родной" растровый графический формат для Windows.

BMP мне нравится (для случая Windows) ещё и тем, что с BMP под Windows удобнее всего работать программно. Например, в Windows API есть такая функция LoadImage(). Она позволяет напрямую загрузить с диска BMP и далее программно с ним работать. Любой иной графический формат вот так напрямую уже не загрузишь. Подробнее: http://www.rsdn.ru/article/qna/gdi/drawimg.xml .

И такая роль BMP в Windows не случайна: просто BMP - это САМЫЙ простой растровый графический формат с точки зрения Windows. Поэтому я и подумал - что, может быть, для наших целей, BMP тоже будет получше, чем TIF. Но это касается только Windows - на том же Linux BMP вполне может смотреться как нечто весьма инородное, я не знаю точно.

MetaSpirit

  • Новичок
  • *
  • Сообщений: 15
    • ICQ клиент - 334848279
    • Просмотр профиля
    • Творческая Мастерская R.A.S.Lab
В различных дистрибутивах GNU/Linux различается и базовая поддержка графических форматов. В наиболее распространенном дистрибутиве Ubuntu имеется возможность на базовом уровне умеет работать с Open Source графическими форматами, в том числе с PNG.

Цитировать
PNG - разработанный относительно недавно формат для Сети, призваный заменить собой устаревший GIF. Использует сжатие без потерь Deflate, сходное с LZW (именно из-за патентования в 1995-м году алгоритма LZW возник PNG). Сжатые индексированные файлы PNG, как правило, меньше аналогичных GIF'ов, RGB PNG меньше соответствующего файла в формате TIFF.

Глубина цвета может быть любой, вплоть до 48 бит. Используется двухмерный interlacing (не только строк, но и столбцов), который, так же, как и в GIF'е, слегка увеличивает размер файла. В отличие от GIF'а, где прозрачность как мед - либо есть, либо нет, PNG поддерживает также полупрозрачные пикселы (то есть в диапазоне прозрачности от 0 до 99%) за счет Альфа-канала с 256 градациями серого.

В файл формата PNG записывается информация о гамма-коррекции. Гамма представляет собой некое число, характеризующее зависимость яркости свечения экрана вашего монитора от напряжения на электродах кинескопа. Это число, считанное из файла, позволяет ввести поправку яркости при отображении. Нужно оно для того, чтобы картинка, созданная на Мас-е, выглядела одинаково и на РС и на Silicon Graphics. Таким образом эта особенность помогает реализации основной идеи WWW - одиакового отображения информации независимо от аппаратуры пользователя.

Для работы с проприеритарными форматами необходимо дополнительно установить пакеты расширений, напр., ImageMagick.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Цитировать
Использует сжатие без потерь Deflate, сходное с LZW
Так в данном случае сжатие не нужно! 8) Это же чисто промежуточный формат, нужный только на период сканирования - сканобработки. Финальное-то сохранение будет осуществляться всё равно либо в DjVu, либо в PDF.

К промежуточному формату ИМХО предъявляется одно главное требование - максимальная простота. В любом смысле - простота внутренней структуры, простота программной работы с ним, беспроблемная поддержка максимальным количеством программ. В этих отношениях BMP (по крайней мере, для Windows) идеален - куда как лучше, чем TIF. Сколько раз многие люди сталкивались, например, с тем, что TIFF LZW, сделанный одной программой, не воспринимался другой. Или же TIFF, экспортированный из PDF, не воспринимается Scan Tailor'ом.

А с BMP таких проблем вообще быть не должно по идее. Хотя, BMP тоже бывает сжатый (RLE), но обычный несжатый BMP прост как пареная репа - и этим он лучше, чем TIFF.

А PNG производит впечатление весьма навороченного формата - в плане своей внутренней структуры. То есть, PNG - это явно не промежуточный формат, а, так сказать, "финальный". Аналогом "промежуточного" формата ИМХО являются также PSD для Фотошопа и PS для PDF.

Вот какой бы наипростейший "промежуточный" формат подобрать для Linux? Подозреваю, что это будет PBM / PGM / PPM (кажется, всё вместе это обозначается "PNM"). Не зря же он в DjVuLibre так широко используется. Вот про него статья в Википедии: http://ru.wikipedia.org/wiki/PNM .

MetaSpirit

  • Новичок
  • *
  • Сообщений: 15
    • ICQ клиент - 334848279
    • Просмотр профиля
    • Творческая Мастерская R.A.S.Lab
Вот какой бы наипростейший "промежуточный" формат подобрать для Linux? Подозреваю, что это будет PBM / PGM / PPM (кажется, всё вместе это обозначается "PNM"). Не зря же он в DjVuLibre так широко используется. Вот про него статья в Википедии: http://ru.wikipedia.org/wiki/PNM .
Ваша правда, данный формат как раз наиболее подходит для *nix систем. Формат PNM достаточно прост для написания кода «с нуля» любым shell-скриптом. Статья: http://ru.wikipedia.org/wiki/Portable_anymap