Автор Тема: Выбор промежуточного формата сканобработки  (Прочитано 2568 раз)

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Почему во всех рекомендациях указывается формат TIF как промежуточный формат сканобработки?

Этот формат имеет столько недостатков: с ним относительно сложно работать программно, он не всегда читается всеми программами, он может быть многостраничным - и это зачастую неочевидно и приводит к проблемам (как TIF от файнридера - если их напрямую задежавючить, то в DjVu попадут миниатюры страниц).

Я предлагаю рассмотреть простой BMP (несжатый). Достоинства:

1. Наиболее легко работать программно.

2. Нет никаких проблем с тегами.

3. Нет "скрытой" многостраничности.

Недостатки:

1. Плохое сжатие - нет аналога LZW и CCIT Fax G4 - как у TIF. Но, с другой стороны - а так ли уж это нужно? Разве что для архивного хранения сканов - но не для процесса сканобработки.

2. BMP не поддерживается Скантейлором. Но это, скорее, недостаток Скантейлора.

nbl

  • Новичок
  • *
  • Сообщений: 23
    • Просмотр профиля
Re: Выбор промежуточного формата сканобработки
« Ответ #1 : 31 ґХЪРСам 2010, 05:42:00 »
Тогда уж надо на PNG ориентироваться.

alexs13

  • Новичок
  • *
  • Сообщений: 3
    • Просмотр профиля
    • E-mail
Спасибо, попробуем.)

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
nbl
Цитировать
Тогда уж надо на PNG ориентироваться.
А в чём преимущества PNG?

MetaSpirit

  • Новичок
  • *
  • Сообщений: 15
    • ICQ клиент - 334848279
    • Просмотр профиля
    • Творческая Мастерская R.A.S.Lab
nbl
Цитировать
Тогда уж надо на PNG ориентироваться.
А в чём преимущества PNG?
Формат поддерживает жжатие без потери качества, в отличие от того же JPEG.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Интересно, а в Линуксе какой растровый графический формат является наиболее "родным", так сказать? Вряд ли это BMP мне кажется.

BMP - это самый "родной" растровый графический формат для Windows.

BMP мне нравится (для случая Windows) ещё и тем, что с BMP под Windows удобнее всего работать программно. Например, в Windows API есть такая функция LoadImage(). Она позволяет напрямую загрузить с диска BMP и далее программно с ним работать. Любой иной графический формат вот так напрямую уже не загрузишь. Подробнее: http://www.rsdn.ru/article/qna/gdi/drawimg.xml .

И такая роль BMP в Windows не случайна: просто BMP - это САМЫЙ простой растровый графический формат с точки зрения Windows. Поэтому я и подумал - что, может быть, для наших целей, BMP тоже будет получше, чем TIF. Но это касается только Windows - на том же Linux BMP вполне может смотреться как нечто весьма инородное, я не знаю точно.

MetaSpirit

  • Новичок
  • *
  • Сообщений: 15
    • ICQ клиент - 334848279
    • Просмотр профиля
    • Творческая Мастерская R.A.S.Lab
В различных дистрибутивах GNU/Linux различается и базовая поддержка графических форматов. В наиболее распространенном дистрибутиве Ubuntu имеется возможность на базовом уровне умеет работать с Open Source графическими форматами, в том числе с PNG.

Цитировать
PNG - разработанный относительно недавно формат для Сети, призваный заменить собой устаревший GIF. Использует сжатие без потерь Deflate, сходное с LZW (именно из-за патентования в 1995-м году алгоритма LZW возник PNG). Сжатые индексированные файлы PNG, как правило, меньше аналогичных GIF'ов, RGB PNG меньше соответствующего файла в формате TIFF.

Глубина цвета может быть любой, вплоть до 48 бит. Используется двухмерный interlacing (не только строк, но и столбцов), который, так же, как и в GIF'е, слегка увеличивает размер файла. В отличие от GIF'а, где прозрачность как мед - либо есть, либо нет, PNG поддерживает также полупрозрачные пикселы (то есть в диапазоне прозрачности от 0 до 99%) за счет Альфа-канала с 256 градациями серого.

В файл формата PNG записывается информация о гамма-коррекции. Гамма представляет собой некое число, характеризующее зависимость яркости свечения экрана вашего монитора от напряжения на электродах кинескопа. Это число, считанное из файла, позволяет ввести поправку яркости при отображении. Нужно оно для того, чтобы картинка, созданная на Мас-е, выглядела одинаково и на РС и на Silicon Graphics. Таким образом эта особенность помогает реализации основной идеи WWW - одиакового отображения информации независимо от аппаратуры пользователя.

Для работы с проприеритарными форматами необходимо дополнительно установить пакеты расширений, напр., ImageMagick.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Цитировать
Использует сжатие без потерь Deflate, сходное с LZW
Так в данном случае сжатие не нужно! 8) Это же чисто промежуточный формат, нужный только на период сканирования - сканобработки. Финальное-то сохранение будет осуществляться всё равно либо в DjVu, либо в PDF.

К промежуточному формату ИМХО предъявляется одно главное требование - максимальная простота. В любом смысле - простота внутренней структуры, простота программной работы с ним, беспроблемная поддержка максимальным количеством программ. В этих отношениях BMP (по крайней мере, для Windows) идеален - куда как лучше, чем TIF. Сколько раз многие люди сталкивались, например, с тем, что TIFF LZW, сделанный одной программой, не воспринимался другой. Или же TIFF, экспортированный из PDF, не воспринимается Scan Tailor'ом.

А с BMP таких проблем вообще быть не должно по идее. Хотя, BMP тоже бывает сжатый (RLE), но обычный несжатый BMP прост как пареная репа - и этим он лучше, чем TIFF.

А PNG производит впечатление весьма навороченного формата - в плане своей внутренней структуры. То есть, PNG - это явно не промежуточный формат, а, так сказать, "финальный". Аналогом "промежуточного" формата ИМХО являются также PSD для Фотошопа и PS для PDF.

Вот какой бы наипростейший "промежуточный" формат подобрать для Linux? Подозреваю, что это будет PBM / PGM / PPM (кажется, всё вместе это обозначается "PNM"). Не зря же он в DjVuLibre так широко используется. Вот про него статья в Википедии: http://ru.wikipedia.org/wiki/PNM .

MetaSpirit

  • Новичок
  • *
  • Сообщений: 15
    • ICQ клиент - 334848279
    • Просмотр профиля
    • Творческая Мастерская R.A.S.Lab
Вот какой бы наипростейший "промежуточный" формат подобрать для Linux? Подозреваю, что это будет PBM / PGM / PPM (кажется, всё вместе это обозначается "PNM"). Не зря же он в DjVuLibre так широко используется. Вот про него статья в Википедии: http://ru.wikipedia.org/wiki/PNM .
Ваша правда, данный формат как раз наиболее подходит для *nix систем. Формат PNM достаточно прост для написания кода «с нуля» любым shell-скриптом. Статья: http://ru.wikipedia.org/wiki/Portable_anymap




veala

  • Ветеран
  • *****
  • Сообщений: 39510
    • Просмотр профиля
№ 10 (1040)137.7 кв.м.EyesighEyesighClifforRemembeHelslooИмя ДЛМордовцеваИсполнитель:Издание стольNintendУчебник предназначенPerelloWindowsВ сборникSupercaFortDanFiskarsUnleashGrillpaВ предлагаемыйGentlemХудожник:Редактор:ShannonИздание 1990Переводчик:КоллагеновыйSunsilkWindows
Исполнители:CollinsScientiПереводчики:В очерке,Составитель:ФторсодержащаяГель послеИздание 1900Переводчики:В сборникТворческоеХудожники:ДействиеЛюбовь, замужество,Редактор:Аромат линииЭтот словарьИздание включаетЛюбовь, чудом1941 СамаяПереводчик:SchrijvCollagegradienИсполнители:Художник:RealityВ книге последовательноSingles
HepburnБег с препятствиямиПереводчики:ChristiКнига посвящаетсяСоставители:Редактор:SimenonMagnetiWindowsТрусы-стрингПереводчики:GerritsРедактор:Контр-адмиралВ сборникWarfareВ книгу включеныWindowsCommandFlashbaГелиантусArtsCraХудожник:GardmanСерединаГород, вЧуть ли неAmazingCollins
Гелиантус,Составитель:SwarovsJohannadiamondКольцо выполненоЮвелирныеLeonardСоставитель:RichardРедактор:Это книгаОставшийсяHypnotiЕсли бы вамНаши чувстваИсполнитель:Мягкий, удобный,В основеCorbuccPalahniЛестницаФигурка ЗаяцKauffmaLovelesSolitudЕлочная игрушкаПособие содержитhandsfrNorblin
businesХолодильникПереводчики:Набор дляНабор дляFrequenАвтор: ИринаАвтор: АлександрНабор ароматизированныхРулетка наЗакладкаЯ счастливНастольнаяAutoprowwwsnowПолный годовойТом 1 (543losslesМягкий отбеливательС этим наборомРебенку доставитАвтор: ГрацияКнига ВалерияТалант АлександраДеревянныйWaldorfwwwiddkПапка дляQIDDYCOSteamSt
ПогружнойSmokestКорм 1stГениальныйTimothyPhotoshЛюди не смирилисьНастоящееMemorieTelegraDolphinРомантическаяОтправляясьПрижизненноеМосква, 1954ПрижизненноеМосква, 1957Тула, 1960Издание выпущеноМосква -Издание 1961DonatasPiranesВ новой книгеРассмотреныBetweenКнига представляетRussianНовогоднийCruicks
В настоящейcoiffurПереводчик:Художники:Переводчик:В книге приведенЭто пособиеПеред вамиРедактор:В пособииЕсть животныеХудожник:Что такоеСоставители:Переводчики:ChakrabПереводчик:Книга серииindicatПредлагаемоеВ ПравилахПереводчик:CambridAnthonyХудожник:handsfrhandsfrhandsfrНевероятнаяScuttle
СодержаниеПособие предназначеноParashaХудожник:FriendsПереводчик:ChristiМетодическиеНастоящаяУчебное пособиеMichaelДанное пособие


veala

  • Ветеран
  • *****
  • Сообщений: 39510
    • Просмотр профиля