Автор Тема: Программа DjVu Small Mod  (Прочитано 70870 раз)

textsharik

  • Постоялец
  • ***
  • Сообщений: 138
    • Просмотр профиля
    • E-mail
Программа DjVu Small Mod
« : 20 ґХЪРСам 2011, 11:03:14 »
Неофициальное обновление DjVu Small

Основные изменения:
- Доступ к скрытым и недокументированным настройкам
- Поддержка формата псевдо-DjVu
- Перекрёстное слияние DjVu-файлов
- Опции упорядочены и документированы (только на русском языке)

Ссылки:
- DjVu Small v0.5 (2,5 Мб):
http://www.megaupload.com/?d=6L2HG1ZL
http://ifolder.ru/27694791

- Добавления (версия для windows-9x и устаревший хелп-файл на английском) (6,5 Мб):
http://www.megaupload.com/?d=ON63AOTQ
http://ifolder.ru/27694792

- Исходники (C++) (0,5 Мб):
http://www.megaupload.com/?d=8CPQ1NA4
http://ifolder.ru/27694793

О багах сообщайте на textsharik НА ya ТЧК ru

Тема выделена из обсуждения http://www.djvu-scan.ru/forum/index.php?topic=42.0 .
« Последнее редактирование: 26 °ЯаХЫм 2012, 14:44:20 от monday2000 »

sergiokapone

  • Постоялец
  • ***
  • Сообщений: 103
    • Просмотр профиля
Re: Программа DjVu Small Mod
« Ответ #1 : 20 ґХЪРСам 2011, 17:42:19 »
Неофициальное обновление DjVu Small

Спасибо. По словом "Неофициальное" Вы имеете ввиду, что это Ваше обновление?
Справку еще детально не смотрел, поэтому вопрос: "А что такое псевдо-djvu?"
« Последнее редактирование: 20 ґХЪРСам 2011, 17:47:26 от sergiokapone »

textsharik

  • Постоялец
  • ***
  • Сообщений: 138
    • Просмотр профиля
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #2 : 20 ґХЪРСам 2011, 18:02:29 »
Спасибо. По словом "Неофициальное" Вы имеете ввиду, что это Ваше обновление?
Да.

Справку еще детально не смотрел, поэтому вопрос: "А что такое псевдо-djvu?"
Jpeg или Tiff файлы, упакованные в djvu без перекодирования.
Нужно для сканов низкого разрешения с которыми кодер djvu не справляется.
Пример: растровые pdf и факсы.

sergiokapone

  • Постоялец
  • ***
  • Сообщений: 103
    • Просмотр профиля
Re: Программа DjVu Small Mod
« Ответ #3 : 20 ґХЪРСам 2011, 18:30:01 »
Сейчас читаю справку (спасибо за нее отдельно) и кручу ручки настроек, чтобы правильно закодировать малоцветный скан. С пом. FSD сегментация прекрасно получается с настройками по-умолчанию. С пом. documenttodjvu дело гораздо сложнее, пока не могу получить результат как c пом. FSD.
Вот, что получилось с пом. FSD

Такое получается с пом. DjvuSmall (набор:стандартный, тип: стандарный, опции->текст->(качество цвета:75, прореживание цвета:1))

Такое получается с пом. DjvuSmall (набор:экстремальные, тип: цветной текст, опции->сегментация->пестрый текст, опции->текст->(качество цвета:75, прореживание цвета:1))

Во втором случае результат сегментации лучше, но есть цветовые артефакты.
Что порекомендуете?

textsharik

  • Постоялец
  • ***
  • Сообщений: 138
    • Просмотр профиля
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #4 : 20 ґХЪРСам 2011, 18:55:28 »
В данном случае следует использовать FSD или её аналоги. DocumentToDjvu плох для малоцветных сканов с пересекающимися цветами. Он прилично работает либо с цветным текстом (когда цвета не пересекаются), либо с полноцветными сканами, когда артефакты не жалко отправить в фон.

Наверное, имеет смысл сделать интеграцию DjVu Small с FSD, но пока этого нет.

sergiokapone

  • Постоялец
  • ***
  • Сообщений: 103
    • Просмотр профиля
Re: Программа DjVu Small Mod
« Ответ #5 : 20 ґХЪРСам 2011, 18:58:50 »
Наверное, имеет смысл сделать интеграцию DjVu Small с FSD

Я тоже думаю, что имеет смысл.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #6 : 21 ґХЪРСам 2011, 09:18:05 »
textsharik
Цитировать
Неофициальное обновление DjVu Small
Вы бы как-нибудь изменили бы название - а то будет же путаница с моими релизами. Допустим, добавили бы в название что-нибудь.

Цитировать
- Поддержка формата псевдо-DjVu
А я в своё время, наоборот, убрал эту опцию. :) Потому что ИМХО цена её присутствия слишком велика - наличие в программе утилиты photottodjvu.exe. Это означает излишнее раздутие размера дистрибутива, притом что опцией -jpeg на деле никто реально не пользуется. А если 1-2 человека и пользуются - то для них можно сделать отдельную специальную утилиту.
Цитировать
- Перекрёстное слияние DjVu-файлов
Этой опции также с моей точки зрения не место в программе. Для этого, я думаю, лучше сделать отдельный визуальный мета-редактор DjVu.
Цитировать
- Added integration with layer-remove tool [has some problems]
То же самое. Тем более, что ещё и с проблемами. Убирать слои - с этим прекрасно справляется djvumake - причём без малейших проблем.
Цитировать
- Removed console buffering from djvudecode
Не слишком обязательно. Ради чего? Ради генерации многостраничного TIF? А Вы знаете ли, что даже с отсутствием консольного буферирования правильное отражение постраничного прогресса всё равно нестабильно и иногда работает некорректно? Куда уж надёжней вызывать djvudecode для каждой DjVu-страницы - это всегда даёт железную точность постраничного прогресса.

Понимаете, я специально постарался в своё время упростить DjVu Small по максимуму - сведя всю работу с ней до принципа "нажал кнопку - получишь результат". А Вы же, такое впечатление, начали утяжелять интерфейс, наращивая его новыми фичами. Это есть порочный путь СканКроматора - "печка, мясорубка и стиральная машина в одном флаконе".

Единственное, что может быть ИМХО разумным - это добавление пакетного режима. Кстати, а почему она не работает в Win9x? Даже любопытно стало (хотя, понятно, Win9x уже неактуален).

По поводу профилей: как я понял, Вы добавили многие возможности по управлению профилями. Вроде бы хорошо - но опять-таки, подавляющее большинство пользователей профили не меняют и никак не модифицируют. Вспомним, что даже в DEE 5.1 управление профилями было выделено в отдельную программу (!) - и это правильно ИМХО.

Опция "Страниц в словаре" - 99999 по умолчанию. Многие считают (в том числе и LizardTech), что это неправильно - лучше 10. Большой словарь тормозит просмотр DjVu-файла.
Цитировать
- Доступ к скрытым и недокументированным настройкам
Было бы интересно узнать подробности.
Цитировать
- Fixed bug in documenttodjvu preventing "decibels" option to work in european locales
Это тоже интересно. Подробнее можно?
Цитировать
- Added unicode support
И это интересно. В какой мере добавлена поддержка?

По поводу профилей:

Я уже как-то думал на эту тему. Знаете - мне представляется более реальным полная предварительная ручная сегментация. Как ни фантастично это пока звучит. Во-первых, это откроет дорогу к использованию свободно-бесплатных DjVu-кодировщиков (где нет автосегментации), во-вторых - человек изначально будет точно знать, что он кодирует и как - а не будет работать сложно-хитроумным методом тыка, как сейчас выглядит всё это жонглирование профилями.

То есть, надо перенести сегментацию на этап сканобработки - с этапа DjVu-кодирования. Заодно поклонники формата PDF возрадуются - они-то тоже смогут собрать послойный PDF. К тому же возможности предварительной ручной сегментации на порядок богаче, чем подстройка автоматической (путём подбора профилей). Предварительную ручную сегментацию мы можем делать в тысяче разных программ любым способом какой нашей душе угоден.

Метод разделения сканов (DjVu Imager) - это лишь "первая ласточка" на пути развития предварительной ручной сегментации. ИМХО именно этим путём надо идти и его развивать - а не пытаться постичь заумные таинства DjVu-профилей кодирования - задача, заранее обречённая на провал с точки зрения массовости её применения. Проще говоря, не будут сотни домохозяек подбирать профили DjVu-кодирования - хоть тресни, но не будут.
« Последнее редактирование: 21 ґХЪРСам 2011, 10:21:18 от monday2000 »

textsharik

  • Постоялец
  • ***
  • Сообщений: 138
    • Просмотр профиля
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #7 : 21 ґХЪРСам 2011, 16:07:01 »

Вы бы как-нибудь изменили бы название - а то будет же путаница с моими релизами. Допустим, добавили бы в название что-нибудь.
Ок. Пусть будет DjVu Small Mod.

Собственно программа:
http://www.megaupload.com/?d=MPTG1RZC
http://ifolder.ru/27725947

Добавления (windows-9x и английский хелп):
http://www.megaupload.com/?d=ZFNYH4UZ
http://ifolder.ru/27725945

Исходники:
http://www.megaupload.com/?d=EBYO7IU8
http://ifolder.ru/27725946

Цитировать
Вы же, такое впечатление, начали утяжелять интерфейс, наращивая его новыми фичами. Это есть порочный путь СканКроматора - "печка, мясорубка и стиральная машина в одном флаконе".
Нет, это не так. Идея была в том, чтобы сделать нововведения практически невидимыми.
Так, например, включение Псевдо-djvu "спрятано" в обычный профиль.
А с учётом того, что профили отсортированы по группам, интерфейс стал даже проще (ИМХО).

Цитировать
ИМХО цена её присутствия слишком велика - наличие в программе утилиты photottodjvu.exe. Это означает излишнее раздутие размера дистрибутива, притом что опцией -jpeg на деле никто реально не пользуется. А если 1-2 человека и пользуются - то для них можно сделать отдельную специальную утилиту.
1) ИМХО, с нынешними скоростями интернета и объёмами hdd, лишний мегабайт не имеет значения.
2) Наличие кучи однотипных утилит - это не меньшие заморочки для пользователя, чем лишняя опция.
Когда есть выбор между одной строчкой в комбо-боксе и новой утилитой, ИМХО первое лучше.

Цитировать
А Вы знаете ли, что даже с отсутствием консольного буферирования правильное отражение постраничного прогресса всё равно нестабильно и иногда работает некорректно?
Знаю, исправлено.
1) Буфер консоли не был цикличным, из-за чего ключевое слово могло быть порезано пополам.
2) Последняя порция консольного вывода не считывалась, и не всегда была пустой.

Цитировать
Кстати, а почему она не работает в Win9x? Даже любопытно стало (хотя, понятно, Win9x уже неактуален).
Видимо какой-то API работает по-другому. Сам точно не знаю. Просто нет времени разбираться.

Цитировать
Большой словарь тормозит просмотр DjVu-файла.
Никогда не замечал. Насколько я знаю, словарь тормозит только сжатие. На скорость просмотра он практически не влияет.

Цитировать
- Доступ к скрытым и недокументированным настройкам

трансформация:
crop, resize (для кодирования)
tobitonal=auto

сегментер:
high-variation-foreground - убирает артефакт на тесно расположенных разноцветных буквах
blurring-size, edge-size, render-size - влияют на мелкие детали
inhibit-foreback-level, block-size, block-overlap - не до конца разобрался

фон:
target-subsample - скрытый делитель параметра quality

текст:
matching-level, tolerance-percent - позволяют раздельно решать "проблему инь" и удаление точек
tolerance4-size - не до конца разобрался

практически бесполезные:
descreen
thickening

Цитировать
- Fixed bug in documenttodjvu preventing "decibels" option to work in european locales
Параметр - числа с плавающей запятой, разделённые запятыми. Если десятичный символ - точка, всё работало; если запятая - нет. Я заменил разделитель на точку с запятой.

Цитировать
Цитировать
- Added unicode support
И это интересно. В какой мере добавлена поддержка?
Через короткие имена файлов. Что работает почти всегда, за исключением экзотических случаев (пользователь загрузился в windows-95, дал файлу неанглийское имя, перегрузился в XP и решил сжать этот файл в DjVu.)

Цитировать
По поводу профилей: как я понял, Вы добавили многие возможности по управлению профилями. Вроде бы хорошо - но опять-таки, подавляющее большинство пользователей профили не меняют и никак не модифицируют.
Нет, наоборот. Я старался освободить рядового пользователя от кнопки "Опции".
В сложных случаях он скачает conf-файл с форума и сунет его в папку "personal profiles".

Цитировать
Знаете - мне представляется более реальным полная предварительная ручная сегментация.
Это безусловно перспективно. Но по алгоритму предварительная сегментация ничем не отличается от обычной. Следовательно, она будет иметь на 100% те же проблемы, и потребуются те же профили с настройками.
Поэтому начинать придётся с изучения (огромного!) опыта AT&T/Lizardtech/Caminova. Или даже с пиратского использования documenttodjvu в качестве предварительного сегментера.

don555

  • Пользователь
  • **
  • Сообщений: 71
    • Просмотр профиля
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #8 : 22 ґХЪРСам 2011, 12:21:31 »
Простите, пожалуйста, за невежество. А где применять этот мод? Я не понял.
Программой DjVu Small, я пользуюсь постоянно.
У меня есть пару сканов jpg с маленьким разрешением.500х700.
При увеличении, текст не разобрать. Думал, что при помощи этого мода, можно что-то сделать. Поэкспериментировал и отложил.

textsharik

  • Постоялец
  • ***
  • Сообщений: 138
    • Просмотр профиля
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #9 : 22 ґХЪРСам 2011, 15:23:09 »
У меня есть пару сканов jpg с маленьким разрешением.500х700.
При увеличении, текст не разобрать. Думал, что при помощи этого мода, можно что-то сделать.
Профиль "Jpeg" из группы "Псевдо-Djvu".

(Имейте в виду, что это только упаковка без пережатия. Качество будет 1:1 такое же как у оригинала, лучше не станет.)

don555

  • Пользователь
  • **
  • Сообщений: 71
    • Просмотр профиля
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #10 : 23 ґХЪРСам 2011, 12:38:10 »
Спасибо

DikBSD

  • Новичок
  • *
  • Сообщений: 9
    • Просмотр профиля
Re: Программа DjVu Small Mod
« Ответ #11 : 28 ґХЪРСам 2011, 15:56:42 »
textsharik:
Подскажите, как создать свой файл настроек в папке profiles\personal
У меня есть данные, взятые у Arcand'а с форума Ру-боард для кодирования сканов 600dpi:

#@displayName:Arcand ColorAndGrey (-600 dpi Scanned)
ArcandScanned600dpi: scan600
description=lossless
pages-per-dict=1000
bg-subsample=3
pix-filter-level=0
resolution-multiplier=1
shape-filter-level=100
threshold-level=100
aggressive=true
dpi=-600


Как мне на основании этих данных создать профильный файл "ArcandColorAndGrey(-600dpiScanned).conf"? Просто поместить эти данные в вышеуказанный файл?

И еще - у меня в DEE конфиге было добавлено такое:
#@displayName:Arcand ColorAndGrey (-600 dpi Scanned)
ArcandScanned600dpi: scan600
description=lossless
pages-per-dict=1000
bg-subsample=3
pix-filter-level=0
resolution-multiplier=1
shape-filter-level=100
threshold-level=100
aggressive=true
dpi=-600

#@displayName:Arcand ColorAndGrey (600 dpi Scanned)
ArcandScanned_600dpi: ArcandScanned600dpi
description="600 dpi to all scan"
dpi=600

#@displayName:Arcand ColorLineArt (600 dpi Scanned)
ArcandScan600cla: scan600
pages-per-dict=1000
pix-filter-level=0
jb2-format=color
resolution-multiplier=1
shape-filter-level=0
threshold-level=25
aggressive=true

#@displayName:Arcand BlackAndWhite (600 dpi Bitonal)
ArcandBitonal600: bitonal600
pages-per-dict=1000


Нужно ли делать 4 отдельных конфига для Djvu Small Mod, или же можно все это разместить в одном? Если можно, то у меня не получилось отобразить значение dpi в комбобоке прогораммы...
Одним словом - подскажите, на этих реальных примерах, КАК создавать пользовательские конфиги.
Спасибо.

textsharik

  • Постоялец
  • ***
  • Сообщений: 138
    • Просмотр профиля
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #12 : 28 ґХЪРСам 2011, 17:58:01 »
Как мне на основании этих данных создать профильный файл "ArcandColorAndGrey(-600dpiScanned).conf"? Просто поместить эти данные в вышеуказанный файл?
Нет. В персональных профилях не поддерживается наследование (из-за сложности отследить наследование при удалении/переименовании.)
Поэтому персональные conf-файлы должны создаваться только через кнопку "Сохранить".

В Вашем случае лучше добавить профили в файл profiles\documenttodjvu.conf.
Можно при этом создать новую группу:

#@group:Arcand

#@displayName:ColorAndGrey Scanned (-600 dpi)
ArcandScanned600dpi: scan600
description=lossless
pages-per-dict=1000
bg-subsample=3
pix-filter-level=0
resolution-multiplier=1
shape-filter-level=100
threshold-level=100
aggressive=true
dpi=-600

#@displayName:ColorAndGrey Scanned (+600 dpi)
ArcandScanned_600dpi: ArcandScanned600dpi
description="600 dpi to all scan"
dpi=600

#@displayName:ColorLineArt Scanned (600 dpi)
ArcandScan600cla: scan600
pages-per-dict=1000
pix-filter-level=0
jb2-format=color
resolution-multiplier=1
shape-filter-level=0
threshold-level=25
aggressive=true

#@displayName:BlackAndWhite (600 dpi)
ArcandBitonal600: bitonal600
pages-per-dict=1000

Появится группа с названием Arcand,

в которой будет три типа:
ColorAndGrey Scanned
ColorLineArt Scanned
BlackAndWhite


Причём тип "ColorAndGrey Scanned" будет содержать профили для двух dpi:
+600 и
-600

SorokaSV

  • Пользователь
  • **
  • Сообщений: 56
    • Просмотр профиля
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #13 : 28 ґХЪРСам 2011, 21:07:51 »
Попытка применить новый Djvu Small 0.5 привела к сообщению: ошибка, ни одна страница не закодирована. "Обычная" версии 4.4 прекрасно всё закодировала.

DikBSD

  • Новичок
  • *
  • Сообщений: 9
    • Просмотр профиля
Re: Программа DjVu Small Mod
« Ответ #14 : 29 ґХЪРСам 2011, 08:07:51 »
textsharik:
Спасибо!
Не могли бы вы дополнить свою Справку несколькими примерами по созданию Пользовательских профилей разных видов? Это было бы в помощь многим пользователям...