Автор Тема: Программа DjVu Small Mod  (Прочитано 71401 раз)

sergiokapone

  • Постоялец
  • ***
  • Сообщений: 103
    • Просмотр профиля
Re: Программа DjVu Small Mod
« Ответ #90 : 01 ДХТаРЫм 2014, 21:52:35 »
Вообще, я бы предпочёл найти специализированный алгоритм для сглаживания, а не заниматься извращениями с промежуточным форматом.

ClearScan, единственное что пришло в голову, но он, наверное, закрытый.

Xen Xheng

  • Новичок
  • *
  • Сообщений: 4
    • Просмотр профиля
Re: Программа DjVu Small Mod
« Ответ #91 : 19 јРав 2014, 02:35:26 »
Прочитал справку к DjVu Small Mod v0.6.6.
Возникло несколько вопросов по работе с программой:

1. Профиль Lowcolor encoding не дает выбор 600dpi.
Каков по задумке авторов алгоритм работы с обработанными малоцветными сканами (tif содержащий битовый текст и малоцветную графику)? Как малоцветные страницы встраиваются в черно-белую книгу? Чтобы она оказалась все-таки 600dpi, как и планировалось.

2. Соглашение об именах слоев меня несколько напрягает. Нельзя ли предусмотреть, что имена слоев одинаковы, но находятся, скажем, во вложенных папках, например
Слой текста  [<name>.<ext>       ]
Слой фона    [..\bg\<name>.<ext> ]
Цветомаска   [..\cm\<name>.<ext> ]

До сих пор, не зная о малоцветном кодировании, я пользовался DjVu Imager. Просто задавал ему каталог с цветным содержимым. Имена файлов абсолютно те же, что и для текстового слоя. Это удобно, если разделять вручную в фотошопе и сохранять послойно с теми же именами в разные каталоги.

3. Впрочем, если можно обойтись вообще без соглашений имен для малоцветного кодирования - это даже еще лучше. Все что мне нужно - это передний слой 600 dpi с поддержкой словаря. Фотослой я и в DjVu Imager подклею.

4. Небольшой баг. При перетаскивании djvu на программу (если перед этим кодировали) галочка (точечка) не перескакивает на текущий режим работы - "Декодировать DjVu", и наоборот (как это было в оригинальной DjVu Small).

И, да, программа действительно очень полезная.
Малоцветные djvu получаются по-настоящему компактными и качественными.

P.S. Согласен с monday2000
Цитировать
ИМХО путь исследования профилей DjVu - бесперспективен. Т.е. попытки заставить автоматическую сегментацию работать "как положено" мне представляются нереальными - для массового использования.
Лучше развивать направление DjVu Imager, а DjVu Small понизить исключительно до роли инструмента кодирования передних субсканов - и всё.
« Последнее редактирование: 19 јРав 2014, 03:19:51 от Xen Xheng »

textsharik

  • Постоялец
  • ***
  • Сообщений: 138
    • Просмотр профиля
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #92 : 19 јРав 2014, 13:53:13 »
1. Профиль Lowcolor encoding не дает выбор 600dpi.
Опции - таб "Трансформация" - DPI.

Каков по задумке авторов алгоритм работы с обработанными малоцветными сканами (tif содержащий битовый текст и малоцветную графику)? Как малоцветные страницы встраиваются в черно-белую книгу?
Как правило, чёрно-белые страницы можно рассматривать как частный случай малоцветных, и сжимать всё вместе.
В принципе, в программе есть опция автоматического слияния частей книги, сжатых разными алгоритмами ("Декодирование Djvu -> Djvu"). Но как раз с малоцветными сканами автоматическая сортировка страниц не работает из-за бага, до которого я никак не доберусь.

Нельзя ли предусмотреть, что имена слоев одинаковы, но находятся, скажем, во вложенных папках, например
Я давно планирую это сделать, но руки никак не доходят.

4. Небольшой баг. При перетаскивании djvu на программу (если перед этим кодировали) галочка (точечка) не перескакивает на текущий режим работы - "Декодировать DjVu", и наоборот
Спасибо, учту.

Xen Xheng

  • Новичок
  • *
  • Сообщений: 4
    • Просмотр профиля
Re: Программа DjVu Small Mod
« Ответ #93 : 19 јРав 2014, 23:44:30 »
Спасибо за пояснения.

yuree

  • Постоялец
  • ***
  • Сообщений: 172
    • Просмотр профиля
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #94 : 04 јРЩ 2014, 22:49:22 »
Уважаемый textsharik, я снова о том же, то есть о малоцвете.
Набросайте пожалуйста по свободе краткий инструкшн, с чего правильней начинать и чем заканчивать.
Панически боюсь вкладку "Сегментация")
Допустим, есть страница(-ы) где три-четыре цвета и ч/б - текст. Как лучше, с помощью вашей программы, закодировать данный скан(-ы)? Что надо сделать в первую очередь что бы добиться наилучших результатов а не тупо прогонять через одну из настроек, допустим - "рукопись"? Выбор 2D редактора оставляю за вами, главное алгоритм. ("Всё равно переведу на язык ФШ, мне так удобнее").

ПС. Можно, конечно, и через FSD v1.2 тифы прогнать, но программа довольно часто вредничает и я рассматриваю её как "последний шанс". ("Может просто не умею правильные тифы готовить?")

textsharik

  • Постоялец
  • ***
  • Сообщений: 138
    • Просмотр профиля
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #95 : 08 јРЩ 2014, 16:55:02 »
Набросайте пожалуйста по свободе краткий инструкшн, с чего правильней начинать и чем заканчивать.

Открыл для этого отдельную тему: Методы ручной сегментации

yuree

  • Постоялец
  • ***
  • Сообщений: 172
    • Просмотр профиля
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #96 : 09 јРЩ 2014, 23:11:54 »
textsharik

Спасибо за новую тему.
Пойду туда изучать.

eugene.v

  • Новичок
  • *
  • Сообщений: 15
    • Просмотр профиля
Re: Программа DjVu Small Mod
« Ответ #97 : 03 ЅЮпСам 2014, 16:44:41 »
Здравствуйте. Планируется ли добавление в программу возможности работы с несколькими ядрами?

Версия Document Express Enterprise 7.5 от Caminova в режиме "watch folder" поддерживает использование нескольких ядер (что приводит к колоссальному уменьшению времени кодирования), но от ее использования останавливает ошибка, которая заключается в перемешивании страниц в готовом файле, несмотря на различные попытки задать имена файлов (т.е. 1, 2, 3 или 001, 002, 003 или p001, p002, p003 и т.п. ).

Может быть возможно взять от нее запчасти (нужные файлы) и внедрить в вашу программу?

textsharik

  • Постоялец
  • ***
  • Сообщений: 138
    • Просмотр профиля
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #98 : 06 ЅЮпСам 2014, 14:55:04 »
Здравствуйте. Планируется ли добавление в программу возможности работы с несколькими ядрами?

Интересная идея, надо подумать. Вот что я могу сказать с ходу:

1. Использование DDE 7.5 исключается, поскольку эта версия пакета в принципе ни на что не годна. И вряд ли последующие версии от той же фирмы будут лучше.

2. Распараллеливание вычислений технически можно реализовать двумя способами:
а) часть страниц сжимать в одном процессе, часть - в другом.
б) делать сегментацию в одном процессе, а сжатие каждого слоя - в другом.

Вариант (а) довольно просто реализовать, но он вряд ли кому-то нужен, т.к. при этом резко возрастёт нагрузка на жёсткий диск. Если Вы сжимаете большие файлы (24-бит, 600 dpi) - торможение жёсткого диска сведёт на нет выигрыш от более эффективной нагрузки процессора. Если же файлы маленькие - то они жмутся очень быстро даже на одном ядре, ускорять бессмысленно.

Вариант (б) даст ускорение как раз на больших файлах (и не принесёт никакой пользы при сжатии маленьких). Но он потребует намного более сложной реализации. Когда у меня будет на это время.......... :-\

eugene.v

  • Новичок
  • *
  • Сообщений: 15
    • Просмотр профиля
Re: Программа DjVu Small Mod
« Ответ #99 : 06 ЅЮпСам 2014, 17:02:20 »
Вариант (а) довольно просто реализовать, но он вряд ли кому-то нужен, т.к. при этом резко возрастёт нагрузка на жёсткий диск. Если Вы сжимаете большие файлы (24-бит, 600 dpi) - торможение жёсткого диска сведёт на нет выигрыш от более эффективной нагрузки процессора. Если же файлы маленькие - то они жмутся очень быстро даже на одном ядре, ускорять бессмысленно.

Учитывая засилие SSD-дисков (для которых чтение в несколько потоков даже предпочтительнее), это не должно быть проблемой. Также можно вести обработку на РАМ-дисках - размер 1-2 ГБ можно выделить под подобную задачу. То есть при желании в принципе это все решаемо. Да и с двумя потоками обычный винчестер должен справиться легко, как-то же с торрентами справляется.

Где можно почитать о профилях программы (Base, экстремальные и т.д.), в чем их различие? Справка, встроенная в программу, в Windows 8 не открывается.

Подскажите с высоты опыта, каким лучше пользоваться профилем для кодирования рукописного текста, сканированного в серых тонах в 200 dpi для получения наилучшего качества при минимальном размере? Необходимо ли для этой процедуры производить изменение размера до 600 dpi, как это рекомендуется для мелкого печатного текста во избежание "проблемы инь"?


textsharik

  • Постоялец
  • ***
  • Сообщений: 138
    • Просмотр профиля
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #100 : 07 ЅЮпСам 2014, 12:35:43 »
Да и с двумя потоками обычный винчестер должен справиться легко, как-то же с торрентами справляется.
Дело не в количестве потоков, а в суммарном объёме. Если процессор способен обработать X мегабайт в секунду, а диск нет - то процессор будет простаивать.

Также можно вести обработку на РАМ-дисках - размер 1-2 ГБ можно выделить под подобную задачу.
Если прибавить к этому время копирования с HDD на RAM-диск - то получится медленнее, а не быстрее.

Учитывая засилие SSD-дисков (для которых чтение в несколько потоков даже предпочтительнее), это не должно быть проблемой.
На современных SSD хранят только часто используемые файлы. Использовать их для хранения оргомных сканов пока ещё слишком дорого.
К тому времени, как SSD действительно начнут вытеснять HDD - я думаю, что успею сделать поддержку многоядерности.

Где можно почитать о профилях программы (Base, экстремальные и т.д.), в чем их различие? Справка, встроенная в программу, в Windows 8 не открывается.
Справка должна открываться. Если с этим есть проблема - надо её решить.
Проверьте, пожалуйста:
- последнюю ли версию Вы используете (0.6.6)?
- существует ли в инсталляционном каталоге файл ".\help\russian.chm", и запускается ли он, если открыть его вручную?
- какой язык файла помощи установлен в настройках программы?

Подскажите с высоты опыта, каким лучше пользоваться профилем для кодирования рукописного текста, сканированного в серых тонах в 200 dpi для получения наилучшего качества при минимальном размере?
200 dpi - маловато для djvu. Боюсь, что ни одни профиль, кроме "фото" не даст хорошего результата.
Попробуйте для начала "экстремальный" профиль "Только текст".

Необходимо ли для этой процедуры производить изменение размера до 600 dpi, как это рекомендуется для мелкого печатного текста во избежание "проблемы инь"?
Да, хотя, в данном случае, главная проблема не "инь", а нечёткость контуров из-за низкого разрешения.

eugene.v

  • Новичок
  • *
  • Сообщений: 15
    • Просмотр профиля
Re: Программа DjVu Small Mod
« Ответ #101 : 07 ЅЮпСам 2014, 17:37:44 »
Справка должна открываться. Если с этим есть проблема - надо её решить.
Проверьте, пожалуйста:
- последнюю ли версию Вы используете (0.6.6)?
- существует ли в инсталляционном каталоге файл ".\help\russian.chm", и запускается ли он, если открыть его вручную?
- какой язык файла помощи установлен в настройках программы?

0.6.6, существует, русский. Проблема оказалось распространенной (для Windows 7 и выше), решил распаковкой и открытием в браузере.

Также проблема решилась установкой официального исправления Windows8-RT-KB917607-x64.msu.

« Последнее редактирование: 08 ЅЮпСам 2014, 19:49:59 от eugene.v »

eugene.v

  • Новичок
  • *
  • Сообщений: 15
    • Просмотр профиля
Re: Программа DjVu Small Mod
« Ответ #102 : 29 ЅЮпСам 2014, 18:56:41 »
Выявил глюк: есть 25 файлов (TIFF серый несжатый) с именами ПП - 0001.tif, ПП - 000.tif, ..., ПП - 0025.tif. Запускаю процесс конвертирования (стандартные/рукопись/200, в опциях: DPI 200 принудительно, чистка фона - залить белым, формат цвета - сделать черным, предустановка качества - без потерь, страниц в словаре - 50, остальное по умолчанию), процесс идет, прогресс-бар доходит до конца и выдается сообщение: "Ошибка конвертирования: ни одна страница не была закодирована в DJVU". Если переименовать файлы 1.tif, 2.tif, ..., 25.tif, то все проходит успешно. Так же нет ошибки, если не задействовать опции вообще (поочередное отключение опций по одной также приводит к ошибке). Что можете подсказать?
« Последнее редактирование: 29 ЅЮпСам 2014, 19:53:15 от eugene.v »

textsharik

  • Постоялец
  • ***
  • Сообщений: 138
    • Просмотр профиля
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #103 : 30 ЅЮпСам 2014, 16:25:22 »
eugene.v, спасибо за сообщение. Баг исправил, в ближайшее время выпущу обновление.

textsharik

  • Постоялец
  • ***
  • Сообщений: 138
    • Просмотр профиля
    • E-mail
Re: Программа DjVu Small Mod
« Ответ #104 : 01 ґХЪРСам 2014, 19:17:49 »
DjVu Small Mod 0.6.7

Исправлены ошибки:
- Исправлена опция качества текста в ручных режимах "msep" и "vpd"
- Исправлены не-латинские шрифты на некоторых версиях Windows
- Исправлено декодирование страниц с отсутствующим слоем текста
- Исправлены опции пост-обработки для файловых имён с пробелами и не-латинскими символами

http://rusfolder.com/42419106
http://www.mediafire.com/download/loxvvrjx5xjchj4/DjVu_Small_Mod_v0.6.7.7z