Пробую применить ST Split v1.0 практически.
Уже наметились кое-какие замечания (самому к себе
).
- Очевидно, что Гауссово размытие практически бесполезно для серых иллюстраций компьютерных скриншотов. Особенно таких, где имеется текст, который должен быть различим. Выборочное гауссово размытие - слишком уж долго, я его на практике пока не применяю.
Нужно, конечно, не просто размытие - а какое-то интеллектуальное размытие. Если вообще нужно.
Кстати, эффект снижения размера результирующего DjVu после применения Гауссового размытия оказался
ниже , чем использование опций ДЗФ и "качество заднего фона" в самом DjVu Imager. В общем, пока что мне показалось бессмысленным делать размытие растра. Или просто сканы такие попались? На настоящих иллюстрациях, без текста, гауссово размытие можно будет делать посильней - тогда, быть может, и смысл в нём появится.
- Выяснилось, что программе следует уметь принимать на входе не только в чистом виде "Смешанный" СТ-вывод - а смесь "смешанных" и "чёрно-белых" СТ-выведенных сканов. Дело в том, что СТ иногда некорректно авто-определяет зоны - поэтому проще сразу переключить порой такой скан в СТ из "Смешанного" режима в "Чёрно-белый" - и так и вывести.
В общем, входящие чёрно-белые сканы ST Split будет сразу отправлять в папку передних субсканов.
- Для тех входящих "смешанных" СТ-сканов, у которых нет иллюстрации, ST Split создаёт чисто белый задний субскан. Это излишне - я хочу сделать так, чтобы он не создавался.
- И, самое главное на сегодняшний момент: а так ли уж нужна "возможность №2" в ST Split - а именно, генерация передних субсканов в исходном режиме цветности (серое или цветное)? Меня, конечно, мучает этот вопрос.
Я попробовал сделать реальную книгу с ST Split. И подготовил реальный пример одного скана с использованием "возможности № 2":
http://ifolder.ru/17618894 (12,04 МБ)
Там внутри один серый скан - выведеный из СТ в режиме "Цветной/Серый". (Вообще-то он без иллюстраций сам по себе - но мог бы их и иметь - так что это не меняет суть дела.)
Плюс, там внутри ещё 2 DjVu-файла: один - полученный традиционным путём в СТ, а второй - прошедший выравнивание освещённости в Book Restorer 4.2.1, и затем бинаризованный в СТ (на максимально-"Жирнее" пороге бинаризации стадии "Вывод"). (ещё этот скан прошёл выпрямление искривленных строк в BR, но это не важно в данном контексте).
Для тех, кому не хочется качать 12 МБ, я приготовил этот же пример - только без исходного TIF'а - а только с 2-мя DjVu-файлами - "хорошим" и "плохим" (которые были получены из этого TIF'а):
http://ifolder.ru/17619660 (44 КБ)
Так вот, этот пример ИМХО чётко показывает: возможность № 2 в ST Split имеет смысл. Качество заметно лучше. Левая кромка текста:
оказалась "пересвеченной" после СТ - это хорошо видно на DjVu-файле из моего примера. А та же кромка после выравнивания освещённости в Book Restorer 4.2.1 (и последующей бинаризации) - выглядит не хуже основной области текста (это тоже видно на другом DjVu-файле из моего примера - так что сравните сами, и наглядно убедитесь).
Конечно, то качество, с которым СТ (в чистом виде - т.е. без BR-выравнивания освещённости) сделал эту страницу, можно назвать удовлетворительным. Но - всегда хотелось бы лучшего, и мой пример показывает: лучшее - возможно. Просто СТ сейчас лишает пользователя возможности
получить качество - а я, при помощи своего ST Split, возвращаю пользователям возможность получить настоящее качество.
Конечно, практическое использование "возможности-2" - дело очень муторное. Многие не захотят возиться. К тому же, тут обнаружились некоторые серьёзные подводные камни. Оказалось, что результат выравнивания освещённости в Book Restorer 4.2.1 необходимо проверять вручную (на каждом скане) (прямо внутри самого BR) - т.к. некоторые сканы получаются настолько малоконтрастными, что при последующей бинаризации из них "не вытянешь" текст. В Book Restorer 4.2.1 есть ползунок Sensivity of the processing при выравнивании освещённости:
Если после выравнивания освещённости в BR контраст получился чересчур низким - то нужно отменить выравнивание освещённости для данного "плохого" скана, затем сдвинуть этот ползунок максимально вправо - и повторить выравнивание освещённости.
Также оказалось, что для сканов, прошедших выравнивание освещённости в Book Restorer 4.2.1, порог бинаризации в СТ оказался в некоторых случаях недостаточным - хотелось бы ещё бОльшие значения "Жирнее". Так что, попробую ещё и бинаризировывать в Book Restorer 4.2.1 (сканы, прошедшие там выравнивание освещённости).
Надеюсь, мой пример достаточно наглядно показывает, что "возможность №2" в ST Split имеет право на жизнь.
А также, мой пример наглядно демонстрирует убожество СТ, который не даёт пользователю (специально?) получить желаемое КАЧЕСТВО обработки сканов - потому что в СТ отсутствует опция генерации передних субсканов в исходном режиме цветности (серое или цветное). Дескать, это пользователю "не надо", "и так хватит".