57an1. Не все пользуются МРС djvu-кодерами. Есть люди, которые собирают pdf после ST (например библиотеки, которые недолюбливают djvu).
Между прочим, для таких людей несложно предусмотреть и обратное слияние разделённых сканов (если будет нужно). А вообще разделять сканы - это удобно, поскольку потом можно раздельно обрабатывать тексты и картинки - которые разнородны по своей природе и их сложно обрабатывать в рамках неразделённого скана. В общем, время покажет, как конкретно поступать.
3. Я думаю, достаточно одинакового ресемплинга для всех файлов.
А, ну такое мне будет совершенно несложно сделать. Не обещаю именно в следующей версии, но в принципе могу сделать.
Для остальной массы книг блур, имхо, вполне заменим ДЗФ-ом.
Да, у меня кошки скребут, конечно, по поводу идеи выкидывания Blur, но, скрепя сердце, всё же пойду на это - так будет ИМХО разумнее.
Предположим, в разрезанном файле нашлась ошибка (например, неправильно сработала линия разреза). Как в такой ситуации быстро найти страницу, в которой нужно поправить резак?
Я предполагаю, что после разрезки пользователь должен проделать визуальный контроль всех разрезанных сканов - с целью убедиться в правильности разрезки (плюс комплектность всех страниц - "а не забыл ли я какую-нибудь страницу отсканировать"). К сожалению, как-либо по другому, думаю, нельзя. То есть, если пользователь потом заметит ошибку разрезания - пусть пеняет на себя и делает всё заново.
Казалось бы, вариант СТ лучше - раз он позволяет вернуться с самого конца в состояние "до разрезки" и переиграть всё заново. Но на деле это оборачивается неимоверным усложнением всего и вся.
Так что мой вариант ("разрезал и забыл" - т.е. забыл о неразрезанных исходных сканах) мне представляется в целом проще. Потому что радикально упрощается жизнь после разрезки - как для разработчика сканобрабатывающей программы, так и для пользователей.
И мне кажется, что визуально проконтролировать правильность разрезки - ну совсем уж просто, даже для школьника. Тем более, если сделать простую пакетную разрезкалку (надеюсь на
kontiky) и написать к ней простую и понятную инструкцию, где указать в картинках все критерии правильной разрезки - то особых проблем не ожидается. Нет, ну конечно всегда найдутся неадекватные люди, которым и это будет непонятно - но их будут единицы.
Я что-то потихоньку начинаю склоняться к технологии ST 600dpi -> PDF ClearScan.
Те люди, кто сканируют в PDF, и не признают DjVu, не советуют использовать ClearScan. Говорят, что он пропускает целые абзацы.
Это я так намекаю еще разок подумать насчет одношагового post-ST djvu-кодера.
Наверное, в будущем мы всё-таки прийдём к такому одношаговому DjVu-кодировщику для разделённых сканов. Но пока что его сложно было бы сделать - это проблема на стыке ST и DjVu. Здесь многое зависит именно от ST - а Tulon вот не хочет и упрямится. От этого всё теряет смысл.