Просмотр сообщений

В этом разделе можно просмотреть все сообщения, сделанные этим пользователем.


Сообщения - kontiky

Страницы: 1 [2]
16
Цитировать
Предлагаю начать с чего-то конкретного - а именно, с создания простой программы по порезке разворотов. Согласны? А уже, сделав её, двинем дальше.
Согласен. Начну с ручной порезки, а там посмотрим.

17
Цитировать
kontiky
Цитировать
Какие, навскидку, сейчас есть готовые алгоритмы автоопределения линии разреза?
Я не знаю. Разве что внутри СТ. Спросите у Tulon - на форуме http://diybookscanner.org/forum/viewforum.php?f=8
Спасибо, спрошу. Тулон вообще контактен? А как на счет алгоритма в СК? Или он неотделим от общего процесса расстановки резаков?
Цитировать
Цитировать
И еще, мне было бы чертовки удобно разрабатывать все на Java. Это, как я понимаю, идет в разрез с вашей концепцией идеальной программы сканобработки.
Ну что делать - давайте пока хоть так.  :-\ А это не будет ли сильно глючить из-за Java? Сколько я видел таких Java-зависимых программ - часто они почему-то, в сущности, не работают - или сильно тормозят. А это будет кроссплатформенным? А как насчёт Qt?
Да. Программа будет кроссплатформенной без перекомпиляции. И глючить точно не будет ;) Посмотрите, для примера, на IntelliJ IDEA - программа полностью написана на Java.

Что касается скорости обработки (больших) изображений - нужно пробовать. Qt - это С++, на котором я не писал лет 10 уже. Если скорость обработки на Java окажеться неудовлетворительной, ну тогда придется думать о написании на С++. Кстати, почему в ваших программах (DjVu Small) вы не используете Qt?

Цитировать
Цитировать
Давайте обсудим.
В СТ, думаю, плох такой принцип, когда на всех стадиях реальная обработка не делается, а только отображается. А реально обработка происходит лишь в конце. Это Вы это называете "ПВО"?
Да. Кажется, это вы как-то ввели такой термин для подобной схемы работы. Кстати, она имеет то серьезное преимущество, что на любой стадии работы удобно сделать undo.

Цитировать
Точнее, плох не сам этот принцип - плохо, что он охватывает весь процесс - от и до. Нужно обязательно хотя бы делать "паузы посередине" - ради того же ластика. А так же для того, чтобы можно было промежуточные результаты кидать в сторонние программы - и там до-обрабатывать любым образом. Либо сделать это как вывод (и ввод) на произвольной стадии СТ (или возможность полного игнорирования тех или иных СТ-обработок).
Полностью с вами согласен. Мне потребовалось только разрезать странички - и... пришлось идти по схеме обработки в СТ до конца.

18
Цитировать
После разрезки разворотов дальнейшая последовательность сканобработки достаточно неплохо реализована в СТ (но эту тему мы ещё обсудим подробнее).
Давайте обсудим. Я вчера подробнее поигрался с СТ и несколько под впечатлением того, что вы называете ПВО.
Цитировать
Поэтому - нет ли у Вас интереса создать предлагаемаю мною простейшую программу по разрезке разворотов?
Можно попробовать. Задача не выглядит слишком уж большой.
Какие, навскидку, сейчас есть готовые алгоритмы автоопределения линии разреза?

И еще, мне было бы чертовки удобно разрабатывать все на Java. Это, как я понимаю, идет в разрез с вашей концепцией идеальной программы сканобработки.

19
Цитировать
Вы видели множество DjVu-файлов, сделанных в виде сдвоенных разворотов?
И не раз. Это просто беда  :'(

20
Цитировать
Я бы сделал операцию визуального составления задания на пакетную разрезку чисто ручной. Т.е. пользователь вручную пробегает по всем сканам и вручную на каждом развороте позиционирует резак (тем самым постранично формируя задание на пакетную разрезку). Так сейчас можно в СК делать.

И только опционально можно (при желании, но отнюдь не необходимо) сделать автоматическое распознавание линии будущего разреза (как в СТ).
Думаю, подход СТ более правильный - сначала автоматическое определение линии разреза - потом возможность ручной правки. Собственно и в СК сделано примерно так же - сначала Draft Krimsate - потом окончательный Process!

Цитировать
Делать чисто ручную разрезку - не особо напряжно. В СК это занимает от силы 5 минут. Ничего, юзер не переломится - чтобы потратить 5 минут на выставление резака разрезки (на всех разворотах).
Это сильно зависит от объема книги. Лучше что бы часть работы приняла на себя машина.

Цитировать
Зато ручной подход даёт неоценимое преимущество - он даёт железную гарантию, что всё будет порезано именно так, как надо. Никакая автоматика дать подобную гарантию не в силах (в общем случае).
С таким подходом полностью согласен.

21
Недавно перетряхивая свой жесткий диск, обнаружил свои старые наброски по программе-альтернативе Scan Kromsator

Запустил, повертел... потом скачал текущий Scan Kromsator, посмотрел, скачал Scan Tailor, тоже посмотрел и призадумался...

Какой процесс обработки сканов в Scan Kromsator? Обработка стоится по следующей схеме
  • загрузить изображения в программу (в виде отдельных страниц или разворотов - не важно)
  • запустить Draft Kromsate (происходит расстановка т.е. резаков, выделающих полезную информацию на одной странице или развороте)
  • пользователь просматривает результаты расстановки резаков, подправляет другие параметры обработки
  • запускт Process! (здесь программа разрезает развороты, делает поворот, чистку и пр.)
  • пользователь в отдельном окне может просмотреть результаты работы и если надо вернуться на пару шагов назад, подправить настройки и снова запустить Process! для всех изображений, или только для части. здесь же доступен графический редактор, для ручной доводки результатов работы программы
Чем мне не нравится Scan Kromsator? Непрозрачностью и запутанностью интерфейса, особенно в случае работы с разворотами (хотя свое дело он делает).

Как работает Scan Tailor (кстати, хорошее название)? Примерно так (сильно много не разбирался, возможны ошибки)
  • загрузить в программу изображения
  • выполнить разрезание разворотов (если нужно)
  • выполнить ручную правку параметров (если нужно)
  • выполнить другие виды обработки (если нужно)
Чем мне не понравилось в Scan Tailor? Довольно жесткая последовательность действий. Отсутствие полного контроля над изображениями в любой точке процесса (нет ручного редактирования).

Я хотел бы обсудить как должна выглядеть высокоуровневая схема работы (workflow) над сканами в идеальной программе скан-обработки.
Мне видется что-то типа того, как происходит работа в FineReader
  • создание нового пакета работы (batch)
  • загрузка в batch изображений (из файлов, со сканера etc.). в любой момент работы для любого скана доступен ручной графический редактор
  • выполнить функцию Analyze (анализ структуры сканов), с выделением прямоугольными областями (не резаками, боже упаси) текста, изображений и пр.
  • здесь можно просмотреть результаты анализа и подправить их
  • задание других параметров обработки
  • получение готових обработанных изображений
  • здесь можно еще раз пройтись по изображениям пакета, сравнить исходное изображени с полученным, что-то подправить в редакторе, задать другие параметры автоматичекской обработки и пересоздать выходной файл изображения (для отдельного скана или группы сканов в пакете)
В принципе, схема напоминает то, что уже есть в Кромсаторе. Проблема на мой взгляд в разрезании разворотов. Если помещать в пакет развороты без разрезки (как сделано в том же Кромсаторе), дальше сложно работать с таким сканом - сложно задавать параметры обработки отдельно для левой и правой страницы, сложно сравнивать с результатом. Если вынести собственно разрезание в отдельную операцию при загрузке изображений (как сделано в FineReader) - непонятно, как контролировать (и, возможно, подправлять) результаты определения разворота (а это может потребоваться до собственно разрезки), ну и нарушается вся стройная схема работы с пакетом - одна операция становиться какой-то особенной.

Словом, пока я не вижу идеальной схемы обработки сканов. Может быть, ее видите вы?

Страницы: 1 [2]