1
DjVu / Полу-автоматическая сегментация
« : 13 Августа 2015, 14:59:26 »
Рекламирую новую фичу, добавленную в Djvu Small Mod v0.7.0.
Полуавтоматическая сегментация - это новый метод обработки сканов, совмещающий преимущества автоматической и ручной сегментации. Он позволяет достичь точности сегментации, сравнимой с ручной работой. Но при намного меньших трудозатратах. Суть метода заключается в том, чтобы разрешить автоматическую сегментацию только в определённых зонах изображения, и защитить от авто-сегментера другие зоны. Помимо этого, программа может выполнять другие операции в зонах, указанных пользователем. Например, удалять кляксы.
В общих чертах, это работает следующим образом. Рассмотрим один из наиболее сложных для сегментации случаев - случай, когда текст расположен прямо на иллюстрации.
Обычно такие изображения очень трудно сжать качественно. Отделить текст от фона обычными программами вроде ScanKromsator и ScanTailor - невозможно. Иногда можно подобрать настройки сегментера, чтобы разделить слои без особо заметных артефактов. Но чаще приходится разделять слои вручную (на что уходит много времени и труда). Либо идти на компромиссы по качеству или по размеру выходного файла.
А вот как эту задачу можно решить с помощью полуавтоматической сегментации. Первым делом, откроем изображение в программе DjVu Small Mod и нажмём кнопку автоматической расстановки зон. Эта операция займёт пару секунд, после чего появится следующее окно: (Цвета приглушаются, чтобы зоны были лучше видны).
Как видите, автоматический расстановщик зон справился на четвёрочку. Он корректно выделил весь текст, но создал пару лишних текстовых зон и проигнорировал картинку.
Потратим ещё несколько секунд на исправление зон вручную. Обратите внимание, что в левом верхнем углу в текстовую зону попадают куски нарисованной головы и плеча. Это нормально. Метод работает даже когда под текстом что-то нарисовано. И особая точность при расстановке зон, как правило, не требуется. Достаточно указать общие очертания.
После этого закроем окно с зонами, нажмём кнопку "Кодировать" - и получим идеальный DjVu файл без артефактов сегментации и без компромиссов по качеству и размеру.
Полуавтоматическая сегментация - это новый метод обработки сканов, совмещающий преимущества автоматической и ручной сегментации. Он позволяет достичь точности сегментации, сравнимой с ручной работой. Но при намного меньших трудозатратах. Суть метода заключается в том, чтобы разрешить автоматическую сегментацию только в определённых зонах изображения, и защитить от авто-сегментера другие зоны. Помимо этого, программа может выполнять другие операции в зонах, указанных пользователем. Например, удалять кляксы.
В общих чертах, это работает следующим образом. Рассмотрим один из наиболее сложных для сегментации случаев - случай, когда текст расположен прямо на иллюстрации.
Обычно такие изображения очень трудно сжать качественно. Отделить текст от фона обычными программами вроде ScanKromsator и ScanTailor - невозможно. Иногда можно подобрать настройки сегментера, чтобы разделить слои без особо заметных артефактов. Но чаще приходится разделять слои вручную (на что уходит много времени и труда). Либо идти на компромиссы по качеству или по размеру выходного файла.
А вот как эту задачу можно решить с помощью полуавтоматической сегментации. Первым делом, откроем изображение в программе DjVu Small Mod и нажмём кнопку автоматической расстановки зон. Эта операция займёт пару секунд, после чего появится следующее окно: (Цвета приглушаются, чтобы зоны были лучше видны).
Как видите, автоматический расстановщик зон справился на четвёрочку. Он корректно выделил весь текст, но создал пару лишних текстовых зон и проигнорировал картинку.
Потратим ещё несколько секунд на исправление зон вручную. Обратите внимание, что в левом верхнем углу в текстовую зону попадают куски нарисованной головы и плеча. Это нормально. Метод работает даже когда под текстом что-то нарисовано. И особая точность при расстановке зон, как правило, не требуется. Достаточно указать общие очертания.
После этого закроем окно с зонами, нажмём кнопку "Кодировать" - и получим идеальный DjVu файл без артефактов сегментации и без компромиссов по качеству и размеру.