Просмотр сообщений

В этом разделе можно просмотреть все сообщения, сделанные этим пользователем.


Сообщения - Nitro

Страницы: [1]
1
Флейм / Re: Plustek Opticbook 3800
« : 23 ґХЪРСам 2011, 17:19:11 »
don555
Я сам не пользовался этими сканерами, сам вот раздумываю над покупкой. Скажи пожалуйста, а правда что VueScan не работает с  Opticbook 3600?

2
Pdf / Re: Чем сделать OCR в PDF?
« : 11 ґХЪРСам 2011, 17:41:38 »
Вставлю свои 5 копеек. Adobe Acrobat Professional не канает вообще, качество такое, что лучше б вообще не было распознанного слоя. Да и 2 языка распознавания невозможно выбрать.

Что касается FR, то тут приходится переконвертировать PDF. И вот тут проблема уже в том, что после прогона сильно портятся изображения (даже при максимальных настройках качества). Понятно, что хранить отсканированную книгу с иллюстрациями в pdf это очень плохо, но в ряде случаев, если текст более-менее читаем, тратить время на улучшение и перегонку в djvu смысла нет, а текстовый слой добавить все же хочется. Про это и тут писали http://rutracker.org/forum/viewtopic.php?p=46798219#46798219

Есть какие-то мысли по этому вопросу?

3
Пользуюсь FR8 и djvuOCR с последующей подклейкой текстового слоя. Как по мне, тут все отлично работает, никаких проблем не вижу.

4
По моему мнению, сравнивать ST и SC вообще как-то некорректно. Программы слишком различны по своему функционалу.

Я, конечно, не крупный спец в книгосканировании, но выбрал для себя следующий алгоритм: ST использую для первичной обработки: разрезания, поворота и доводки страниц до заданного размера. Особенно важен последний пункт - как по мне, это основной плюс ST, и реализовано действительно удобно-смекалисто. Гораздо лучше, чем гемор с резаками в SK.

С другой стороны, полное отсутсвие улучшения текста в ST делает его слабо пригодным для бинаризации текста, а для улучшения качества книг, сделанных другими людьми (например, с низким разрешением, когда нужно применить сильный blur для сглаживания зазубрин) и вовсе непригодным. Так что на выходе ST я выбираю серые страницы с белыми полями, а в SC отключаю резаки и выставляю фиксированный размер страницы, сосредотачиваясь на настройках бинаризации и улучшения серого.

Иногда, для очень неравномерно освещенных сканов, я включаю в ST выравнивание освещенности (в SC эта функция реализована плохо, monday2000 много писал об этом). Хотя качество при этом несколько страдает, стараюсь этой опцией не пользоваться.

Кстати, уже вышел ST 0.9.10, там среди новшеств появилась возможность dewarping'a (распрямления строк). Сам я еще ее не опробывал. Как мне показалось, скорость обработки страниц стала еще меньше, из-за чего я уже экспериментировать с dewarping не решаюсь.

У меня не заработала ни черта эта возможность. Я стараюсь прижимать книгу плотнее к стеклу сканера, и кривизна строк в основном небольшая. ST с выравниванием не справился. На данном этапе я решил не бороться с кривизной строк. На читаемость книги это не сильно влияет, а дополнительно колбасить сканы прогоном через BR считаю необоснованным.

Страницы: [1]