Просмотр сообщений

В этом разделе можно просмотреть все сообщения, сделанные этим пользователем.


Сообщения - Святогор

Страницы: [1]
1
DjVu / Re: Распознавание текста
« : 04 °ТУгбв 2014, 06:59:03 »
Так я с этого скан-тейлора и начал обрабатывать сканы, всё сделал по пунктам... кривизну рамки он мне не поправил

А про скрепку - это иконка djvu файла. Подумал, будет лучше, если картинка первой страницы будет иконкой документа. Вообще этот файн ридер мне все картинки испортил. Я заморочился со сканированием, каждую страницу, которая содержала текст и фото, я сканировал два раза подряд с разными, соответствующими настройками, затем подменял страницы в скантейлоре, дважды экспортировал, потом вручную подбирал те что нужно, а после сохранения в файнридере все усилия насмарку пошли...

2
DjVu / Re: Распознавание текста
« : 03 °ТУгбв 2014, 08:38:58 »
А можно вместо скрепки на фиолетовом фоне поставить картинку первой страницы?

3
DjVu / Re: Распознавание текста
« : 03 °ТУгбв 2014, 08:34:06 »
Спасибо, что откликнулся, шрифт наверняка тот, так как и визуально схож и по смыслу названия подходит. Я пытался его разыскать среди группы кельтских шрифтов, но также безуспешно.
Я пошёл по другому пути: создал два набора эталонов для двух типов проблемных областей. Первый для распознания этого декоративного шрифта (с заранее добавленными буквами алфавита), а другой для распознания сносок, которые имеют размер шрифта меньший чем основной текст и из-за этого в нём очень часто встречается ошибка "инь". Затем сделал анализ документа и каждую отдельную область распознавал вручную выбирая нужный эталон. И ещё одна фишка: создание пользовательского словаря - это точечно сокращало ошибку "инь". Соответственно заняло это очень много времени, чуть ли не сутки, хорошо хоть книга по объёму маленькая.
Соответственно, для меня было бы очень полезно, если бы Вы опытным взглядом посмотрели на результат, оценили и посоветовали бы что ни будь
http://vk.com/doc7987521_318712411

5
DjVu / Распознавание текста
« : 31 ёоЫм 2014, 22:24:03 »
Книга, которую я пытаюсь отсканировать содержит декоративный шрифт. Я пытаюсь распознать с методом обучения, но он почему-то просит обучить одним и тем же символам много раз, и при этом выдаёт некачественный текст, причём просит обучить не только декоративному шрифту, но и самому обычному.
Подскажите какие ни будь хитрости, как улучшить качество распознавания (вообще я впервые работаю с распознанием текста), я думаю может можно улучшить если иметь в наличии этот самый шрифт, если можно, то как его найти имея только изображение. Может ещё какие фишки есть, может у кого есть качественная база эталонов... помогите, пожалуйста.
я использую программу файн ридер 12 про

Страницы: [1]