1
DjVu / Re: FAQ: Оцифровка и OCR-обработка дореформенных текстов, расстановка Ё и ударений
« : 04 ДХТаРЫм 2013, 08:25:16 »
Скажите, а как Вам удалось импортировать dict_1006649 в FineReader? У меня во время импорта выдается ошибка "Переполнение словаря "воскрешенiямъ"" (стоит лицензионный FineReader 8.0 Professional Edition).
Если возможно, то могли бы Вы выложить уже скомпилированный словарь для FineReader?
Если возможно, то могли бы Вы выложить уже скомпилированный словарь для FineReader?
Протестировал. dict_1006649 делает необходимость правки минимальной (http://narod.ru/disk/37053923001/dict_old.rar.html). Так что можно получить вполне приемлемое качество и без ручной корректировки. Жду замечаний и предложений.
Общий алгоритм действий:
...
2. Один раз в FineReader 11 создаем и настраиваем новый язык (дальше уже пользуемся созданным): язык документа->Выбор языков... Откроется редактор языков, внизу слева нажимаем кнопку "Новый...", отмечаем "создать новый язык на основе существующего", выбираем в выпадающем меню "Русский (старая орфография), жмем ОК. Откроется окно свойств языка, вводим название, например "Русский (дореформенный, со словарем)". В разделе словарь выбираем "пользовательский словарь" и жмем кнопку "свойства..." В открывшимся окне жмем "импорт..." и выбираем словарь dict_1006649. Ждем, когда миллион шесть тысяч шестьсот сорок девять слов займут положенное им место. Давим кнопку "закрыть" в окне "словарь для языка", куда успешно импортирован наш словарь. в свойствах языка также жмем "ок". Затем и в редакторе языков отмечаем галочкой наш новый язык "Русский (дореформенный, со словарем)" (или как сами называли), он будет в самом низу, в пользовательских языках. Я ставил галочку также напротив языка "Русский и английский; (со словарной поддержкой). Жмем ок. Настройка языка распознавания окончена.
...