Пока набирал сообщение появился Ваш новый ответ
Итак, всё по порядку.
благодарю за потраченное время на высылку фр11 и обработку моего примера.
я все загрузил и посмотрел.
Пожалуйста.
поскольку вы помянули об отсутствии этой проблемы у вас, потому я и так заинтересовался. а оказывается вы не передираете текстовый слой в собственноручнокодированный дежавю. просто разговор оказывается о разных вещах идет. вы пользуете дежавю от абббиии, а речь идет о том. что оттуда выдранный текстовый слой содержит удвоенные пробелы.
Строго говоря Вы сами, несколькими сообщениями выше, дали исчерпывающий ответ и способ борьбы с этим глюком. И, я прекрасно понимаю что 11-я версия довольно сыра. Причешут её, дай Бог, только к следующему году. Во всяком случае мне видится такой финал, исходя из прошлых релизов данного продукта.
п.с. - качество распознавания у ФР9 мне больше понравилось. только текст выдрать не могу djvuocr.
Распознавания русского+английского или распознавание вообще?
п.п.с. а вас не за@#$ет окошечко при перераспознавании страницы, которое надо ВРУЧНУЮ закрывать?
А Вы что, в ручном режиме перераспознаёте
каждую страницу Вашего документа?
Всё 374 стр. или сколько там на горизонте. Тогда да, согласен. Неужели качество распознавания настолько хреновое
что требует ручной работы с более чем 50% книги? ... так качество книг разное бывает.
NBell, понимаете, перед тем как запихнуть книгу или журнал в ФР я смотрю на качество этого файла, на качество скана. Довольно часто, если сканировал не я, приходиться прибегать к помощи 2D редактора(-ов). Подозреваю что я не одинок в таком подходе.
п.п.п.с. попробовал фр11 только потому, что djvuocr падает на fr8, который я целый день правил (только зоны подправил и все) - это тоже геморрой. если зоны оставить кривые как есть - не падает.
Прошу Вас проследить за ходом моей мысли.
Только в 10-ой версии, если мне не изменяет память, внедрили DjVu формат. Его стало возможно
открывать, как есть. При этом не используя никакие аддоны или патчи для открытия этого формата в более ранних версиях ФР(см. напр.
http://rutracker.org/forum/viewtopic.php?t=546636). В 11-ой версии стало возможным
сохранять в DjVu формате. Правда с минимальным набором настроек и как итог, корявым DjVu. В 12-ой версии, если следовать логике событий, ожидается совершенствование работы с DjVu форматом. Поэтому мне совершенно непонятна любовь к более старым версиям. Впрочем это может быть и ... неофобия
@#$%!!!!
заменил в папке djvuocr djvused.exe на версию из последнего релиза djvulibre - и все поперло!
yuree - вы просто здорово помогли! я уже руки опустил, но написал для вас батник, который при помощи djvused меняет текстовый слой и узрел ИСТИНУ!
Просто ОГРОМНОЕ спасибо!!!
Прошу Вас, всё по порядку. Я не совсем понял чем я Вам помог, нудаладно.
Поясните пожалуйста своё сообщение на примере. Что за версия djvused что за версия djvulibre, где можно их скачать чтобы не мучить Гугл. И, самое главное, что за батник Вы мне написали. В какую папку его лепить и откуда запускать.
п.с. а с фр11 еще неприятность - при чтении дежавю он все серые страницы перевел в черно-белый... так что по-быстрому добавление текстового слоя в готовый дежавю не выходит.
Серые в ч\б? Так может есть вариант поставит не ч\б настройку а цветную, по умолчанию.