Просмотр сообщений

В этом разделе можно просмотреть все сообщения, сделанные этим пользователем.


Сообщения - antabu

Страницы: 1 [2]
16
DjVu / Просмотр распознанного текста *.djvu
« : 07 ґХЪРСам 2012, 09:55:48 »
Существует плагин к Total Commander (версии 32 бит) http://wincmd.ru/plugring/filter.html , позволяющий по F3 просматривать, в числе прочего, при соответствующей настройке, текст в файлах .djvu, если он распознан. Постраничный вывод работает быстро.
Однако, то, что хорошо работало под Win.XP, перестало под семёркой.
К сожалению, автор, похоже, забросил своё детище и на вопросы на соответствующем форуме не отвечает.
В качестве временной меры (подбор методом тыка) я удалил из соответствующей строки файла настроек listfilter.ini модификатор %hide% , заработало, но при листании страницы всплывает и быстро исчезает чёрное досовское окошко.
Для вывода текста в данном случае плагин использует конвертер djvutxt.exe из комплекта DjVu Libre. В одной папке с этим файлом должны лежать (из новой версии)
libdjvulibre.dll
libjpeg.dll
msvcr100.dll
В комплект плагина по вышеуказанной  ссылке не входят этот и другие конвертеры и редактор файла настроек. Худо-бедно настроенные плагины можно скачать из сообщения http://chemistry-chemists.com/forum/viewtopic.php?p=18880#p18880 , конвертеры (не последних версий) включены в другой плагин - wdx_TextSearch.
На любителя поковыряться.
Правильно настроенный плагин MultiLister (former PDF Filter) в панели Total Commander в режиме эскизов ещё и показывает миниатюры текстов первой страницы файлов, если они распознаны.
Кроме коммандера, плагин должен подойти к просмотрщику Universal Viewer, которого есть бесплатная версия.
Возможно, кто-нибудь изъявит желание настроить это хозяйство под Windows 7.
Не стреляйте в пианиста.

17
А чем топикстартера не устраивают возможности DjvuOCR_2.4_bet ?
Я обычно текст переношу из файла в файл с помощью него, важно, чтобы количество и порядок страниц были одинаковыми (хотя можно переносить часть страниц), желательно и размеры в пикселях.

18
Решил поэкспериментировать с переносом закладок. Взял два варианта одной книги. Первый: http://www.libgen.info/view.php?id=288359 имеет закладки (в WinDjView отображаются на левой панели) + интерактивное оглавление (ссылки в оглавлении), и те и другие ссылки на номера страниц (а не на их имена), разрешение 600dpi
Второй файл http://www.libgen.info/view.php?id=237254 закладок не содержит, разрешение 300dpi. Количество и порядок страниц одинаковое.
Командой djvused myfile.djvu  -u -e output-ant > myfile.dsed удалось из первого файла извлечь только  содержание, а BW (что на левой панели) - не извлекается. Внедрить во второй файл не удаётся - оно и понятно, при внимательном рассмотрении myfile.dse заметно, что ссылки имеют привязку к координатам на странице, которые при разном разрешении естественно не совпадут.

19
Такая же фигня. В чёрном окошке:
*** you must first select a single page
*** (..\..\..\tools\djvused.cpp:371)
Приходится делать медленным путём:
1. из djview сохраняю тот файл, куда надо внедрить в виде двух половинок.
2. в DjVuEditor открываю файл, откуда надо извлечь, и удаляю первую половину страниц, взамен них вставляю первую половину из другого файла.
3. Тоже самое делаю со второй половиной страниц
Удаление страниц - самая медленная операция.

20
Потому во все руководства надо добавить - распознавание обложки обязательно.
Либо обложку - последней страницей, в зависимости от нумерации страниц в книге и файле.

21
Спасибо. Слава богу, такая книга исключение
Совсем не исключение. Множество ГОСТов http://www.complexdoc.ru/ отсканировано с подобной неприятностью.

22
Pdf / Re: Чем сделать OCR в PDF?
« : 10 ёоЫм 2012, 13:01:36 »
К новой версии PDF-XChange Viewer есть типа плагин для распознания текста. На портабельную версию напрямую не ставится, но есть решение http://forum.ru-board.com/topic.cgi?forum=5&topic=29200&start=200#8

Страницы: 1 [2]