monday2000, вопрос немного не по теме.
Я тоже полностью с Вами согласен (кто не знает - такой подход предлагает DjVuOCR).
Я использую DjVuOCR для внедрения текстового слоя в DjVu, оптимальна ли DjVuOCR для этого или другие программы дают лучьший результат (читал о Document Express Editor и Document Express Enterprise с IRIS OCR)?
Теперь по теме
Тоже не очень хотелось бы - т.к. это коммерческая программа. Надо бы по-возможности стремиться исключительно к бесплатным программам.
Полностью согласен!
Насчет поиска в текстовом слое, такие программы как:
- Google Desktop Search + DjVu Indexer Plugin или DjVu Plug-in
- Яндекс-Персональный поиск (desktop.yandex) + DjVu parser
- dtSearch + LizardTech DjVu iFilter.
Имеют на мой взгляд один недостаток - они являются индексирующими поисковиками. Поясню, дело в том, что на индексацию тратиться место (минимум 10% от индексируемой информации, а бывает, что и все 50%). Т.е. если мы имеем библиотеку на 80 Гб, то на размещение базы индексов уйдет где то 8 Гб. В итоге получается фактически тоже самое, что размещать рядом с DjVu-файлом txt-файла в zip архиве. Тайд или кипячение! )))
Один лишь плюс, мы сначала только один раз тратим много времени на индексацию, чтоб потом быстро производить поиск по базе индексов.
Имхо, индексирующие поисковики хороши для сетевых хранилищь, RAID-масивов и CD\DVD сборников, но не для домашних коллекций на персональном ПК. Для домашней коллекции все же предпочтительнее иметь не индексирующий поисковик, читающий текстовый слой напрямую из DjVu.
Правда в описании dtSearch вроде упоминается, что есть возможность поиска без индексации, но программа платная
Так что остаеться только DjVu IFilter v1.1 с поиском через стандартное средство Windows (Пуск ---> Поиск), но виндовский инструмент поиска, имхо еще тот поиск
Не разобрался пока еще, что из себя представляет JSSINDEX, но судя по названию похоже это тоже индексируемый поисковик.