Главное > DjVu

Чем осуществлять текстовый поиск в DjVu-файлах

<< < (2/550) > >>

Alfizik:
Хронически не нравятся индексируемые поисковики :(

1. На индексацию нужно время
2. база индексов занимают место причем немалое, иногда объем базы индексов составляет до 50% от объема индексируемых файлов. Пример, если библиотека 20 Гб то, до + 10 Гб база индесов итого =30 Гб это же ужас какой-то. А если библиотека на DVD дисках (например требуется чтоб библиотека была мобильной, друзьям дать попользоваться и т.д.), то для 5 дисков (все те же 20 Гб) держать на HDD еще и 10 Гб индексов в придачу? Тогда какой смысл вообще в DVD коллекции )) Бери коня, только уздечку не трогай! Или еще 6 диск записывать с базой индексов?

monday2000

--- Цитата: monday2000 от 17 ґХЪРСам 2010, 15:40:44 ---DjVu Shell Extension Pack http://www.caminova.net/en/downloads/ по идее работает даже без dtSearch - а просто как бы встраивает поддержку поиска по внутренностям DjVu в стандартный поиск Windows XP и старше:

--- Цитировать ---You can search DjVu files using Windows Search.
--- Конец цитаты ---
Это тоже свободно-бесплатный продукт.

--- Конец цитаты ---

А вот это интересно, почитал на оф. сайте в этой проге походу еще и редактор метаданных есть!

http://dev.caminova.jp/beta/djvu-wic/props.png

--- Цитировать ---Viewing/Editing DjVu properties directly on Explorer
--- Конец цитаты ---

Globus2
Еще есть iFilter ver.1.1 для DjVu - http://www.caminova.net/en/downloads/download.aspx?id=7
Инсталируешь в систему и появляется возможность осуществлять поиск в текстом слое DjVu прямо из стандартного поиска Windows (Пуск ---> Поиск), к сожалению этот iFilter я так и не смог (или возможно не понял как) прикрутить к поиску через TotalCommander, а жаль поиск через TotalCom осуществляется имхо быстрее чем стандартными инструментами Windows.

Alfizik:
Вообще реально ли прикрутить iFilter к какой нибудь программулинке единственная функция которой будет заключаться в удобном поиске через графический интерфейс на компе\DVD-диске нужных книг по ключевому слову из книги?
Например прикрутить iFilter к тому же книжному котику (BookCAT). 

P.S.
Данный вопрос я уже поднимал в теме Каталогизация DjVu книг - http://www.djvu-scan.ru/forum/index.php?topic=34.0.

monday2000:
Alfizik

--- Цитировать ---Вообще реально ли прикрутить iFilter к какой нибудь программулинке единственная функция которой будет заключаться в удобном поиске через графический интерфейс на компе\DVD-диске нужных книг по ключевому слову из книги?
--- Конец цитаты ---
Можно к dtSearch.

--- Цитировать ---iFilter ver.1.1 для DjVu
--- Конец цитаты ---
По идее, он входит в состав DjVu Shell Extension Pack.

--- Цитировать ---Хронически не нравятся индексируемые поисковики
--- Конец цитаты ---
Наверное, можно предусмотреть и какой-то вариант поиска без индексации.

--- Цитировать ---А вот это интересно, почитал на оф. сайте в этой проге походу еще и редактор метаданных есть!
--- Конец цитаты ---
Да, я тоже заметил сегодня. Я такую же программу и хочу сделать. Она будет даже бОльшее количество полей метаданных - за счёт XMP.

Alfizik:

--- Цитата: monday2000 от 22 ґХЪРСам 2010, 17:56:07 ---Alfizik

--- Цитировать ---iFilter ver.1.1 для DjVu
--- Конец цитаты ---
По идее, он входит в состав DjVu Shell Extension Pack.

--- Конец цитаты ---
Только что инсталлировал, да так и есть (DjVuIFilter.dll в 1,7 Мб).


--- Цитата: monday2000 от 22 ґХЪРСам 2010, 17:56:07 ---
--- Цитировать ---Хронически не нравятся индексируемые поисковики
--- Конец цитаты ---
Наверное, можно предусмотреть и какой-то вариант поиска без индексации.

--- Конец цитаты ---

Выбор возможности всегда лучше, предустановленных параметров. Будет не плохо если будет галочка - вкл\выкл индексацию. И каждый по своим потребностям и железу сам настроит поисковик.


--- Цитата: monday2000 от 22 ґХЪРСам 2010, 17:56:07 ---
--- Цитировать ---А вот это интересно, почитал на оф. сайте в этой проге походу еще и редактор метаданных есть!
--- Конец цитаты ---
Да, я тоже заметил сегодня. Я такую же программу и хочу сделать. Она будет даже бОльшее количество полей метаданных - за счёт XMP.

--- Конец цитаты ---
Будет прекрасно! Я так понимаю программа в обозримом времени не предвидеться, это пока планы на перспективу?
 

monday2000:

--- Цитировать ---Будет прекрасно! Я так понимаю программа в обозримом времени не предвидеться, это пока планы на перспективу?
--- Конец цитаты ---
Совершенно верно, это действительно планы на перспективу. Мне тут не хочется рубить с плеча - надо продумать такой вариант, который устроит как можно больше людей. В основном, вопрос ставится так: что именно означают поля метаданных? Что туда записывать? Поля типа Titile, Author - это понятно. Но есть менее понятные - например: Subject, Keywords, Producer, Trapped, CreatorTool. Просто надо почитать спецификации метаданных и т.п. - чтобы понять, что тут имеется в виду. А это всё время - это несколько талмудов размытого содержания, ссылающихся на ещё менее вразумительные талмуды (типа Dublin Core, Bibtex), и т.д. И написаны они непонятно-туманно зачастую (полу-"юридическим" языком). :) Одна лишь спецификация XMP - это 3 больших PDF-файла.

В этих вещах надо разобраться, разработать методику заполнения DjVu-метаданных. И чтобы не было при этом никакой отсебятины - в этом ещё сложность. Чисто механически можно заполнять поля DjVu-метаданных хоть прямо сейчас - через djvused нет проблем - но надо ж понимать, что при этом делаешь.

Просто нужно как-нибудь сесть да почитать всё это. А пока времени на это я не нашёл - но запланировал потихоньку осваивать.

Навигация

[0] Главная страница сообщений

[#] Следующая страница

[*] Предыдущая страница

Перейти к полной версии