Уважаемые участники форума предлагаю обсудить вопрос каталогизации DjVu книг.
На мой взгляд не освещенность данного вопрос, создает большие трудности и неудобства всем кто пользуется электронными книгами, а также собирает\ведет электронные библиотеки. Как по мне данный вопрос давно уже стал проблемой и значительно сдерживает полноценное развитие электронных коллекций и поиск необходимых книг (и статей из книг) в этих самых коллекциях (как частных так и общедоступных в интернете).
Прежде всего хочу определиться с терминологией. Под каталогизацией DjVu книг я понимаю создание и ведение базы данных о книгах (и их содержании) хранящихся в электронной библиотеке (коллекции), с целью быстрого и желательно автоматизированного поиска конкретных книг и более того с возможностью текстового поиска по содержимому книг (!).
Теперь непосредственно по существу вопроса. Насколько мне известно возможности по каталогизации в настоящее время не очень широкие (и соответственно не очень удобные):
1. это именование книг по стандартизованной схеме (например NameCreator-ом);
Пример.
Ivanov I.I., Petrov P.P. Bibliotechnoe delo dlya chajnikov (2e izd., Moskva, 2001)(ru)(T)(C)(K)(300dpi)(250s)
2. ведение базы данных в Excel или Access;
3. для полнотекстового поиска по библиотеке хранение OCR-слоя из DjVu книги отдельным txt файлом сжатым в zip архив рядом с DjVu-книгой.
Теперь несколько подробнее по выше перечисленным пунктам.
1. именование по какой либо стандартизованной системе в том числе и NameCreator-ом как по мне не совершенный и временный (за неимением лучшего) метод. Так как запихивание (по другому и не назовешь) всей информации о книге в название DjVu файла делает его (название) через чур длинным и от того неудобным, плюс ограничение на длину имени файла (255 символов), что для именования некоторых книг может оказаться недостаточным.
Хотя должен признать в любом случае именование по стандартизованной системе гораздо информативнее и удобнее, чем названия из серии: Radio.djvu, Шапошников.djvu, tel_lub_astr.djvu или Prakt_shemotehnika_1.djvu и т.п.
На мой взгляд полным и наиболее удобным решением данной проблемы было бы ведение в формат DjVu метаданных, как это сделано например в PDF, DOC или MP3 (теги), посмотрите в википедии например стандарты: EXIF, IPTC и XMP. Тогда бы все стало просто и очевидно, да и поиск нужных книг происходил бы удобно и просто, причем сам поиск можно было бы осуществлять по самым различным запросам и категориям, как и сортировку книг.
Очевидно есть два пути или ждать пока разработчики DjVu формата (Caminova или кто там уже?) сами придут к такой необходимости и добавят стандарт на метаданные в DjVu или разработать и самому встроить их в формат DjVu (если конечно DjVu достаточно открытый формат и не возникнут различные технические проблемы).
3. Хранить OCR-слой отдельным txt файлом пусть даже сжатым в zip архив как по мне это лишнее дублирование данных и трата места. Слышал есть некая программа Archivarius по отзывам вроде как единственная нормальная программа для поиска в текстовом слое DjVu, если она действительно нормально это делает это значительно упрощает поиск по всей библиотеке
Пока все, прошу к обсуждению.