AlfizikЭх, мечты, мечты
Да почему же мечты. В крайнем случае, такую программу можно сделать самим (аналогичные уже готовые наверняка есть - но вряд ли у них есть именно тот набор фич, что нужен).
Можно сделать, например, самодельную программму, которая будет включать базу на MySQL + поиск по OCR-слою книг на базе Персонального поиска Яндекс (ППЯ). В ППЯ имеется SDK
http://desktop.yandex.ru/plugins.xml - так что можно Яндекс-поиск использовать в своей самодельной программе.
Такой же SDK имеется в Google Desktop:
http://code.google.com/intl/ru/apis/desktop/ . В своей программе можно будет сделать выбор - то ли Яндекс, то ли Google (кому что нравится).
По поводу именования файлов: сейчас Name Creator прописывает в имени файла всякие условные обозначения качества DjVu-книги. Например, (T)(C)(K).
Идея хорошая, правда, ИМХО, с недостатками. Дело в том, что подобных признаков качества гораздо больше, чем имеется в Name Creator. Например:
1. Делали ли Deskew.
2. Искривлены ли строки.
3. Какой режим - серый/ч.б./
И т.д. и т.п.
Поэтому я бы предложил иной вариант: взять двоичное число - длиною, скажем, 16 бит. И каждому биту назначить тот или иной признак качества. 0 или 1 в данном бите будет означать наличие/отсутствие того или иного признака качества. Полученное 16-битное число - прописывать в имени файла - в шестнадцатиричном виде (для краткости). Это будет выглядеть как "1FD5" или "34AA".
Причём, можно в этом 16-битном числе назначить битам признаки качества по нарастающей важности - для того, чтобы чисто визуально, глядя на шестнадцатиричное число, можно было оценить уровень качества книги.
Также можно условно поделить весь диапазон значений 16-битного числа на 5 поддиапазонов - т.е. классы качества. Почему 5 - по аналогии со школьными оценками, т.е. как бы "выставлять" качеству DjVu-книги ту или иную оценку, как в школе - от 1 до 5. Тогда в дальнейшем опытный глаз, глянув на шестнадцатиричный индикатор уровня качества в имени файла, сразу умозрительно прикинет, к какому из 5 классов качества относится данная DjVu-книга. Плюс это можно будет в своей программе показывать.
По поводу кодов области знания:
Надо бы познакомиться поближе с УДК и ББК. Вообще-то я не знаю - а так ли уж важно прописывать в имени файла DjVu-книги некий код области знания (как то пытается фактически делать NameCreator)? Зачастую из самого имени книги ясно, к какой области знания она относится: "Ximicheskie apparaty galvanicheskix cexov".
Но, предположим, что нам хотелось бы всё-таки указывать в имени файла DjVu-книги некий код области знания. Возникает вопрос - как же его выбрать?
Это, конечно, большая тема. Я думаю - нужно использовать УДК и ББК в качестве основы для генерации кода области знаний. Может быть даже, брать код по ББК и код по УДК, и вычислять по некой формуле свой гибридный код (чтобы он был, во-первых, достаточно кратким, во-вторых однозначно "раскладывался" назад в исходные коды ББК и УДК). Зачастую в книгах уже указаны коды УДК и ББК - а если их нет, тогда нужно делать специальную программу-справочник по всем кодам УДК и ББК. Такая программа должна помогать выбрать подходящий код из справочника УДК-ББК. Потребуется раздобыть и оцифровать все коды УДК-ББК, запихнуть их в самодельную программу, и сделать механизм поиска по ним (можно по персональному поиску Яндекс).
Eugeen1948Советую подключиться к обсуждению конктетных вопросов.
Спасибо за приглашение!