Просмотр сообщений

В этом разделе можно просмотреть все сообщения, сделанные этим пользователем.


Сообщения - N.M.E.

Страницы: 1 2 [3] 4 5 6
31
NBell
я есть плёхо говорить по-англицки.. будешь мне помогай? :)

32
yuree
или я чего-то не понимаю, или одно из двух..
как я понял, изначально проблема заключалась в лишнем пробеле после слова "пространственно-"..
на это я дал ответ, что программа djvused, с помощью которой происходит внедрение текстового слоя в книгу САМОСТОЯТЕЛЬНО ДОБАВЛЯЕТ ПРОБЕЛЫ, несмотря на то, что в текстовом файле, внедряемом в книгу ПРОБЕЛОВ НЕТ!!! и это - НЕ ОТКЛЮЧАЕТСЯ в djvused!
Цитировать
заменой двух пробелов
чтоб не было пробела - выбирай метод 2.. вообще пробел (второй) появляется в местах, где половина слова переносится на след. строку.. а нужен он для того, чтоб при выделении строки перенесенная часть слова тож выделялась.. этот метод придумал не я, в DjvuOCR абсолютно также всё происходит.. лучшего метода пока никто не предложил..
Цитировать
почему так трудно произвести замену хотя бы на стадии декодирования.
и действительно.. в самой DjVu-книге эти "лишние" пробелы никому не мешают и на поиск не влияют.. и уж если "ловить блох" на стадии извлечения текста из книги, то легко можно найти и заменить всё что нужно в практически любом текстовом редакторе..

33
это djvused вставляет пробелы после каждого слова.. пару страниц назад это уже обсуждалось.. убрать пробелы можно лишь отказавшись от использования djvused и самостоятельно внедряя текстовый слой в файл.. но, у меня не получилось разобраться в исходниках DjVuLibre как происходит кодирование.. с декодированием проще - кроме исходников есть еще и описание алгоритма в спецификации (хоть и с ошибками), а кодирование ниасилил и забросил.. м.б. через какое-то время снова захочу этим заняться, а пока только утилиты из DjVuLibre юзать приходится..

34
DikBSD вроде делал автосохранение, но, судя по описанию, как-то сложно там получается..

35
почаще нажимать Ctrl+S.
теоретически, на автоматическое нажатие Ctrl+S можно в программе какой-нибудь экшен по таймеру заделать.. хотя, абсолютной уверенности нет, ибо ни в с++, ни в Scan Tailor'e практически ничего не понимаю..

36
DjVu / Re: Увеличение яркости djvu
« : 28 ПЭТРам 2013, 22:30:09 »
надо юзать правильный просмотрщик.. WinDjView - настройки - отображение - применять коррекцию при печати..

37
DjVu / Re: djvu->bitmap
« : 25 ПЭТРам 2013, 18:52:31 »
djvulibre-3.5.23\win32\djvulibre\djvulibre.sln
затем в обозревателе решений назначить ddjvu запускаемым.. ну и в свойствах прописать командные аргументы ессно..

38
DjVu / Re: djvu->bitmap
« : 24 ПЭТРам 2013, 20:45:04 »
Давайте мне скинете архив в проектом, который у вас создался.
у "нас" создался проект 3.5.23, ибо для более новых релизов похоже мой VC++ 2008 не канает..
только нужно распаковывать в указанные директории требуемые файлы именно той версии, которая указана в ридми.. ну и переименовать некоторые папки тож надо..
в архиве папки из моего "рабочего" проекта.. скачать

40
DjVu / Re: djvu->bitmap
« : 24 ПЭТРам 2013, 07:59:53 »
Да, вот только исходники оттуда не хотят собираться(
странно, все делал по мануалу - все собралось..
Цитировать
Populate the zlib, jpeg and tiff directories with
the open source code suggested in the README files.

41
обновил прогу - добавил пару фич..
описание и ссылки на ру-борде

42
не удивительно, ибо именно в нижней части на текстовом слое находится слово целиком.. другие просмотрщики должны себя точно так же вести..

43
Цитировать
Возможно ли используя Ваш подход сделать пословное выделение в DjVu формате таким как это реализовано в PDF? Слово выделяется как, часть слова - перенос - вторая часть слова.
я выделения не делаю, способы выделения реализовывают разработчики вьюверов.. если сравнить, как происходит выделение в наиболее популярных просмотрщиках - то можно увидеть, что оно различается..
то же самое происходит и с копированием текста.. например, в WinDjView при копировании текста с переносом, который реализовался в старых версиях DjVuOCR старый пере-
перенос
в буфер попадает старый пере-
нос
тогда как в остальных вьюверах попадает исходный текст полностью..
в PDF выделение происходит посимвольно.. в DjVu спецификация тоже позволяет задавать координаты каждой букве, но в этом случае размер файла сильно увеличивается, поэтому традиционно в DjVu используется минимальный блок (с заданными координатами) - это слово целиком..
в своей программе я переносы объединяю как в новых версиях DjVuOCR новый пере¬
нос
новый
перенос
можно будет сделать возможность выбора метода склейки слова с переносом..
все остальное - к разработчикам просмотрщиков..

44
Цитировать
Насколько я понимаю пословное выделение в DjVu Вы не станете реализовать?
так оно есть, если версия фр не ниже .583..
если же имеется ввиду разбивка строк, сделанных более ранними версиями фр, то имхо это не имеет смысла, проще перераспознать в более новом билде..
в принципе, очень просто можно сделать разбивку, посчитав количество символов в строке и поделить ее на слова пропорционально кол-ву символов в слове.. но, координаты слов, определенные таким образом, могут оказаться далеко не точными.. так что, проще и качественней заново перераспознать книгу..

45
ну, раз никто так и не взялся за написание утилитки, преодолев лень и потратив пол-дня сделал ее сам..
FR11 DjVu Text Layer Crutch на руборде..
версия пока сыровата в плане наличия фич, и всяких "защит от дурака", но при правильном использовании свою задачу выполняет - преобразовывает текстовый слой DjVu из-под 11го файнридера в формат а-ля DjvuOCR - нет блоков char, зато есть блоки line.. и слова с переносами объединяются для возможности полноценного поиска..
будет время и желание - добавлю еще кое-какие возможности.. но, это позже..

Страницы: 1 2 [3] 4 5 6