Просмотр сообщений

В этом разделе можно просмотреть все сообщения, сделанные этим пользователем.


Сообщения - N.M.E.

Страницы: 1 ... 4 5 [6]
76
хочу обратить внимание на одну особенность..
как-то давно я заметил, что повернутые таким образом страницы в некоторых книгах при просмотре лизардтеховским плагином отображаются НЕповернутыми.. причем в WinDjview такой странности не наблюдается..
оказывается (сейчас в этом экспериментально убедился), что если в информации о странице стоит версия 21, то плагин пробрасывает информацию о ориентации страницы.. если же в любом хекс-редакторе изменить один байт (поставить версию 22 и выше), то плагин эту страницу нормально поворачивает..
стоит иметь это в виду при повороте страниц, сделанных в старых версиях редакторов (кажется,  соло делает такие файлы)..

77
если с предпросмотром, то документ экспресс эдитор 6..
кликаешь пкм по превьюшке страницы (слева) и вертишь в нужную сторону..
хотя помницца у меня на одном документе траблы возникали с поворотом (не во всех просмотрщиках страницы отображались повернутыми)..

есть также и другие варианты поворота, но менее наглядные..

78
DjVu / Re: Программа DjVu Imager
« : 20 јРав 2011, 22:23:47 »
3. Разрешение везде 600dpi, как в рекомендациях, где ты увидел 1800 я не пойму.
то, что желал сделать и то, что в итоге получилось - совпадает не всегда..
погляди в информации о странице (в книга.djvu и книга.out.djvu)
Цитировать
  FORM:DJVM [206811]
    DIRM [58]         Document directory (bundled, 3 files 2 pages)
    FORM:DJVI [50] {0062_0001.djbz}
      Djbz [38]         JB2 shared dictionary
    FORM:DJVU [104088] {0038_0001.djvu} [P1]
      INFO [10]         DjVu 11676x15084, v25, 1800 dpi, gamma=2.2
      INCL [14]         Indirection chunk --> {0062_0001.djbz}
      Sjbz [77168]      JB2 bilevel data
      FG44 [2472]       IW4 data #1, 100 slices, v1.2 (color), 973x1257
      BG44 [14026]      IW4 data #1, 74 slices, v1.2 (color), 3892x5028
      BG44 [3261]       IW4 data #2, 10 slices
      BG44 [373]        IW4 data #3, 4 slices
      BG44 [3526]       IW4 data #4, 9 slices
      TXTz [3160]       Hidden text (text, etc.)
    FORM:DJVU [102579] {0062_0001.djvu} [P2]
      INFO [10]         DjVu 11676x15084, v25, 1800 dpi, gamma=2.2
      INCL [14]         Indirection chunk --> {0062_0001.djbz}
      Sjbz [79418]      JB2 bilevel data
      FG44 [1323]       IW4 data #1, 100 slices, v1.2 (color), 973x1257
      BG44 [13750]      IW4 data #1, 74 slices, v1.2 (color), 3892x5028
      BG44 [2738]       IW4 data #2, 10 slices
      BG44 [21]         IW4 data #3, 4 slices
      BG44 [2444]       IW4 data #4, 9 slices
      TXTz [2783]       Hidden text (text, etc.)

79
DjVu / Re: Программа DjVu Imager
« : 19 јРав 2011, 10:57:17 »
странно, у меня книга открывается нормально, без ошибок. какой вывод можно сделать из вашего сообщения?
вывод такой - ты файл открываешь программой WinDjView, а не DjvuView или DjView, которые указывают на то, что у тебя по 2 чанка FG44 на каждой странице - чего быть не должно..
а то, что книга открывается нормально - неправда.. картинка то не показывается, а она ведь есть в файле - если вручную удалить один чанк FG44, то это становится видно..

проблема в том, что ты не тем профилем кодировал маску - она д.б. однослойная, а у тебя там паразитный задний слой оказался.. это, наверное, от того, что исходный файл у тебя не ч\б, а в оттенках серого.. в таком случае надо было профиль соответствующий bitonal выбирать..
и второе - для чего такое разрешение 1800dpi делать из исходников в 600dpi??? качество нисколько не улучшается, а тормоза дикие при открытии файла..

а то, что DjVu Imager создает второй чанк FG44 несмотря на то, что один уже есть - это баг.. он либо вообще не должен такую маску обрабатывать и выводить соответствующее предупреждение, либо просто не добавлять дублирующий чанк..

80
DjVu / Re: Проблема!!! Двусторонняя печать djvu
« : 28 ДХТаРЫм 2011, 23:45:36 »
monday2000
левой клавишей по первой миниатюре -> ползунок вниз -> шифт -> левой по последней -> правой -> сохраняем в нужном формате..
можно с контролом выбрать только нужные страницы..

81
DjVu / Re: DjVuOCR выдаёт ошибку
« : 18 ПЭТРам 2011, 18:51:03 »
подскажете как пофиксить
в основном такая ошибка возникает после проверки документа..
один из методов лечения - открыть проект в фр8 и на всех страницах (на которых возникает ошибка в DjvuOcr'е) немного изменить размеры текстового или любого другого блока.. или добавить в любое пустое место новый блок, например - "картинку"..
в общем - статус страницы не должен быть "проверена" - DjvuOcr на такие страницы ругается..

82
Программирование / Re: CuneiForm для DjVu
« : 05 ґХЪРСам 2010, 22:18:11 »
monday2000
Цитировать
А что это за версия "3.5.23b" - что значит "b"? Где её взять?
что такое "b"? .. наверное, Bottou знает))
а брать - как обычно, на sourceforge.net..

83
Программирование / Re: CuneiForm для DjVu
« : 03 ґХЪРСам 2010, 19:04:43 »
monday2000
Цитировать
Синтаксис поддерживается одинаковый
я имел ввиду вывод информации в файл.. в 3.5.23b добавлена инфа о номере страницы
Цитировать
  FORM:DJVM [5294]
    DIRM [29]         Document directory (bundled, 1 files 1 pages)
    FORM:DJVU [5244] {BC65~1.DJV} [P1]
      INFO [10]         DjVu 1728x2590, v25, 300 dpi, gamma=2.2
      Sjbz [5104]       JB2 bilevel data
      ANTz [102]        Page annotation (hyperlinks, etc.)

84
Программирование / Re: CuneiForm для DjVu
« : 02 ґХЪРСам 2010, 20:17:23 »
А вот обновлённая  версия djvused:

http://www.djvu-soft.narod.ru/soft/djvused.rar  (700 КБ)

Синтаксис такой: djvused sample.djvu -u -e 'output-txt' > 1.txt

Это скомпилированные мною экзешники в MS VC++ 6.0. Готовы к работе и никаких dll не требуют.

содержит баг - при запуске с командой dump для ОДНОСТРАНИЧНОГО файла копия этого файла создается в корне диска с каким-то левым именем..
да и синтаксис вывода в авторской версии немного другой..

85
Программирование / Re: CuneiForm для DjVu
« : 23 ЅЮпСам 2010, 19:12:01 »
Цитировать
Я пока точно не знаю, делает ли CuneiForm более точное разбиение, чем просто построчное.
:o
а что ж по твоему означает всё это множество цифр после title="x_bboxes?
конечно же это координаты букв))
и использовать надо именно эти координаты, складывая их затем в слова или строки..

86
Программирование / Re: CuneiForm для DjVu
« : 16 ЅЮпСам 2010, 18:32:44 »
Цитировать
Утилита игнорирует путь к DjVu, содержащийся в XML.
а если сделать так:
при наличии в строке ссылки на djvu-файл - игнорировать, при отсутствии - брать из xml..
тогда и по-старому работать будет, и новая функциональность появится..

87
Программирование / Re: CuneiForm для DjVu
« : 14 ЅЮпСам 2010, 23:18:16 »
Цитировать
Так что буду теперь делать модифицированную версию djvuxmlparser
ненужная, лишняя программа..
правильнее встроить данную функцию в djvutoxml.. конечно, предварительно исправив баги..
имхо..

88
Программирование / Re: CuneiForm для DjVu
« : 08 ЅЮпСам 2010, 19:24:37 »
Цитировать
Я ж и говорю, что "не нужно".
ну, тогда удаляю свою программу за ненадобностью..
успехов  ;)

89
Программирование / Re: CuneiForm для DjVu
« : 07 ЅЮпСам 2010, 13:09:41 »
Цитировать
Не думаю. Как раз наоборот.
если есть выбор - то, конечно, работать с xml удобнее - кто ж спорит..
но в данном конкретном случае - мы имеем что имеем))..
и создавать некий конвертер "html - xml" только для того, чтоб потом "работать с xml" в данной ситуации сложно и не имеет смысла..
если уж так принципиален формат xml, то больше пользы будет, если тратить время не на конвертацию имеющегося хтмл, а правку вывода даных из cuneiform..

вообще, djvutoxml криво извлекает текст из djvu.. пропадают части слова после цифр, тире, кавычек и т.д.. к тому же xml содержит дополнительную информацию не только о djvu-книге, но даже о месте ее расположения на диске  :o .. поэтому, создавая xml для djvuxmlparser'а придется дополнительно извлекать всю эту информацию напрямую из книги, либо с помощью соответствующих утилит..
в этом плане формат dsed более гибкий - ему необходим только номер страницы..

резюме - если конечной целью является внедрение текста, полученного в cuneiform, то на данный момент наиболее простой способ - парсить html, создавать dsed и внедрять его djvused'ом.. моя программка из предыдущего поста - наглядное тому подтверждение.. в принципе, после того, как данные из html получены, их и в т.н. "dxml" запихнуть проще простого..
в перспективе, при желании, можно поправить формат выходного файла cuneiform'а.. вместе с этим научить его хавать djvu (т.е. на входе д.б. djvu-файл - на выходе xml, dsed или внедренный текстовый слой - по выбору)..
всё остальное - это "шашечки", а не "ехать"..

а вообще, качество распознавания в cuneiform'е оставляет желать лучшего.. нужно ли вообще текст такого качества вставлять в книгу?
это сродни некачественно сделанным книгам (в плане сканов), только с меньшими последствиями.. вроде и книга есть, а пользы от нее 0, а то и вообще - вред.. так и от такого текста - ты ищешь нужное слово, поиск показывает, что его в книге нет, начинаешь лопатить другие материалы.. а оно на самом деле есть.. хорошо, что в отличии от хренового качества картинки, здесь ситуация поправимая..

90
Программирование / Re: CuneiForm для DjVu
« : 07 ЅЮпСам 2010, 03:20:23 »
Цитировать
Итак, на данный момент задача ставится так, что нужно преобразовать hxml в dxml.
имхо это лишнее..
надо хтмл парсить, так намного проще..
даже я, имея за плечами полторы прочитанные книги по C#, сумел за день в первом приближении сделать такую утилитку..
если есть фреймворк - посмотри http://ifolder.ru/20142561

Страницы: 1 ... 4 5 [6]