Просмотр сообщений

В этом разделе можно просмотреть все сообщения, сделанные этим пользователем.


Темы - sergiokapone

Страницы: [1]
1
DjVu / Поворот страниц в Djvu
« : 23 ёоЭм 2013, 10:25:13 »
Цифруя книги в djvu, мне понадобилась функция поворота страницы в djvu файле на угол 90 градусов. С этой задачей справляется DEEditor, но мне нужна была именно консольная програмка. Решил написать Leon Bottou и получил оперативный ответ:



On Saturday, June 22, 2013 10:27:47 PM sergiokapone wrote:

> Dear Leon, can you create a command line utility which rotate specified page

> in djvu 90 degrees or some other angles. Tnks.

Done in the git repository.

Program 'djvused' has now a command

 

set-rotation [+-]rot

 

that changes the default page orientation. The orientation is expressed as

an integer in range 0..3 representing a number of 90 degree counter-clockwise

rotations. When the argument is preceded by a sign + or -, argument rot

counts how many additional 90 degree counter-clockwise rotations should be

applied to the page. Otherwise, argument rot represents the desired absolute

page orientation. Only DjVu pages can be rotated. Pages represented as a

raw IW44 image cannot be rotated.

 

For instance, to rotate all pages clockwise, you can write

% djvused foo.djvu -e 'set-rotation -1' -s

and to change only the orientation of the first page

% djvused foo.djvu -e 'select 1; set-rotation -1' -s

 

- L.

 
Не знаю, как долго можно ждать выхода релиза под Win, moonday2000, могли бы вы компилировать этот файл?

2
DjVu / Как закодирован файл (в DjVu)?
« : 06 ёоЭм 2011, 23:21:29 »
Попалась на глаза книга в которой интересно сделанна раскараска.
Рассмотрим страницу 330, рисунок 11.4 (Саму страницу можно взять тут).
1. В режиме просмотра (WinDjview) "чернобелый", картинка имеет вид

2. В режиме просмотра "цветной", картинка имеет вид


Как видно на рисунке, на 200-килограмовой люстре видны спиральки в цветном режиме , а в чернобелом режиме вообще нет никакой детализации.

Сначала я подумал что это просто подклеян задний план, но если переключится - то он пуст. В информации о странице видно:

 что раскрашен именно передний план.
Вопрос, как такое было сделанно?


3
DjVu / Разделение слоев в djvu-файле
« : 05 ёоЭм 2011, 00:04:48 »
Есть DjVu-файл в котором присутствует паразитный задний план и читабельный передний. Можно ли как-то убрать задний план в djvu, ди вообще, можно ли сохранять слои в разные файлы? У меня есть идя на счет djvuextract, но я не разобрался с ней.

4
Я так понимаю, что утилита DjVu-OCR от Gencho уже не развивается. Последняя версия DjVu-OCR 2.4 beta 4 худо-бедно работает с проектами FR 9, а c FR10 - вообще никак. Я придумал способ (может и велосипед изобрел) как можно внедрять OCR сделанный FR10 в DjVu-файл.

Алгоритм следующий:

1. Открываем FR10 и импортируем DjVu-файл (благо начиная с 9-й версии FR можгут это делать)
2. Выбираем нужный язык и распознаем.
3. Сохраняем полученный результат в PDF. В опциях сохранения в PDF:
    -  указываем в поле Default paper size -> Keep original image size (нужно для того чтобы размер страниц в PDF и DjVu были одинаковыми)
    -  указываем в поле Safe -> Text under the page image (для получения PDF c текстовым слоем )
4. Далее используем утилиту PDF To Djvu DUI  v. 2.1 by TrustFm и перегоняем полученній PDF в DjVu (в опциях нужно указать разрешение исходного DjVu-файла).
    - У меня в консольном окне утилиты на каждую страницу писало "PDF error: Invalid Font Weight " - нужно игнорировать и терпеливо ждать окончания. Влияния на конечный результат этих ошибок я не заметил.

Далее следуют два варианта на выбор:

5. Можно пользоваться готовым DjVu с OCR
6. Если вам не нравится полученный DjVu по каким-либо причинам (например, размером, качеством), то можно воспользоваться утилитой DjVu-OCR, извлеч OCR слой из полученного DjVu и внедрить в исходный DjVu.

Слегка изменено название темы - добавлена цифра "11" в связи с выходом FineReader 11 (monday2000).

5
У меня, почему-то после обработки СК стали пропадать тонкие перекресные черточни у букв "и" и "н". Раньше делал, все было ОК. Все установки беру из ScanAndShare1.07 .  Увеличение контраста увеличивает толшину букв, но вот черточки как были невидны, так и остались.

Раньше такого не замечал.

Уже не знаю на что грешить: на сканер, на опции сканирования или на опции СК.

Вот примеры http://ifolder.ru/23084700

6
Часто на страницах книг (еще до сканирования) попадаются те или иные огрехи, которые можно классифицировать так:
1. Орфографические ошибки (в слове не та буква)
2. Типографские кляксы
3. Разные чёркания и штрихи, вносимые бумагочитателями.
После сканирования, естественно, даные огреши присутствуют на сканах + вносятся дополнительные (о которых в этом посте не упоминаю).
Процесс выискивания таких огрехов довольно трудоемкий, но для истинного мазохиста-книгосканировщика - это наслаждение, хотя иногда, есть огрехи бросающиеся в глаза даже неискушенному книгосканировщику.

Для устранения подобных огрехов в Scan Kromsator предусмотрена прекрасная возможность править изображения после их обработки. Так если вы видите кляксу, которая закрывает вам одну или несколько букв, можно те же буквы скопировать из одного места изображения и вставить на место кляксы, так же можно и исправлять орфографические ошибки. Другими словами, в SK можно копипастить куски изображений. Более того, имеется возможность самому дорисовывать  буквы и знаки до требуемого вида.

В Scan Tailor подобного функционала я не заметил. Собственно вопрос, есть ли? А если нету, то когда?

Страницы: [1]