Главное > Linux

DjVu-книгоделание в GNU/Linux (Debian, Ubuntu)

(1/532) > >>

MetaSpirit:
Итак, последовательность создания DjVu–документа примерно такова (на примере Ubuntu):

1 этап. Сканирование. (перенесено).

2 этап. Сканобработка.
Основным инструментом для сканобработки будет  Scan Tailor, т.к. есть нативная версия для Linux и ставится из стандартного репозитория Ubuntu или можно скачать с офф. сайта.

Дополнительно можно использовать windows-версии СканКромсатора, а также Book Restorer. Запускаются они через WINE (загрузчик Windows-программ). СК удалось запусть vv. 5.91 и 5.93, 5.92b работать отказалась. Book Restorer тоже работает, но только нормальная версия, не портабельная.

Дополнительно можно почитать "Обработка сфотографированых/отсканированных страниц документов с помощью imagemagick"

3 этап. Собственно DjVu-кодирование. Опционально: добавление текстового слоя, создание оглавления и алфавитного указателя, а также добавление метаинформации.

Литература к ознакомлению. Наиболее полно данный этап расписан в статье "Создание Djvu документов в Linux от А до Я", где автор использует DjVuLibre и ImageMagick. Создание документов DJVU в Linux  http://mydebianblog.blogspot.com/2008/05/djvu.html . Добавление текстового слоя, используя родные Linux-утилиты, расписано в статье "KBookOCR for Linux". Дополнительно можно почитатать "Улучшение качества DJVU книг".

Кодирование DjVu:
 - однопроходный DjVu кодер - img2djvu (спасибо m7876)
 - скрипт any2djvu-bw для кодирования Ч/Б изображений (автор не известен, нашел в просторах интернета)
monday2000

--- Цитировать --- - Для создания DjVu-книг под Linux существует ещё и такое давнишнее решение, как так называемый "Конвейер" от are: http://www.djvu-soft.narod.ru/soft/all2djvu.htm . По идее, он охватывает весь цикл создания DjVu-книги.
 - Print to DjVu through KPrinter  http://www.novell.com/coolsolutions/tools/17525.html
 - Scan to DjVu - http://www.novell.com/coolsolutions/tools/17462.html

--- Конец цитаты ---

Редактирование DjVu:
 - утилита djvupages (спасибо m7876)

--- Цитировать ---Она умеет удалять и перемещать страницы, резать файл на отдельные DjVu файлы, вырезать многостраничный фрагмент, конвертировать страницы в TIFF и даже посылать выбранную страницу в GIMP, а после редактирования кодировать заново и вставлять на место.
--- Конец цитаты ---
- didjvu - использует Gamera framework для разделения передних и задних слоев, которые потом могут быть закодированы в DjVu-файл.
 - djvusmooth — это графический редактор файлов DjVu, который позволяет:
  * редактировать метаданные документа,
  * редактировать структуру документа (закладки),
  * исправлять случайные ошибки в слое скрытого текста.

И еще, набор инстументов python-djvulibre для работы с библиотеки DjVuLibre, реализованный на Python.

Также можно использовать windows программы, запуская их через WINE.
Что мы имеем:
 - программы от Lizardtech. Консольные утилиты работают без проблем. Из GUI удалось запустить только Lizardtech DjVu Document Express Editor Pro 6.0.1 Build 1320 LE. Остальные не запустились, скорее всего из-за того, что требуют для своей работы .net Framework.
 - DjVu Small и DjVu Imager работают, но есть баг, когда выбираешь пункт открыть папку, то кнопка "ОК" неактивна в любом случае.
 - ABBYY FineReader 8.0 Professional Edition Multilanguage работает.
 - DjVu OCR v2.4beta работает.
 - единственный момент, во всех GUI программах долго выбираются несколько файлов через Ctrl, либо через Shift, на это время (от нескольких сек. до мин.) программа может не отвечать на запросы (или даже виснуть), но это проблема самого Вайна.


Пока на этом все. Тема будет дополнятся. Продолжение следует...

m7876:
Пробовали ли Вы img2djvu и djvupages (https://github.com/ashipunov) ?

monday2000:
MetaSpirit
Спасибо за тему, очень интересный и актуальный вопрос в принципе. Будем обсуждать. ;)

monday2000:
MetaSpirit

--- Цитировать ---1 этап. Сканирование книги. Для работы используется SANE.
--- Конец цитаты ---

Есть некое новшество - ScanTWAIN. Вот описание: http://www.linuxcenter.ru/news/2009/03/12/9316/ . Что это такое, любопытно. Кроме того, принят стандарт TWAIN 2.1, см. http://www.twain.org/ - что тоже может таить новые возможности (в т.ч. и для сканирования под Windows).

--- Цитировать ---2 этап. Сканобработка.
--- Конец цитаты ---
ИМХО сейчас можно полностью обойтись без СканКромсатора. Всё жизненно важное, что умеет делать СК, уметь делать и СТ.

--- Цитировать ---Book Restorer тоже работает.
--- Конец цитаты ---
Портабельный? Или обычный?

--- Цитировать ---3 этап. Собственно DjVu-кодирование.
--- Конец цитаты ---
Жаль, что под Линукс нет коммерческого специализированного решения. Точнее, есть Linux DjVu SDK - но его пока в глаза никто не видел. Его описание есть тут:
https://www.caminova.net/en/downloads/download.aspx?id=17

Остаётся лишь использовать Windows-DjVu-кодировщики под Linux. DjVuLibre-кодировщики (minidjvu, cjb2) - это, конечно, не очень серьёзно пока.
Оптимальнее всего ИМХО было бы суметь заставить работать documenttodjvu.exe (его можно взять из DjVu Small, например) под Linux. Этого было бы вполне достаточно - GUI для Линукса не очень актуален, но в случае необходимости его правильнее всего было бы сделать специально для Linux (не пытаясь заставить работать тот же DjVu Small под Linux).

--- Цитировать ---Консольные утилиты работают без проблем.
--- Конец цитаты ---
А как это делается? Тоже через WINE? А нет ли более простого варианта - как заставить работать тот же documenttodjvu.exe как-нибудь без WINE? Не существует ли своего рода "портабелизации" консольных Windows-утилит под Linux?
DjVu Imager вообще не следует пытаться переносить под Linux - разумнее сделать аналогичную программу прямо под Linux - что уже и было сделано: http://www.djvu-scan.ru/forum/index.php?topic=96.0 .

monday2000:

--- Цитировать ---- ABBYY FineReader 8.0 Professional Edition Multilanguage работает.
 - DjVu OCR v2.4beta работает.
--- Конец цитаты ---
Это хорошо, конечно. Но есть и альтернативный вариант - ABBYY FineReader под Linux: http://www.ocr4linux.com/ . Это командно-строчная программа, которая умеет к тому же экспортировать OCR-данные (с координатами) в XML (аналог hOCR) - что исключает необходимость в DjVu OCR.

Правда, я пока не слышал, чтобы кто-нибудь реально воспользовался этой программой. Да она ещё и не вылеченная пока. И не всем она нравится. Вот мнение are с Руборда:

--- Цитировать ---finereader/linux проработает год,потом поменяются системные библиотеки на линуксе и - привет.
--- Конец цитаты ---
Думаю, подробнее об этой программе можно расспросить на форуме ABBYY.

Для создания DjVu-книг под Linux существует ещё и такое давнишнее решение, как так называемый "Конвейер" от are: http://www.djvu-soft.narod.ru/soft/all2djvu.htm . По идее, он охватывает весь цикл создания DjVu-книги. Что там внутри - я точно не знаю, поскольку сам Линуксом не пользуюсь никаким.

Ещё материалы по теме:

Создание документов DJVU в Linux  http://mydebianblog.blogspot.com/2008/05/djvu.html

Просмотр DjVu под Linux:

Evince  http://projects.gnome.org/evince/

Okular  http://okular.kde.org/formats.php

Как-то я спросил у Леона Боту (он заядлый линуксод), как он создаёт DjVu - он ответил, что при помощи Any2DjVu Server http://any2djvu.djvuzone.org/ .

Ещё утилиты для сканирования-обработки под Linux:

gscan2pdf  http://gscan2pdf.sourceforge.net/ - сканирование в DjVu и PDF.

unpaper - http://unpaper.berlios.de/#download - обработка сканов ("предшественник" Scan Tailor, ИМХО вряд ли имеющий сейчас хоть какое-то значение).

Print to DjVu through KPrinter  http://www.novell.com/coolsolutions/tools/17525.html

Scan to DjVu - http://www.novell.com/coolsolutions/tools/17462.html

Навигация

[0] Главная страница сообщений

[#] Следующая страница

Перейти к полной версии