Просмотр сообщений

В этом разделе можно просмотреть все сообщения, сделанные этим пользователем.


Темы - MetaSpirit

Страницы: [1]
1
Linux / OCR CuneiForm в Ubuntu
« : 22 ПЭТРам 2011, 14:23:26 »
Распознавание текста в ОС Linux доступно любому пользователю. Чтобы с легкостью распознать текст в операционной системе Linux есть OCR-система CuneiForm, которая служит для преобразования графических файлов в редактируемый текст. CuneiForm работает только из консоли, что существенно ограничивает круг людей, которые могут использовать данную программу.

Чтобы это исправить была разработана, на данный момент, лучшая графическая оболочка — YAGF. YAGF полностью раскрывает все возможности OCR-системы CuneiForm.

Для Linux CuneiForm представляет собой лишь движок для распознавания, а в качестве GUI используется программа YAGF.

Сильные стороны CuneiForm + YAGF:
Комплекс программ абсолютно бесплатен.
Довольно неплохие результаты распознования текста.
Результаты распознавания текста можно сохранить в формат html или text.
Есть возможность автоматической проверки орфографии при установленоном пакете aspell.
Большое количество поддерживаемых языков.
Красивый и эргономичный интерфейс.
Работа со сканером организована посредством Sane + XSane.

Слабые стороны CuneiForm + YAGF:
Нельзя сохранить результаты работы в текстовом документе, формат которого поддерживает сохранение форматирования текста: doc, odt, rtf и т. д.
Распознование текста, в некоторых случаях, еще далеко от идеального.

К сожалению, первый стабильный релиз версии 1.0 так и не появился в репозиториях Ubuntu. Поэтому будем ставить из .deb-пакетов или из PPA.

Можно подключить PPA от некоего Алекса (это не официальный репо):

ppa:alex-p/notesalexp
Обновляем список пакетов и ставим:

cuneiform-common

cuneiform-linux

yagf

Но у Алекса в PPA очень много сборок, и если не хочется обновлять некоторые пакеты до нестабильных версий, то можно установить подборку пакетов для Ubuntu 10.10 Maverick Meerkat:
для 32-битных сурикатов
для 64-битных сурикатов

В архиве 3 файла (приведены в порядке их установки):
  • cuneiform-common_1.0.0+bzr525-1_all.deb
  • cuneiform-linux_1.0.0+bzr525-1_XXX.deb
  • yagf_0.8.3-1_XXX.deb

Запускаем "Приложения - Офис - YAGF" и все распознаем.

2
Основным АРI в GNU/Linux для работы используется SANE.
Цитировать
Scanner Access Now Easy — интерфейс прикладного программирования (API), который предоставляет стандартизированный доступ к устройствам сканирования растровых изображений (планшетные сканеры, ручные сканеры, видео- и фото-камеры, устройства видеозахвата и т. д.). SANE API является общественным достоянием и открыт для всеобщего обсуждения и разработки.
Графические оболочки для SANE:
 - Simple Scan — это упрощённая графическая оболочка, использующая SANE, интегрирующаяся в среду рабочего стола GNOME. Написана Робертом Энселлом из Canonical Ltd. для Linux. Simple Scan вошла в состав Ubuntu 10.04 и 10.10.
 - Flegita — графическая оболочка для SANE, написанная для GNOME Этьеном Берсаком. Часть проекта GNOME Scan. Имеется плагин для GIMP. Ставится со стандартного репозитория.
 - XSane — графическая оболочка для SANE, написанная Oliver Rauch, для работы со сканером. Xsane может быть запущена как отдельная программа, так и из GIMP. При автономном запуске XSane может сохранять отсканированные изображения в разных форматах, распечатывать их, использоваться другими программами для работы с факсами. Наиболее продвинутая программа для сканирования. Ставится со стандартного репозитория.
Сильные стороны XSane:
  • Большое количество настроек.
  • Быстрое сканирование в файл формата JPEG, PDF, PNG, PNM, PostScript, TEXT, TIFF.
  • Возможность настроить сканирование в файл с уникальным именем. Эта функция очень удобна при ручном сканировании большого количества страниц.
  • Возможность пакетного сканирования.
  • Программа «доработана» в сторону пользователя.
Слабые стороны XSane:
  • все нужные окна программы не умещаются на одном рабочем столе. Выручает переключатель рабочих столов.
- Kooka еще одна программа для сканирования, но для рабочего окружения KDE:
Цитировать
Kooka -- это программа сканирования с открытыми исходными кодами для системы GNU/Linux, основанная на программе SANE и библиотеке KScan.
Kooka поможет вам задать наиболее важные параметры сканирования, выбрать подходящий формат файла для сохранения и обработать отсканированные изображения. Она предлагает поддержку для различных модулей распознавания символов. Libkscan, автономная часть Kooka, обеспечивает функцию сканирования для лёгкого совместного использования со всеми приложениями KDE.
Установите пакеты ocrad или gocr, если нужно выполнить распознавание символов в Kooka.
Этот пакет является частью компонента модуля KDE graphics. Для более подробной информации смотрите пакеты 'kde' и 'kdegraphics'.

Есть некое новшество - ScanTWAIN. Вот описание: http://www.linuxcenter.ru/news/2009/03/12/9316/ . Что это такое, любопытно. Кроме того, принят стандарт TWAIN 2.1, см. http://www.twain.org/ - что тоже может таить новые возможности (в т.ч. и для сканирования под Windows). (Заметка от monday2000)

Примечание: как вариант, для промежуточного графического формата (если в дальнейшем будут использоватся только *nix программы) использовать PNM: цветные (PPM), полутоновые (PGM) и чёрно-белые (PBM), т.к.  DjVuLibre не работает с *.tiff

Также рекомендую ознакомится со статьей "Сканирование изображений и документов в  GNU/LINUX на примере EPSON PERFECTION 1270"
Цитировать
Практическое руководство (версия 2.0). Оглавление
     Введение
1. Сканирование с использованием программы XSane
    1.1. Интерфейс программы XSane
    1.2. Сканирование отдельного изображения в программе XSane
    1.3. Сканирование в XSane с созданием многостраничного документа
    1.4. Пакетное сканирование с помощью программы XSane
2. Сканирование с использованием консольной программы scanimage
    2.1. Описание параметров программы scanimage
    2.2. Сканирование отдельных изображений с помощью scanimage
    2.3. Пакетное сканирование с помощью программы scanimage
3. Сканирование в графический редактор Gimp
4. Сканирование с помощью программы xscanimage
    4.1. Интерфейс программы xscanimage
    4.2. Настройка параметров xscanimage при сканировании

3
Linux / DjVu-книгоделание в GNU/Linux (Debian, Ubuntu)
« : 10 ПЭТРам 2011, 12:29:28 »
Итак, последовательность создания DjVu–документа примерно такова (на примере Ubuntu):

1 этап. Сканирование. (перенесено).

2 этап. Сканобработка.
Основным инструментом для сканобработки будет  Scan Tailor, т.к. есть нативная версия для Linux и ставится из стандартного репозитория Ubuntu или можно скачать с офф. сайта.

Дополнительно можно использовать windows-версии СканКромсатора, а также Book Restorer. Запускаются они через WINE (загрузчик Windows-программ). СК удалось запусть vv. 5.91 и 5.93, 5.92b работать отказалась. Book Restorer тоже работает, но только нормальная версия, не портабельная.

Дополнительно можно почитать "Обработка сфотографированых/отсканированных страниц документов с помощью imagemagick"

3 этап. Собственно DjVu-кодирование. Опционально: добавление текстового слоя, создание оглавления и алфавитного указателя, а также добавление метаинформации.

Литература к ознакомлению. Наиболее полно данный этап расписан в статье "Создание Djvu документов в Linux от А до Я", где автор использует DjVuLibre и ImageMagick. Создание документов DJVU в Linux  http://mydebianblog.blogspot.com/2008/05/djvu.html . Добавление текстового слоя, используя родные Linux-утилиты, расписано в статье "KBookOCR for Linux". Дополнительно можно почитатать "Улучшение качества DJVU книг".

Кодирование DjVu:
 - однопроходный DjVu кодер - img2djvu (спасибо m7876)
 - скрипт any2djvu-bw для кодирования Ч/Б изображений (автор не известен, нашел в просторах интернета)
monday2000
Цитировать
- Для создания DjVu-книг под Linux существует ещё и такое давнишнее решение, как так называемый "Конвейер" от are: http://www.djvu-soft.narod.ru/soft/all2djvu.htm . По идее, он охватывает весь цикл создания DjVu-книги.
 - Print to DjVu through KPrinter  http://www.novell.com/coolsolutions/tools/17525.html
 - Scan to DjVu - http://www.novell.com/coolsolutions/tools/17462.html

Редактирование DjVu:
 - утилита djvupages (спасибо m7876)
Цитировать
Она умеет удалять и перемещать страницы, резать файл на отдельные DjVu файлы, вырезать многостраничный фрагмент, конвертировать страницы в TIFF и даже посылать выбранную страницу в GIMP, а после редактирования кодировать заново и вставлять на место.
- didjvu - использует Gamera framework для разделения передних и задних слоев, которые потом могут быть закодированы в DjVu-файл.
 - djvusmooth — это графический редактор файлов DjVu, который позволяет:
  * редактировать метаданные документа,
  * редактировать структуру документа (закладки),
  * исправлять случайные ошибки в слое скрытого текста.

И еще, набор инстументов python-djvulibre для работы с библиотеки DjVuLibre, реализованный на Python.

Также можно использовать windows программы, запуская их через WINE.
Что мы имеем:
 - программы от Lizardtech. Консольные утилиты работают без проблем. Из GUI удалось запустить только Lizardtech DjVu Document Express Editor Pro 6.0.1 Build 1320 LE. Остальные не запустились, скорее всего из-за того, что требуют для своей работы .net Framework.
 - DjVu Small и DjVu Imager работают, но есть баг, когда выбираешь пункт открыть папку, то кнопка "ОК" неактивна в любом случае.
 - ABBYY FineReader 8.0 Professional Edition Multilanguage работает.
 - DjVu OCR v2.4beta работает.
 - единственный момент, во всех GUI программах долго выбираются несколько файлов через Ctrl, либо через Shift, на это время (от нескольких сек. до мин.) программа может не отвечать на запросы (или даже виснуть), но это проблема самого Вайна.


Пока на этом все. Тема будет дополнятся. Продолжение следует...

4
DjVu / Удаление водяных знаков из DjVu-книги
« : 15 БХЭвпСам 2010, 17:47:04 »
Ув. коллеги. Помогите убрать либо отредактировать водяные знаки из DjVu-книги, созданные через Lizardtech DjVu Document Express Enterprise v5.1.0.
P.S. Нашел справочник в интернете, но водяные знаки в этой книге иногда перекрывают справочную информацию, что их невозможно прочитать из-за этого.

Страницы: [1]