Главное > Linux

OCR CuneiForm в Ubuntu

(1/345) > >>

MetaSpirit:
Распознавание текста в ОС Linux доступно любому пользователю. Чтобы с легкостью распознать текст в операционной системе Linux есть OCR-система CuneiForm, которая служит для преобразования графических файлов в редактируемый текст. CuneiForm работает только из консоли, что существенно ограничивает круг людей, которые могут использовать данную программу.

Чтобы это исправить была разработана, на данный момент, лучшая графическая оболочка — YAGF. YAGF полностью раскрывает все возможности OCR-системы CuneiForm.

Для Linux CuneiForm представляет собой лишь движок для распознавания, а в качестве GUI используется программа YAGF.

Сильные стороны CuneiForm + YAGF:
Комплекс программ абсолютно бесплатен.
Довольно неплохие результаты распознования текста.
Результаты распознавания текста можно сохранить в формат html или text.
Есть возможность автоматической проверки орфографии при установленоном пакете aspell.
Большое количество поддерживаемых языков.
Красивый и эргономичный интерфейс.
Работа со сканером организована посредством Sane + XSane.

Слабые стороны CuneiForm + YAGF:
Нельзя сохранить результаты работы в текстовом документе, формат которого поддерживает сохранение форматирования текста: doc, odt, rtf и т. д.
Распознование текста, в некоторых случаях, еще далеко от идеального.

К сожалению, первый стабильный релиз версии 1.0 так и не появился в репозиториях Ubuntu. Поэтому будем ставить из .deb-пакетов или из PPA.

Можно подключить PPA от некоего Алекса (это не официальный репо):


--- Код: ---ppa:alex-p/notesalexp
--- Конец кода ---

Обновляем список пакетов и ставим:


--- Код: ---cuneiform-common

cuneiform-linux

yagf
--- Конец кода ---

Но у Алекса в PPA очень много сборок, и если не хочется обновлять некоторые пакеты до нестабильных версий, то можно установить подборку пакетов для Ubuntu 10.10 Maverick Meerkat:
для 32-битных сурикатов
для 64-битных сурикатов

В архиве 3 файла (приведены в порядке их установки):

* cuneiform-common_1.0.0+bzr525-1_all.deb
* cuneiform-linux_1.0.0+bzr525-1_XXX.deb
* yagf_0.8.3-1_XXX.deb
Запускаем "Приложения - Офис - YAGF" и все распознаем.

monday2000:
По поводу CuneiForm:

1. Как я понял, сейчас центр тяжести развития CuneiForm перенёсся с официального форума на проект CuneiForm-Linux. Жаль, что авторам CuneiForm теперь абсолютно наплевать на своё детище (после раскрытия его исходников).

2. CuneiForm не является полностью открытой системой. Там есть бинарные dat-файлы - с OCR-языками. Так вот, никто пока не знает их точной структуры - и не может их поэтому воссоздать.

Отсюда проистекает и невозможность, к примеру, обучать CuneiForm новым языкам распознавания (то есть, создавать новые dat-файлы - для новых OCR-языков).

Поэтому одной из важнейших задач развития CuneiForm на будущее является восстановление структуры и формата dat-файлов - и воссоздание программного инструментария по полноценной работе с dat-файлами.

Сделать это ИМХО реальней всего лишь путём анализа той части исходников CuneiForm, которая программно обращается к dat-файлам. Такой, почти "reverse-engineering". :)

Сделать это непременно нужно - иначе CuneiForm пока что даже нельзя назвать Open-Source системой (получается, что часть исходников CuneiForm фактически закрыта).

MetaSpirit:
Cuneiform развивается. Появился GUI к нему: Cuneiform-Qt — графический интерфейс для системы оптического распознавания символов Cuneiform
Небольшой список возможностей:

Общее:
    Значок приложения
    Контекстные меню действий для KDE
    Пакетный режим обработки
    Интеграция со ScanTailor

Движок распознавания:
    Использование библиотек напрямую
    Получение списка поддерживаемых языков и форматов из движка

Интерфейс:
    горизонтальное и вертикальное расположение панелей
    показывать параметры распознавания в строке состояния

Просмотр изображения:
    Получение изображения непосредственно со сканера
    Поддержка перетаскивания файлов на окно приложения
    Поддержка файлов на сетевых ресурсах
    Распознавание всех страниц многостраничного TIFF
    Интерактивный поворот отдельной страницы на заданный угол
    Регулирование тона, насыщенности, яркости
    Выделение области для распознавания
    Изменение масштаба
    Загрузка и распознавание документов PDF altbug #19542

Показ результата:
    Правка распознанного текста
    Открытие текста в LibreOffice
    Печать
    Проверка орфографии
    Поддержка файлов на сетевых ресурсах
    Меню «Правка» в основном меню
    Подтверждение выхода с несохранёнными данными

Варианты установки:
    из исходников
    скомпилированый rpm-пакет, который с помощью alien можно рпересобрать под debian дистрибутивы.

P.S. В том же репозитории Алекса есть програмка quneiform  - простой GUI к Cuneiform. Пока еще не сравнивал.

veala:
XV20BaReWaAlCaIIDVWiJiIrPYOrArSoRuRiPiSpXVGuCrGuTeTeSwYeBeEr
MiTrMoAdHiMiCrTaPaSuMaGrSkMiPlCrUVElOsThSiREPuSuXIRAAgAnCo
XIFiRaNoRACiNiCoCDClVowwGrFibuNiJoDaAdWaZiAgWiCEArZeZeonSw
PUZeIPDeArSwOmHohoAuEdSiCDIsLoXVWiIVSAMaXIMiYaNeCDRAThWiII
OrBrIPXXMBMaClWIMiMeLeIPYTOlWoCDReInRiARCDDjMoVaDoAiPoHeZh
WiWiInTeDyBrTaInTrwwCAWiXIArWiHuXVGOJaXVFrIIRiHaHoXILaChXX
DVThBoNePSDVIIDVWIKeDiMiSAXXXXCDChMoMoPaAlXXGPIIEnMeBiBoMi
poPuAdIPArLeRoBeIIFeThGiBaCDAnAlBeSo

veala:
ов64BeBeMTедWaDoBuзлSOBiBrWiFiCDOrEXTeFiашWhукнаThCDJoWiDePh
MAXXегомбоFlWeDoытниMaLGдаогниRLPhPiакCaабздSoарJoасhoноуд
одтоXXCaноомовкнThерRoLoтаCrWiKeкнPrRoздниBoJeIzодMaDVапзд
ISMiSiCDJeCoешолHaRNLPреKrедLeJoStосGiHoBiKeздJJFrBeCDHeBr
асляSiBrетFrElWoпомоPaSiRoвтplогазерDLMyерлиavVaFrреатигни
WiIITOGrReBoReOmWhажетXXFCдаAlтаниелниосзденIVедососWiDoос
XVтипоSuMiCDраPlтиENеросopосреQuкнетHoCDетEnInчеDVаштоедер
едGaерSiatашпоInоспоNoриBaудодXVвтос

Навигация

[0] Главная страница сообщений

[#] Следующая страница

Перейти к полной версии