Автор Тема: Алгоритмы повышения качества скан изображений  (Прочитано 5122 раз)

AlexN

  • Новичок
  • *
  • Сообщений: 4
    • Просмотр профиля
    • E-mail
Данный топик предназначен для обсуждения алгоритмов по повышению качества скан изображений, таких как определение ориентации страницы, разделение  страниц, устранение наклона изображения и т.д.

AlexN

  • Новичок
  • *
  • Сообщений: 4
    • Просмотр профиля
    • E-mail
Предлагаю обсуждение начать с алгоритмов определения ориентации страницы и устранение наклона (Deskew).
Возьмем реализации алгоритма из проекта PageTools, перебитую monday2000, в которой используется быстрое преобразование Радона:
http://www.djvu-soft.narod.ru/bookscanlib/008.htm
Функция FindSkew, действительно хорошо работает, достаточно высокая скорость работы и точность.  Как работает алгоритм пока не ясно (только начинаю с ним разбираться). Считаю, коллективно нам разобраться будет легче и быстрее, впоследствии можем подумать о возможной оптимизации алгоритма.
Что касается алгоритмов определения ориентации. Честно говоря исходников я не нашел, есть пару статей на английском и все. Пытался решить задачу сам, статистическим методом: результат был только на сканах хорошего качества и угла наклона не более 4 градусов.
Возможно, у кого то есть исходники, было бы интересно посмотреть и обсудить.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
AlexN
Добро пожаловать!
Цитировать
Как работает алгоритм пока не ясно.
Попробую тоже посмотреть на него.
Цитировать
Что касается алгоритмов определения ориентации. Честно говоря исходников я не нашел, есть пару статей на английском и все.
А вот этот: http://www.codeproject.com/KB/graphics/Deskew_an_Image.aspx - я не смотрел, но, похоже, это иной алгоритм, построенный на Hough-преобразовании - а не на преобразовании Радона.

Или же вот: http://www.leptonica.com/skew-measurement.html . Исходник там есть - тут: http://www.leptonica.com/download.html . В Scan Tailor вроде бы Deskew именно из Leptonica.
Цитировать
результат был только на сканах хорошего качества и угла наклона не более 4 градусов.
у Вас есть картинки-примеры? Было бы неплохо (хотя, конечно, можно и самому крутануть текст на угол побольше).

AlexN

  • Новичок
  • *
  • Сообщений: 4
    • Просмотр профиля
    • E-mail
В ScanTailor, как вкратце мне сообщил автор, Deskew делается путем поиска такого угла наклона, который максимизирует различия соседних строк в терминах количества черных пикселей.  Сначала делается итеративный поиск с шагом 1 градус, а потом бинарный поиск в сторону лучшего результата. За подробностями естественно в исходники. В перспективе было бы здорово разобраться и с этим алгоритмом.
Вообщем с алгоритмом Deskew дела обстоят не плохо, есть исходники, статьи и главное желание разобраться, а что касается исправления ориентации: в ST исправление ориентации оставлено в ручном режиме, а нас интересует максимальная автоматизация процесса скан обработки.

AlexN

  • Новичок
  • *
  • Сообщений: 4
    • Просмотр профиля
    • E-mail
Для тестирования своих методов я взял 100 отличных сканов наклоненных на произвольный угол, для примера:
http://ifolder.ru/16673435
Я иду таким путем: сначала тестирую метод на идеальных сканах, исследую точность, скорость, затем ухудшаю качество сканов и уже исследую и оптимизирую методы для общих случаев на примере отсканеных мною книг. Возможно, кто- то не согласен с таким подходом, вы меня поправьте.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
AlexN
Я посмотрю на всё это после праздников, а то сейчас небольшая запарка. ;)

woodyfon

  • Новичок
  • *
  • Сообщений: 7
    • Просмотр профиля
Каждый алгоритм имеет матч. часть. Алгоритм на бумаге может существенно отличатся от алгоритма в исходниках.  Поэтому изначально нужно составить так сказать теорию алгоритмов и уже потом пыпаться закодить его. А не наоборот - писать алгоритм основываясь на исходниках.
Интересует алгоритм сегментации изображения - т.е. разложение скана на текстовый блок и картинку.

Евгений

  • Новичок
  • *
  • Сообщений: 2
    • Просмотр профиля
    • E-mail
Установил программу BookRestorer TryOut v4.2.1 и руссифицировал, прога с этого сайта и руссификатор скачан с той же странички. деинсталировал и снова поставил но в окне реставрация +инструменты горит тока преобразование цвета а не все функции где грабли и добавить никак не могу, раньше на старой машине успешно пользовался праил кривизну строк правда не помню тока какая версия проги была, но работала очень хорошо, сейчас не могу перепробовал все установил из русификатора BookRestorer v4.2.1 таже хрень может кто знает где копать, операционка WinXP SR3 

yuree

  • Постоялец
  • ***
  • Сообщений: 172
    • Просмотр профиля
    • E-mail
Установил программу BookRestorer TryOut v4.2.1 и руссифицировал, прога с этого сайта и руссификатор скачан с той же странички. деинсталировал и снова поставил но в окне реставрация +инструменты горит тока преобразование цвета а не все функции где грабли и добавить никак не могу, раньше на старой машине успешно пользовался праил кривизну строк правда не помню тока какая версия проги была, но работала очень хорошо, сейчас не могу перепробовал все установил из русификатора BookRestorer v4.2.1 таже хрень может кто знает где копать, операционка WinXP SR3

Такая же "хрень" была у меня. Люди добрые подсказали что русифицировать не надо. Итак, в Вашем случае. Снесите БукРесторер, почистите от "хвостов", почистите реестр, перегрузите тачку (на всякий пожарный), установите Book Restorer v4.2.1 Eng или Book Restorer v4.2.1 Eng Portable отсюда → http://www.djvu-soft.narod.ru/soft/#djvu не русифицируйте.

Евгений

  • Новичок
  • *
  • Сообщений: 2
    • Просмотр профиля
    • E-mail
Спасибо. После праздников попрбую, первоначально я устанавливал BookRestorer TryOut v4.2.1 без руссификатора была таже хрень, может поставить 4.1 не сравнивали как в работе, что лучше 4.1 или 4.2.1  я вчера загрузил прогу 4.2.1 в ресторатор полазил по ней там написано что она демонстрационная

Comikosnub

  • Новичок
  • *
  • Сообщений: 2
    • ICQ клиент - 315536478
    • MSN клиент - senkeevika1971@yandex.ru
    • Просмотр профиля
    • E-mail
Алгоритмы повышения качества скан изображений
« Ответ #10 : 22 ґХЪРСам 2015, 03:50:35 »
бред одним словом

BenjaminDA

  • Новичок
  • *
  • Сообщений: 1
    • ICQ клиент - 368733644
    • Просмотр профиля
    • E-mail
Начни копать в сторону классических корреляционно-экстремальных алгоритмов распознавания, это азбука, а там может зацепишься за то, что тебе нужно.