Автор Тема: Экзотические способы сканирования книг  (Прочитано 78423 раз)

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Кроме обычного сканирования-фотографирования, книги можно было бы, теоретически, оцифровывать и другими способами. Мне известны такие:

1. Есть такая технология - "лазерное сканирование". Даёт картинку в 3D. Возможно, полезно было бы для исправления искривленных строк.

2. Томограф. Это я сам придумал - "книжный томограф".  :) Сканирование страниц книги, даже не раскрывая её.

3. Инфракрасное фотографирование. Патент Google. Что-то там ради улучшенного исправления искривленных строк. А принцип непонятен...  ::)

Давайте обсудим. Может, кто ещё что знает по теме?

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Экзотические способы сканирования книг
« Ответ #1 : 28 ПЭТРам 2010, 15:40:17 »
Новый метод оцифровки книг занимает всего несколько секунд

http://www.infuture.ru/article/986

T-ya

  • Новичок
  • *
  • Сообщений: 19
    • Просмотр профиля
Re: Экзотические способы сканирования книг
« Ответ #2 : 29 ПЭТРам 2010, 06:56:58 »
Новый метод оцифровки книг занимает всего несколько секунд

Что-то совсем мутно написано... Они что, включили алгоритм распознавания капчей в OCR-программу? Причем здесь "несколько секунд"?

Цитировать
3. Инфракрасное фотографирование. Патент Google. Что-то там ради улучшенного исправления искривленных строк. А принцип непонятен...
 

Как я понимаю, одновременно с фотографированием на книгу проецируется инфракрасная сеточка. Если на ней есть искажения, то фотка страницы обрабатывается алгоритмом dewarping (выпрямление). Искажения сеточки дают информацию об участках, где страница лежит неровно (не плоско).

Японцы тоже использовали сходную идею:
Tokyo University presents novel book-scanning system, видео

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Экзотические способы сканирования книг
« Ответ #3 : 29 ПЭТРам 2010, 10:08:00 »
T-ya
Цитировать
Они что, включили алгоритм распознавания капчей в OCR-программу?
Да нет же, я предполагаю следующее: они просто сначала прогоняют страницу через OCR - чтобы локализовать буквы. Затем нарезают страницу на слова, и раздают слова в качестве каптчи.
Цитировать
Искажения сеточки дают информацию об участках, где страница лежит неровно (не плоско).
Вот только непонятно - а чем же так хорош именно инфракрасный диапазон? Вот про новый VueScan тоже мелькала инфа, что он использует "инфракрасный режим" :o
Цитировать
Японцы тоже использовали сходную идею:
Оригинально: использовать лазер для детекции 3-мерного искажения страницы. Надо будет подумать - а не нельзя ли сделать такую самодельную установку? А что - лазер несложно выдрать из старого DVD. :)
По крайней мере, если дооснастить каретку обычного сканера таким лазером - то можно будет при каждом акте отсканирования получать ещё и картину 3-мерного изгиба страниц.

Я сделал зеркало этого видео ( http://www.plasticpals.com/?p=12387 )
http://www.djvu-soft.narod.ru/scan/book_flip_scanning.rar (2,77 МБ)
« Последнее редактирование: 29 ПЭТРам 2010, 10:28:33 от monday2000 »

T-ya

  • Новичок
  • *
  • Сообщений: 19
    • Просмотр профиля
Re: Экзотические способы сканирования книг
« Ответ #4 : 29 ПЭТРам 2010, 10:34:52 »
Цитировать
а чем же так хорош именно инфракрасный диапазон
Думаю тем, что он не виден на фотках, сделанных обычной камерой. Сеточка одновременно фотографируется другим аппаратом, который видит только инфракрасное свечение на страницах.
Было бы интересно, конечно, найти образцы картинок до и после гуглевского деварпинга. Наверно в патенте есть иллюстрации.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Экзотические способы сканирования книг
« Ответ #5 : 29 ПЭТРам 2010, 16:04:28 »
А, теперь понял. Кстати - если там сеточка - то это означает, скорее всего, именно лазер - и в инфракрасном диапазоне.

T-ya

  • Новичок
  • *
  • Сообщений: 19
    • Просмотр профиля
Re: Экзотические способы сканирования книг
« Ответ #6 : 10 ДХТаРЫм 2010, 10:42:46 »
Вот, случайно наткнулась на еще один аппарат для книгосканирования (Zeutschel book scanner):
http://www.youtube.com/watch?v=QmqIhMrWkZ8

Как-то умудряются выпрямлять картинки на основе анализа изображений с 2х камер. "Worldwide unique correction method" говорят. То, что стеклом не накрывают и ИК не используют - это типа достоинство аппарата:  ценные старые книги не портятся.
http://www.zeutschel.com/products/software_perfect_book.html

Интересно, что освещают страницы не целиком, а узкой движущейся световой полоской. Зачем - непонятно. Как обычно, нарисовали мультик, а образцы работ не дают :(

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Экзотические способы сканирования книг
« Ответ #7 : 11 ДХТаРЫм 2010, 12:03:34 »
T-ya
А мне кажется, тут всё довольно ясно. Они используют лазер для получения 3-мерного рельефа. Там на видео видны же зелёненькие лучи лазера:

http://www.djvu-soft.narod.ru/scan/zeutschel_video.rar (3,65 МБ)

(Видео выкачано с http://www.youtube.com/watch?v=QmqIhMrWkZ8)

В общем, я опять подумал, что в принципе можно дооснастить обычный сканер лазером (из DVD) и точно также получать 3-мерный рельеф. Имея рельеф, dewarping сделать гораздо проще и точнее, чем без него.

T-ya

  • Новичок
  • *
  • Сообщений: 19
    • Просмотр профиля
Re: Экзотические способы сканирования книг
« Ответ #8 : 11 ДХТаРЫм 2010, 12:40:41 »
Вот с их старого сайта поподробнее статья:
http://zeutschel.k0v.de/kunde/kunde/zeutschel/jsp/newsDetail_en.jsp?kundeId=zeutschel&zeilenId=33&jahr=2009
Цитировать
The design of “Perfect Book” is based on a stereo vision system which captures the 3D surface contour of the page during the scanning process. In addition to the usual high resolution line-scanning camera (marked in yellow) the capture of the 3D data requires an additional standard USB camera with VGA resolution (640 x 480 pixels), which functions as a so-called surface or matrix camera (marked in green).
Using the line-scanning camera an image is created in reproducible form. A band of light, whose movement is synchronised with the line-scanning camera at a reproducible speed, is used to illuminate the object during scanning. The image illuminated by the moving band of light is recorded by a fixed matrix camera in a sequence of images with a defined frame rate. Using specialised calculation algorithms the surface contour of the scanned page can be reconstructed from the image frequency as recorded by the matrix camera and as a second stage this can be transformed into a flat surface.
By simultaneously using two calibrated imaging systems working from different angles a high level of correction quality can be achieved. The effects of obscured or damaged book edges – as occur with purely mathematical processes – are eliminated with “Perfect Book”.
The line-scanning camera and surface camera are combined to create an exact, virtual 3D surface model of the book on the scanning platform. The computed 3D surface contour is derived from a defined system of coordinates which is set by calibrating the whole system.

Все равно малопонятно, но лазер у них нигде не упоминается. Результаты коррекции хвалят:
http://business.highbeam.com/436156/article-1G1-184538896/perfect-book-part-concluding-our-article-zeutschel

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Экзотические способы сканирования книг
« Ответ #9 : 18 ЅЮпСам 2010, 22:58:21 »
Статья:

Терагерцевый луч позволит прочесть закрытую книгу

http://www.membrana.ru/print.html?1014918840

Очень интересная и перспективная информация. Надо же - а я тоже, независимо от них, ещё несколько лет назад пришёл к идее терагерцевого сканнера для книг.

Потому что это самая изящная идея в плане техники сканирования: она устраняет необходимость перелистывать книгу в процессе сканирования.

qgl

  • Гость
Re: Экзотические способы сканирования книг
« Ответ #10 : 19 ЅЮпСам 2010, 02:40:20 »
Цитировать
Японцы тоже использовали сходную идею:
Tokyo University presents novel book-scanning system, видео
Book Flipping Scanning

don555

  • Пользователь
  • **
  • Сообщений: 71
    • Просмотр профиля
    • E-mail
Re: Экзотические способы сканирования книг
« Ответ #11 : 19 ЅЮпСам 2010, 11:59:11 »
Вот такой сканер реальнее.
i2s Copibook Book Scanner from IImage Retrieval
http://www.youtube.com/watch?v=PNlp_tN1kaQ&feature=related

http://www.i2s-bookscanner.com/produits.asp?gamme=1003&sX_Menu_selectedID=left_1003_MOD
CopiBook HD (color)
Maximum scanning format: 2 × DIN A3 / 420x640 (25.2")
Optical resolution:
- 400 pixels per inch on A2 format (DIN 2 x A3) for CopiBook HD 400
- 600 pixels per inch on A2 format (DIN 2 x A3) for CopiBook HD 600
Auto focus
Automatic format detection
2 × DIN A3 scanning time: 5.9 seconds in color (400 dpi) and 9 seconds in color (600 dpi)
Real time preview
Formats supported: TIFF, TIFF G4, Multi pages TIFF, JPEG, BMP, PDF, JPEG2000

Motorized book cradle: 10 cm / 10 kg
Self opening glass

Alfizik

  • Новичок
  • *
  • Сообщений: 27
    • Просмотр профиля
Re: Экзотические способы сканирования книг
« Ответ #12 : 09 ґХЪРСам 2010, 15:31:57 »
2. Томограф. Это я сам придумал - "книжный томограф".  :) Сканирование страниц книги, даже не раскрывая её.

Статья:

Терагерцевый луч позволит прочесть закрытую книгу

http://www.membrana.ru/print.html?1014918840

Очень интересная и перспективная информация. Надо же - а я тоже, независимо от них, ещё несколько лет назад пришёл к идее терагерцевого сканнера для книг.

Потому что это самая изящная идея в плане техники сканирования: она устраняет необходимость перелистывать книгу в процессе сканирования.

В одном из номеров журнала ЮныйТехник 80-х годов была краткая заметка о созданном советскими ученными установки позволяющей используя радиоволны читать книг не открывая их. Говорилось, что установка была создана для археологов, так как древние тексты бывают рассыпаются если их попытаться пролистать.
Правда упоминался и недостаток, на "прочтение" одного символа уходит несколько минут.
Думаю с тех пор ничего принципиально нового не придумали, так что подобные "томографы" не для обычного применения, слишком медленно.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Экзотические способы сканирования книг
« Ответ #13 : 09 ґХЪРСам 2010, 18:30:07 »
Alfizik
Цитировать
Думаю с тех пор ничего принципиально нового не придумали,
Да, принципиально ничего не изменилось. Но прогресс всё равно есть - компьютеры радикально улучшились - а значит, увеличилась скорость расшифровки полученного сигнала. И ещё - изюминка в использовании терагерцевого излучения - которое самым оптимальным образом подходит для этой задачи.

Ещё были изобретены с тех пор рентгеновские линзы и терагерцевые лазеры, которые позволяют лучше управлять потоком ЭМ-волн из терагерцевого диапазона.

Ссылки:

http://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D1%80%D0%B0%D0%B3%D0%B5%D1%80%D1%86%D0%BE%D0%B2%D0%BE%D0%B5_%D0%B8%D0%B7%D0%BB%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5

http://www.membrana.ru/articles/inventions/2004/03/11/171700.html
« Последнее редактирование: 09 ґХЪРСам 2010, 18:32:54 от monday2000 »

Alfizik

  • Новичок
  • *
  • Сообщений: 27
    • Просмотр профиля
Re: Экзотические способы сканирования книг
« Ответ #14 : 10 ґХЪРСам 2010, 11:16:48 »
monday2000, Вы представляете сколько все это будет стоить? И какого размера будет? Все это экзотика, и не то что для домашнего, а даже для библиотечного дела не подходит.
Применение такой техники оправдано только для рассыпающихся документов возраст которых исчисляется тысячелетиями.
И если с буквами допустим такой сканер и будет справляться быстро (если прогресс действительно в этом деле преуспел), то на иллюстрации застрянет на долго.

Какой смысл бить из пушки по воробьям...