Автор Тема: Сканирование книг: общие вопросы  (Прочитано 46496 раз)

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #15 : 23 БХЭвпСам 2010, 23:35:27 »
don555
Цитировать
С удовольствием скачал - бы этот учебник, но не качается.
Честно говоря, там нет ничего интересного. :)

А скачать его легко - закачайте этот файл на какой-нибудь файлообменник, поддерживающий удалённую закачку - допустим, ifolder.ru (а оттуда уже легко скачаете).
Цитировать
Очень долго сканировать.
Сканируйте в 300dpi, и обрабатывайте в СТ. СТ по умолчанию проинтерполирует 300 dpi в 600 dpi на выходе. По-моему, получается вполне нормально.

don555

  • Пользователь
  • **
  • Сообщений: 71
    • Просмотр профиля
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #16 : 24 БХЭвпСам 2010, 02:38:10 »
Сейчас скачал книжку. Раньше страница не открывалась. Но книга, к сожалению, написана на английском. Знаю ответ. Учи английский.
Просмотрю. Может, есть вещи, которые я не знаю.

don555

  • Пользователь
  • **
  • Сообщений: 71
    • Просмотр профиля
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #17 : 24 БХЭвпСам 2010, 02:40:20 »
Хочу спросить ещё об одной штуке.
Вы, monday2000 написали статью
“Устранение кривизны строк и перекоса текста в Book Restorer 4.1”,
за что вам огромное спасибо. К сожалению таких статей мало. Жаль, что не до конца развили тему. Там внутри “Geometrical correction”
 есть кнопка “more” с дополнительными опциями. Возможно, профи и так знают что к чему, а вот некоторые вроде меня не понимают, что там нужно сделать.
И всё равно это не спасает. Иногда после этой функции становится ещё хуже. Но всё же лучше, когда она существует.
Хочу спросить. При сканировании толстой книги, буквы, которые находятся ближе к корешку, загибаются. Если оставить это в pdf, то может и так сойти. Если делать в djvu, то получаются кривыми.
Существует ли графическая программа, которая может, как будто выгнуть лист снизу вверх, при этом сами буквы выравниваться. А потом уже редактируем дальше. Ведь есть программы, которые для красоты загибают уголок фотографии вниз. А наоборот?

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #18 : 06 ѕЪвпСам 2010, 11:28:04 »
don555
Цитировать
Возможно, профи и так знают что к чему, а вот некоторые вроде меня не понимают, что там нужно сделать.
К сожалению, об этом не знает никто. Потому что абсолютно полной инструкции к Book Restorer как не было, так и нет. :(
Цитировать
Существует ли графическая программа, которая может, как будто выгнуть лист снизу вверх, при этом сами буквы выравниваться.
Даже не знаю. Совсем уж сильно деформированные буквы вряд ли можно идеально распрямить. Но вообще это всё называется "Dewarping". Так что, не исключено, что в будущих версиях Scan Tailor Tulon всё-таки доведёт до ума свой Dewarping. Кстати, Dewarping в Scan Tailor будет с возможностью ручной правки (в виде сетки искривлений с ручными опорными точками) - что очень ценно. Да и я всё время занимаюсь Dewarping от Рамиза Зейналова http://www.djvu-scan.ru/forum/index.php?topic=61.0 - может, и там удастся добиться желаемого результата.

AnGr

  • Новичок
  • *
  • Сообщений: 6
    • Просмотр профиля
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #19 : 07 ѕЪвпСам 2010, 22:24:28 »
Здравствуйте. Имеется набор сканированных страничек книги (ок. 700). При создании из них djvu видно, что идущие друг за другом странички неодинаковы по размеру в ширину. Как из выровнять? Какую программу использовать для этого? Спасибо.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #20 : 08 ѕЪвпСам 2010, 10:49:09 »
AnGr
А Вы можете выложить на файлообменник этот DjVu-файл? Тогда было бы проще понять, в чём дело.

Вообще такой программы нет - т.е. специально для этого. Я в таких случаях приводил все страницы к одному размеру вручную.

Можно сделать так:

1. Разбить все страницы на группы по размерам. (отсортировать вручную)

2. Использовать ScanKromsator. Рассчитать новый размер для каждой группы - с проделать ресемплинг для каждой отдельной группы.

Как рассчитать размер:

Тут надо смотреть на длину и ширину в пикселях каждого скана, а также на DPI. Вот это почитайте: http://www.djvu-soft.narod.ru/scan/resampling.htm .

Я уже точно не помню, как именно это делается. Давайте свой DjVu-файл - и я тогда скажу точнее, что с ним делать. Можно на onlinedisk.ru загрузить (удобно).

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #21 : 18 ѕЪвпСам 2010, 22:55:40 »
Интересная статья:

LXF118:Компьютер слушает


http://tinyurl.com/37dspzr

Статья проводит сравнение открытых OCR-продуктов Tesseract и CuneiForm.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #22 : 20 ѕЪвпСам 2010, 11:18:04 »
Обсуждение сканирования книг (Биологический форум):

http://zoometod.mybb.ru/viewtopic.php?id=156

AnGr

  • Новичок
  • *
  • Сообщений: 6
    • Просмотр профиля
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #23 : 21 ѕЪвпСам 2010, 20:48:21 »
Вот книжка с разными размерами листочков:

http://www.onlinedisk.ru/file/536671/

Вот пример с одинаковыми:

http://www.onlinedisk.ru/file/536673/

Хочу добиться второго результата. Не подскажите, как?

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #24 : 22 ѕЪвпСам 2010, 09:50:23 »
AnGr
Цитировать
Хочу добиться второго результата. Не подскажите, как?
Да просто во первой книге некоторые страницы повёрнуты на 90 градусов - потому что там таблицы в альбомной ориентации - вот и всё. Это сделано для удобства чтения. Повернуть их назад можно программой Document Express Editor (5 или 6 версией). Она доступна тут: http://www.djvu-soft.narod.ru/soft/basic.htm . Но только зачем это нужно - если хотите сделать распечатку - так нынешние повёрнутые листы без проблем распечатаются - в такой же альбомной ориентации.

AnGr

  • Новичок
  • *
  • Сообщений: 6
    • Просмотр профиля
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #25 : 22 ѕЪвпСам 2010, 18:15:43 »
Дело не в том, в альбомной или нет. Просто полистайте первую книгу программой для чтения, например, WinDjVu. В первой будут первый и следующий листки (и последующие, конечно) будут на несколько сантиметров различаться по ширине - одна несколько шире, другая поуже.

Во второй же книжке, если ее листать, ВСЕ странички будут совершенно одинаковых размеров, (такой же результат получится, если Word переделать в Pdf, например).

Может, можно как бы "нарастить" одни листочки и пообрезать другие, чтобы они стали одинаковыми, как во второй книжке?

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #26 : 25 ѕЪвпСам 2010, 22:13:05 »
AnGr
Цитировать
Может, можно как бы "нарастить" одни листочки и пообрезать другие, чтобы они стали одинаковыми, как во второй книжке?
В Вашем конкретном случае оказалось достаточно просто прогнать книгу заново через Scan Tailor. В смысле, декодировать DjVu, прогнать книгу заново через Scan Tailor, закодировать назад в DjVu.

Но это ещё повезло - что разнобойность размеров совсем невелика. А вот если бы она была большой (разнобойность размеров) - тогда для каждой страницы нужно было бы вручную высчитывать и назначать поправочный DPI - и потом ресемплировать их все к новому единому размеру.

AnGr

  • Новичок
  • *
  • Сообщений: 6
    • Просмотр профиля
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #27 : 29 ѕЪвпСам 2010, 21:06:48 »
Спасибо!!! О программе Scan Tailor я не знал, использовал только СканКромсатор, но эти две программы разве не равноценны? Попытаюсь прогнать через Scan Tailor, посмотрим, что получится.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #28 : 30 ѕЪвпСам 2010, 13:56:29 »
AnGr
Цитировать
но эти две программы разве не равноценны?
Они близки по смыслу, но, конечно, одна от другой в чём-то лучше, в чём-то хуже.

Хотя, если честно признать - по мере развития Scan Tailor становится как-то стыдно - и как это раньше мы пользовались СканКромсатором? :'(

Вот ещё "Если бы губы Никанора Ивановича да приставить к носу Ивана Кузьмича" :) - то есть добавить в Scan Tailor кое-что остро там недостающее (а кое-что убрать) - так было бы вообще идеально.
« Последнее редактирование: 30 ѕЪвпСам 2010, 13:58:40 от monday2000 »

SorokaSV

  • Пользователь
  • **
  • Сообщений: 56
    • Просмотр профиля
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #29 : 31 ѕЪвпСам 2010, 01:13:01 »

Хотя, если честно признать - по мере развития Scan Tailor становится как-то стыдно - и как это раньше мы пользовались СканКромсатором? :'(

Вот ещё "Если бы губы Никанора Ивановича да приставить к носу Ивана Кузьмича" :) - то есть добавить в Scan Tailor кое-что остро там недостающее (а кое-что убрать) - так было бы вообще идеально.

А я и  сейчас в основном им пользуюсь. До идеала семь вёрст до небес, и все лесом - и (пока) SK совершенно незаменим!