Автор Тема: Сканирование книг: общие вопросы  (Прочитано 46500 раз)

don555

  • Пользователь
  • **
  • Сообщений: 71
    • Просмотр профиля
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #45 : 30 ПЭТРам 2011, 20:47:43 »
Можно программой PS PDF-XChange Viewer  привести все страницы pdf к одному размеру. У меня разные файлы jpg, разного размера, соединены в pdf. Очень неудобно просматривать. Может другая прога может?

Eugeen1948

  • Пользователь
  • **
  • Сообщений: 59
    • Просмотр профиля
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #46 : 31 ПЭТРам 2011, 09:35:15 »
Надо просто напечатать PDF-принтром свой файл, п этом выбрать размер стрнцы  и другие параметры выходного файла. Печать можно делать из Акробата.

don555

  • Пользователь
  • **
  • Сообщений: 71
    • Просмотр профиля
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #47 : 31 ПЭТРам 2011, 19:55:50 »
Не совсем понял, как сделать.

Eugeen1948

  • Пользователь
  • **
  • Сообщений: 59
    • Просмотр профиля
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #48 : 01 ДХТаРЫм 2011, 01:03:14 »
В Adobe Acrobat есть виртуальный принтер, называется он "Adobe PDF". Выставляете в параметрах у него нужный формат страницы (напр. А4) и "печатаете" свой файл PDF в удобную для Вас директорию.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #49 : 01 ДХТаРЫм 2011, 14:38:09 »
Новые программы для обработки сканов.

SyBookMaker
http://sysoftix.ru/sybookmaker
Бесплатна для некоммерческого использования.

Atiz BookDrive Editor Pro

http://www.atiz.ru/page.jsp?pk=node_1233132256310
Платная.

Обе программы - плохие и неинтересные. Но примечательно, что они вообще хотя бы появились на свет.

don555

  • Пользователь
  • **
  • Сообщений: 71
    • Просмотр профиля
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #50 : 01 ДХТаРЫм 2011, 19:58:27 »
В Adobe Acrobat есть виртуальный принтер, называется он "Adobe PDF". Выставляете в параметрах у него нужный формат страницы (напр. А4) и "печатаете" свой файл PDF в удобную для Вас директорию.
Ты уж прости за назойливость, не могу найти. У меня 2 программы.
1.Portable Adobe Acrobat Pro 9.3.4 EngRus
2.Adobe Acrobat X Pro 10.0.0
Не нашёл я там опции Адобе PDF. Будь добр напиши, как добраться по меню. Желательно в Portable Adobe Acrobat Pro 9.3.4 EngRus

Eugeen1948

  • Пользователь
  • **
  • Сообщений: 59
    • Просмотр профиля
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #51 : 05 ДХТаРЫм 2011, 21:34:26 »
В Adobe Acrobat есть виртуальный принтер, называется он "Adobe PDF". Выставляете в параметрах у него нужный формат страницы (напр. А4) и "печатаете" свой файл PDF в удобную для Вас директорию.
Ты уж прости за назойливость, не могу найти. У меня 2 программы.
1.Portable Adobe Acrobat Pro 9.3.4 EngRus
2.Adobe Acrobat X Pro 10.0.0
Не нашёл я там опции Адобе PDF. Будь добр напиши, как добраться по меню. Желательно в Portable Adobe Acrobat Pro 9.3.4 EngRus
Открываешь свой файл Акробатом (не портабельным). Нажимешь клавишу Print. Вываливается меню печати. В самой вехней строке меню выбираешь нужный принтер: Adobe PDF. Рядом жмешь кнопку "Properties" и входишь в меню свойств принтера.
Сразу видишь 4 строки с подменю. В последней и есть установка размера страницы, обычно А4, но можешь делать свою. Там еще куча полезных опций, надо просто потренироваться, потом все будешь делать "на автомате". Можешь сделать и свою конфигурацию для принтера и потом ею пользоваться по умолчанию.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #52 : 07 ДХТаРЫм 2011, 17:58:01 »
Один из популярных вопросов:

Как обработать и сохранить сканы цветных журналов?

Обработать - в Scan Tailor. По поводу формата сохранения:

Есть 2 варианта:

1. DjVuPhoto. Подробности - http://www.djvu-soft.narod.ru/scan/djvu_small.htm Пункт "3. Профиль кодирования":
Цитировать
Для кодирования в DjVu цветных сканов (фотографий или обложек книг) рекомендуется использовать профиль Photo. Он создаёт DjVu-файл максимального размера - но зато с самым хорошим визуальным качеством.
2. JPEG2000. Берёте Adobe Acrobat Professional и сохраняете свои сканы в PDF со сжатием JPEG2000.

Оба варианта сходны по принципу действия (вейвлетное сжатие) и по качеству. Наверное, и размер сопоставим.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #53 : 22 ДХТаРЫм 2011, 11:49:53 »
При сканировании книг нельзя допускать, чтобы настольная лампа напрямую освещала стекло сканера (случайным образом).

У меня был случай на днях, когда я испортил таким образом штук 100 сделанных сканов. Отражённый свет лампы попал в область неплотно прилегающего корешка и сильно "засветил" её. В результате получились крайне малоконтрастные полосы около корешка - и сканы пришлось удалить.

Для исправления проблемы оказалось достаточно просто отвернуть лампу в сторону :) и насканировать заново испорченные сканы. Рассеянный свет от лампы (не падающий прямо на стекло сканера) никакого вреда не принёс сканам.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #54 : 11 јРав 2011, 21:51:59 »
Интересные статьи:

Что такое lpi, dpi, ppi и как они связаны между собой?

http://www.ktip.ru/lpidpi.htm

Что такое DPI?

http://www.videographer.su/forums/index.php?showtopic=882

и ещё:

http://ru.wikipedia.org/wiki/DPI
« Последнее редактирование: 11 јРав 2011, 21:58:22 от monday2000 »

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #55 : 13 °ЯаХЫм 2011, 14:40:05 »
Небольшой совет при разделении сканов:

Иногда в ST при автораспознавании зон бывает такое, что отдельные буквы попадают в зоны иллюстраций - и это трудно заметить.

Поэтому нужно, разделив сканы при помощи то ли ST Split, то ли Separator, всегда визуально проверить полученные задние субсканы - не попало ли туда чего лишнего.

syn104

  • Новичок
  • *
  • Сообщений: 3
    • Просмотр профиля
Re: Сканирование книг: общие вопросы
« Ответ #56 : 23 °ЯаХЫм 2011, 15:26:37 »
Полностью согласен насчет ВМР файлов. Гораздо меньше мороки в разных программах.
И пользуясь случаем. Практически все авторы категорически против Fine Ridera.
Но времена 6-7 версий прошли. Вопрос - какая из трех строк получена в Fine Rider.

Остальные две в кромсаторе и тейлоре. Разрешение 600. Сканировалось в 300. Причем в Fine Riderе намеренно использовалось автовыравнивание строк. А в бит переводилось фотошопом.
« Последнее редактирование: 23 °ЯаХЫм 2011, 15:28:49 от syn104 »

yuree

  • Постоялец
  • ***
  • Сообщений: 172
    • Просмотр профиля
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #57 : 23 °ЯаХЫм 2011, 21:04:06 »
Новые программы для обработки сканов.

SyBookMaker
http://sysoftix.ru/sybookmaker
Бесплатна для некоммерческого использования.

Atiz BookDrive Editor Pro

http://www.atiz.ru/page.jsp?pk=node_1233132256310
Платная.

Обе программы - плохие и неинтересные. Но примечательно, что они вообще хотя бы появились на свет.

А что мешает раз и навсегда выучит какой-то нормальный 2D редактор и править в нём сканы?
Не хотите заморачиваться с Фотошопом, пожалуйста, есть другие программы, даже безплатные и "на уровне". Тот-же Gimp например. 

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #58 : 02 ёоЭм 2011, 16:46:21 »
Опубликована в Интернете статья "Всё для DjVu" из бумажного журнала Upgrade:

http://www.upweek.ru/vsyo-dlya-djvu.html


monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Сканирование книг: общие вопросы
« Ответ #59 : 16 ЅЮпСам 2011, 09:32:18 »
Пришло мне письмо с таким вопросом:
Цитировать
Привет!

Есть небольшой вопрос по созданию djvu-книг. Надеюсь на вашу помощь.

Для обработки полутоновых изображений я использую метод подклейки фона -
с djvu Imager, описанный в вашей статье. Для добавления ocr-слоя - djvu
ocr. Заметил, что при комбинации этих двух подходов текстовый слой на
страницах с картинками (т.е. там где есть фоновый слой) смещен
относительно текста - точнее, весь текстовый слой располагается вверху
страницы. Мелочь, а неприятно.

Возможно, можно как-то решить эту проблему?

Спасибо заранее за ответ.
Это уже не первый раз спрашивают, так что я решил опубликовать вопрос. Это уже получается как распространённая ошибка.

Ответ прост - проблема происходит из-за смены DPI у обрабатываемого скана. Человек явно распознаёт сканы ДО их прохождения через Scan Tailor (где их DPI меняется с 300 на 600), а надо ПОСЛЕ.

Смена DPI с 300 на 600 в Scan Tailor также сопровождается и соответствующим РЕСЕМПЛИНГОМ. При таком ресемплинге пиксельные размеры скана удваиваются, а площадь скана в пикселях учетверяется.

А OCR-слой привязывается к пиксельным размерам скана - естественно, что раз пиксельные размеры изменились - то OCR-300 dpi при вставке в скан 600 dpi будет простираться лишь над четвертушкой задежавюченного скана - а не над ним всем.

Кстати, в программе DjVuOCR предусмотрена некая обработка такой ситуации - там можно ввести некий коэффициент масштабирования OCR. Но у меня никогда не получалось заставить это работать.

Чтобы избежать таких проблем, OCR надо делать именно над теми сканами, которые НЕПОСРЕДСТВЕННО кодируются в DjVu - а не раньше.