Автор Тема: Первая книга - первые впросы  (Прочитано 499 раз)

ivt

  • Новичок
  • *
  • Сообщений: 6
    • Просмотр профиля
    • E-mail
Первая книга - первые впросы
« : 20 јРав 2015, 00:18:04 »
Решил создать свою первую собственноручно отсканированную книгу в формате DJVU. В основном руководствовался советами с этого сайта. За сайт отдельное спасибо его создателям - много полезной информации и ссылок.
Теперь о книге. Сканировал в оттенках серого в разрешением 600 dpi.
Обработка сканов производилась в ScanTailor Featured, страницы с иллюстрациями обрабатывались в смешанном режиме с последующим раздельным экспортом текста и иллюстраций.
Далее при помощи DjvuSmall собиралась книга с профилем UserBW.
При объеме в 640 страниц размер получился 9,5 Мб (без иллюстраций). Это не много?
Далее - обработка иллюстраций. Вставка и кодирование иллюстраций производится при помощи DjvuImager. В книге полчилось 139 страниц с иллюстрациями (еще много страниц со схематичными рисунками, выделять их  как иллюстрации не стал). Какое качество (ДЗФ,качество заднего фона) выбрать? Пробовал кодировать одну и туже страницу с разным dpi но размер готового одностраничного djvu почему-то не меняется. Ощутимо меняется размер (и качество) при повышении ДЗФ или указании качества заднего фона. При кодировании иллюстраций с качеством в 300 dpi и ДЗФ=2 размер книги получается примерно 45 Мб.
Далее попробовал к иллюстрациям применить гауссово размытие с коэффициентом 2 (скрипт для GIMP) и закодировать (300 dpi и ДЗФ=2) их заново. В результате размер всей книги уменьшился до 32 Мб. Если не использовать ДЗФ то книга получается около 92 Мб (на зато картинки выглядят четче).
В общем пока не ясно с какими настройками кодировать иллюстрации чтобы и выглядели прилично и размер был небольшой.
Еще в книге есть 2 цветные обложки и цветные страницы от спонсоров. Сейчас они кодируются с теми же настройками что и иллюстрации. Нужно ли их обрабатывать отдельно?

Обложка исходная
Обложка с размытием
Пример исходного скана с иллюстрацией
Отделенная иллюстрация
Иллюстрация с размытием


textsharik

  • Постоялец
  • ***
  • Сообщений: 138
    • Просмотр профиля
    • E-mail
Re: Первая книга - первые впросы
« Ответ #1 : 22 јРав 2015, 12:30:23 »
При объеме в 640 страниц размер получился 9,5 Мб (без иллюстраций). Это не много?
Терпеть можно, но многовато. Это вина издательства, которое использовало дизеринг при печати текста.
Можно попробовать обработать текст каким-нибудь размывающим фильтром.

При кодировании иллюстраций с качеством в 300 dpi
300 dpi - в данном случае перебор. Descreen показывает, что оригинал имел разрешение 150 dpi.
Кроме того, гаусс явно не справляется с удалением растра. По-хорошему, надо использовать тот же Descreen.
(Descreen - это фильтр для Фотошопа. Не знаю, можно ли встроить его в GIMP).

Сейчас они кодируются с теми же настройками что и иллюстрации. Нужно ли их обрабатывать отдельно?
Обычно проще обработать отдельно, чем думать над этим вопросом.

ivt

  • Новичок
  • *
  • Сообщений: 6
    • Просмотр профиля
    • E-mail
Re: Первая книга - первые впросы
« Ответ #2 : 29 јРав 2015, 22:23:31 »
Цитировать
Терпеть можно, но многовато. Это вина издательства, которое использовало дизеринг при печати текста.
Можно попробовать обработать текст каким-нибудь размывающим фильтром.
Действительно, в книге, если присмотреться, текст не монотонно черный, а с серыми точками внутри. Пробовал обрабатывать страницы с текстом до кодирования в Gimp Гауссовым размытием с коэффициентом 1 и 2. В результате (если сравнивать с той же страницей после ScanTailor, но без обработки) размер файла получается еще больше (процентов на 25 примерно).
Цитировать
300 dpi - в данном случае перебор. Descreen показывает, что оригинал имел разрешение 150 dpi.
Кроме того, гаусс явно не справляется с удалением растра. По-хорошему, надо использовать тот же Descreen.
(Descreen - это фильтр для Фотошопа. Не знаю, можно ли встроить его в GIMP).
Descreen для Gimp нашелся здесь.
Похоже что фильтра Гаусса с коэффициентом 2 действительно недостаточно. Если кодировать с разрешением 300 dpi (tiff), то имеем:
Исходное изображение - 1935,8 Кб;
Гаусс,2  -  808 Кб;
Descreen - 384,8 Кб;
Гаусс,4 - 183,5 Кб;
Гаусс,5  -  117 Кб;
(Параметры Descreen: Sensetivity=2, selection growth=16, ratio for middle preservation=5).
Причем, на мой взгляд, картинка после размытия Гауссом с коэффициентом 4 выглядит примерно как после Descreen, но размер после кодирования имеет в 2 раз меньше. Хотя можно еще попробовать разные настройки Descreen, но на это потребуется время. Пока склоняюсь к Гауссу с параметром 4.

textsharik

  • Постоялец
  • ***
  • Сообщений: 138
    • Просмотр профиля
    • E-mail
Re: Первая книга - первые впросы
« Ответ #3 : 30 јРав 2015, 13:04:14 »
Пробовал обрабатывать страницы с текстом до кодирования в Gimp Гауссовым размытием с коэффициентом 1 и 2. В результате (если сравнивать с той же страницей после ScanTailor, но без обработки) размер файла получается еще больше (процентов на 25 примерно).
Я попробовал несколько методов размытия. По-моему, лучшие результаты (как по качеству, так и по размеру) даёт Кромсатор (Quality/Smooth=2).

Если кодировать с разрешением 300 dpi (tiff), то имеем:
Исходное изображение - 1935,8 Кб;
Гаусс,2  -  808 Кб;
Descreen - 384,8 Кб;
Странно. У меня получились сильно отличающиеся размеры:
Гаусс,2  -  54 кб;
Descreen - 75 кб;

Вот обработанные файлы: http://rusfolder.com/43334296

Причём по качеству даже 200 dpi Descreen (50 кб) выглядит лучше (на мой взгляд), чем 300-dpi Гаусс.

                  (clickable)

ivt

  • Новичок
  • *
  • Сообщений: 6
    • Просмотр профиля
    • E-mail
Re: Первая книга - первые впросы
« Ответ #4 : 06 °ЯаХЫм 2015, 00:18:44 »
textsharik, спасибо за советы.
Цитировать
Я попробовал несколько методов размытия. По-моему, лучшие результаты (как по качеству, так и по размеру) даёт Кромсатор (Quality/Smooth=2).
СканКромсатор еще не освоил, пробовал в GIMP. При добавлении размытия буквы выглядят ровнее, но потом нужно делать бинаризацию (чтобы закодировать в DJVU) и тут все пиксельные неровности возвращаются. Поигрался и в итоге решил страницы с текстом оставить в том виде, в котором они получаются при экспорте из ScanTailor.

Цитировать
Странно. У меня получились сильно отличающиеся размеры:
Гаусс,2  -  54 кб;
Descreen - 75 кб;
Размер картинок в Вашем примере в 2 раза меньше (наверно делитель заднего фона=2), отсюда и разница тоже почти в 2 раза. У меня в этом случае такие цифры получились:
Гаусс с коэфф.=4 300dpi ДЗФ=2  68,1 Kb
Гаусс с коэфф.=5 300dpi ДЗФ=2  57,5 Kb
C Decreen экспериментировать не стал, все равно в пакетном режиме не знаю как его использовать в GIMP.
Сейчас обработал все иллюстрации с параметрами как приводил выше, получилось так (файл view.djvu от DjvuImager, содержит только 149 иллюстраций (из них 10 цветных), без текста):
Гаусс с коэфф.=4 300dpi ДЗФ=2  9,9 Mb
Гаусс с коэфф.=5 300dpi ДЗФ=2  8,5 Mb
Результирующий файл получился примерно 19,5 Mb (для Гаусса 4). Таким его и оставлю, т.к. хотя Гаусс с коэфф.=5 и меньше, но во-первых всего на 1,5 Мb, а во-вторых размытие больше.

Вот такие итоговые файлы получались в процессе:
Тест без иллюстраций                                                       9,5 Mb
Текст+Иллюстрации, Гаусс с коэфф.=2 300dpi ДЗФ=2  31,8 Mb
Текст+Иллюстрации, Гаусс с коэфф.=4 300dpi ДЗФ=2  19,5 Mb
Текст+Иллюстрации, Гаусс с коэфф.=5 300dpi ДЗФ=2  18,1 Mb
Похоже что для нормального преобразования растра в этом случае подходит размытие Гаусса с коэффициентом 4 (дальнейшее увеличение степени размытия почти не даёт выигрыша в размере, но зато усиливает размытие (уменьшает качество изображения)).
Фильтр Descreen тоже показывает неплохое качество размытия. Но нужно разбираться с его настройками и искать способ его пакетного применения к набору изображений.