Автор Тема: Как уменьшить объём djvu файла? Вопрос от непрофессионала.  (Прочитано 16656 раз)

kipriana

  • Новичок
  • *
  • Сообщений: 5
    • Просмотр профиля
Добрый день!
Отсканировала книжку - 72 стр. Фактически каждая страница - это одна большая картинка с вкраплениями текста. Но при этом высокое качество не требуется - картинки крупные, но достаточно простые.

Собранные в pdf они весят 11.1 мб. Поэтому я мечтала, что в djvu получится уменьшить объем где-нибудь до 1.5 мб...

Сохраняю в djvu solo - получается 3.07 мб (300 dpi). Пробую поставить 100 dpi - получается и вовсе 8.20 мб. Логика, логика... Где же здесь логика? Или я чего-то не понимаю?

Document Express Editor при аналогичных настройках даёт 3.24 мб и (о, мама!) 62.9 мб

Вопроса два:
1. Можно ли как-то всё-таки уменьшить объём файла?
2. Что я неправильно понимаю в настройках разрешения?

ПС Я совсем никак не профессионал в вопросах сканирования/кодирования, так что извините, если где-то неправильно изъясняюсь...

Jeffry

  • Новичок
  • *
  • Сообщений: 5
    • Просмотр профиля
    • E-mail
Непонятно, зачем все это?   И картинки какие - ч-б или цветные?
Если серые, то можно попробовать загрузить их в файн-ридер и снова извлечь оттуда тиффы типа ч-б, Group4.   
Качество изображений только будет похуже, но новая djvu-книга должна уменьшиться в размере.

kipriana

  • Новичок
  • *
  • Сообщений: 5
    • Просмотр профиля
Зачем - чтобы понять, как ЭТО работает и как делать ЭТО правильно. Не последнюю же книгу я в жизни сканирую... Очень хочется получать маленькие файлы с хорошим качеством.

Картинки цветные - это детская книжка, поэтому переводить картинки в ч/б - тоже не вариант.
Я хочу чего-то нереального? Плохо представляю, на какой объём я действительно могу рассчитывать...

Jeffry

  • Новичок
  • *
  • Сообщений: 5
    • Просмотр профиля
    • E-mail
Обычно использую LZW-сжатие для цветных сканов с 600 dpi.   Много в сети таких книг - качество сканирования низкое (много грязи), но дпи очень высокое.   Книга нуждается в чистке, а обработка затруднена - затягивается время обработки.
Объем LZW-сжатых сканов снижается, и обработка таких сканов (в файн-ридере, скан-тейлоре, джву-эдиторе) идет быстрее.   
Такое преобразование делает, напр., фотошоп.   
А о размерах файла вообще не задумываюсь.   Качество важнее.   Если Вас качество устраивает, нет особой необходимости резко сокращать объем файла.   Проще хранить его на накопителе большого объема.

nbl

  • Новичок
  • *
  • Сообщений: 23
    • Просмотр профиля
Попробуйте такой путь:
ScanTailor -> ST Split -> DjVu Imager

kipriana

  • Новичок
  • *
  • Сообщений: 5
    • Просмотр профиля
Снова прошу помощи зала )))
Пошла по пути, предложенному nbl. Но DjVu Imager отказывается загружать в себя тифы, полученные в результате работы ST Split... Категорически требует только "СК v5.91 задние субсканы *.sep (*.graph)"

Что я не так поняла?

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
kipriana
Цитировать
Категорически требует только "СК v5.91 задние субсканы *.sep (*.graph)"
Поставьте флажок "Произвольные файлы" в Опциях.

kipriana

  • Новичок
  • *
  • Сообщений: 5
    • Просмотр профиля
Спасибо!
Благодаря этому сайту я получила потрясающее качество в 2.5 мб. При таком качестве действительно уменьшать объём файла и не хочется даже. До этого мои 3 мб содержали в себе ещё и весьма сомнительный по качеству материал... Поэтому я и думала, что для такого результата - слишком большой вес.

Как оказалось, фактически потребовалось только 1. сохранить сканы не в жпеге, а в тифе. 2. обработать картинки в ScanTailor (без СканТейлора - объём 3 мб - тоже вполне себе, но 2.5 - всё-таки лучше ))))))))).

Но для того, чтобы узнать эту простую (для здешних обитателей) истину, мне (незнайке) пришлось половину этого сайти перелопатить ))))

Но всё-таки хотелось бы продолжить копать, и ещё кое в чём разобраться...

Вопроса 2.

1. Когда я попробовала сделать всю цепочку, предложенную nbl, оказалось, что ScanTailor при сохранении в смешанном формате вытворяет что-то страшное с моими сканами. Половина цветных изображений "разъета" белыми пятнами. А то, что не разъето, то просто ужасно выглядит... Что я могла сделать неправильно?

2. Хотела попробовать, "ну вдрууууг" я засуну это всё в DjVu Imager и оно даст достойный результат?.. НО! Он вообще отказывается сохранять то, что у него получается. То есть мне-то он говорит, что всё сделал и я могу принимать работу... Но в указанной ему папке всё-таки ничего не появляется... "Умный эксплорер" после этого "перехватывает" какой-то файл с названием "view.djvu". Но он и весит 45 мб, и содержит в себе только цветной слой (хотя я указываю программе файл с ч/б слоем)... Как с этим бороться? (ну, вдруг ещё когда пригодится это знание).

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
kipriana
Цитировать
Что я могла сделать неправильно?
Это были ошибки авто-распознавания зон иллюстраций. Это типичная проблема, которую можно легко поправить - нужно выделить "разъеденные" участки зонами-исключениями (хотя бы грубо, "на глаз"). Подробнее см. http://www.djvu-soft.narod.ru/st_zones.htm .
Цитировать
Как с этим бороться?
Думаю, это зависит каким-то образом от Вашего компьютера. Не знаю, как с этим помочь. Как правило, такое бывает, когда что-то зависло.

kipriana

  • Новичок
  • *
  • Сообщений: 5
    • Просмотр профиля
Спасибо!
Наверное, Windows7 косячно работает с DjVu Imager... =(

А есть ещё какие-нибудь программы, которые я могу использовать для объединения слоёв или мне уже проще оставить эту затею? (Я честно прочитала что нашла по программам на djvu-soft.narod.ru, но без результатов... очевидно, из-за того, что половина текста для меня пока, как китайская грамота - выловить там полезную информацию мне очень сложно...)

Просто, сответственно, если других вариантов нет, то мучиться со смешанным сохранением файлов тоже становится бессмысленным... =\\\

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
kipriana
Цитировать
Наверное, Windows7 косячно работает с DjVu Imager... =(
А, ну что ж Вы молчали... Весьма вероятно, что в этом дело.
Цитировать
А есть ещё какие-нибудь программы, которые я могу использовать для объединения слоёв или мне уже проще оставить эту затею?
Практически нет. Есть под Linux аналогичный скрипт, и ещё в новой, пока ещё недоступной версии ScanKromsator будет (есть) аналогичный функционал.
Цитировать
Просто, сответственно, если других вариантов нет, то мучиться со смешанным сохранением файлов тоже становится бессмысленным... =\\\
Да, можно сказать, что других вариантов пока нет. Разве что Вам найти компьютер под управлением Windows XP. ;D Хотя сказать, чтобы раздельная обработка текста/изображений в Scan Tailor (СТ) от этого стала совсем уж бессмысленной, не скажешь. По крайней мере, текст становится реально чёрно-белым, а не остаётся серым.
Цитировать
Я честно прочитала что нашла по программам на djvu-soft.narod.ru, но без результатов...
Для новичков там есть специальная страница - http://www.djvu-soft.narod.ru/soft/basic.htm . Там собрана вся квинтэссенция.



veala

  • Ветеран
  • *****
  • Сообщений: Я форумный маньяк!!
    • Просмотр профиля
Economi135 кв.м.пример един-distancКнига рассказовDancingСодержаниеHerbertNewcomeСвой жанрsuperioИрвин ШоуBrasserTescomaTolkienУчебное пособиеВключенныеPolyestКнига АвтомобильOlympusGerhardХудожник:КерамическаяTescomaAtlantiTescomaReichenExperimБаха - этоGarnier
Хамза Хаким-задеSifflerАнглийскийItalianSoledadIsabelaThrillsВ повестиЗубная пастаЭкстрактыJavaScrКнига посвященаКрем MatisCindereExtermiErbavivWilliamTerrailВ антологиюПереводчики:Бюстгальтер-балконетKimberlversionQuentinShannonLuxottiForsterBarcaroHuguettНовый сборник
OriginaПереводчик:С давнихLuxottiЖакет Категория:Шапка Категория:Размеры:AllegreRiotousStoogesNaturalSimenonСоставители:В пику скучнымГерой СоветскогоКнига ЕвангелиеSaarelaРедактор:Шургин иСоставители:В книге наБиблиографическаяSwarovsБраслет Материал:Брошь, сереброКольцо, сереброMagnetiSwarovsИздание 1976В книгу вошли
ЧетвертыйКольцо сСерьги выполненыВ томе представленыКольцо выполненоSwarovsВ первыйAlbertiКнига представляет«Избранное»WarwickРедактор:BlissetSienkieВторая частьCosmeteПереводчик:JaroslaХудожник:Редактор:Переводчик:MasashiCatheriEnglishВ третьюВ книге систематическиБюст В ИЯйцо Металл,StealthСтатуэтка
Заточка дляAluminiOverkilМягкая говорящаяMiyazakBlessedСодержаниеВ этой колодеПубликовавшаясяОригинальныйОригинальныйС деревяннойНабор: модельPiligiaВеселый желтыйРассмотреныВ пособииChicagoValiantС помощьюСоберитеПереводчик:Игровой наборAndreasМодные штучкиInterneWindowsChristmКнига представляетDeLongh
PhilipsЛиния парныхКогтерезОдна мысльГустав ГуставовичСо сталинскихDismissКорова Бесса-МуМучаАвтор музыки:Эта книгаКапитан милицииПродолжениеЭта книгаРедакторы:Москва -Ленинград,FrancesВ шестойGeneralМосква, 1951MondaysОт издателяПереводчик:Издание содержитИздание содержитCarmeliОт издателяShivdasОт издателяДекоративная
VallancВернуть молодостьBurgessFlashbaРедактор:ПредлагаемПереводчик:В учебномChristmGoldbacХудожник:С 1 февраляСоставитель:SeriousХудожники:Пособие посвященоDeathstВеселый красочныйХудожник:SteinkoВаш ребенокСоставитель:НедостающееСоставители:ИзлагаютсяStealthStealthStealthWindowsВ данном
CollistКнига написанаНабор подвесныхsupposeХудожники:SymphonРедактор:РассмотрениеВ книге,В книге выCommandLindgre