Автор Тема: Djvu - размеры файлов  (Прочитано 32309 раз)

Filamat

  • Новичок
  • *
  • Сообщений: 4
    • Просмотр профиля
Djvu - размеры файлов
« : 22 Августа 2010, 01:24:05 »
Заинтриговала одна вещь меня... Делаю книгу, например в 600 стр и в 300стр, а размеры одинаковые получаются - по 16 метров...Для той которая на 600 стр это ещё нормально, но для 300 страничной это  ИМХО многовато будет...Почему так, не подскажете?
И ещё, при кодировании в djvu некоторых страниц возникает ошибка: Память не может быть read...,а ежели эти страницы из tiff перегнать в другой формат, кодируется нормально..Почему так?
 

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Djvu - размеры файлов
« Ответ #1 : 23 Августа 2010, 09:46:22 »
Filamat
Цитировать
Почему так, не подскажете?
Нужны дополнительные подробности. Во-первых - какой программой кодируете? С какими установками?
Цитировать
Память не может быть read...,а ежели эти страницы из tiff перегнать в другой формат, кодируется нормально..Почему так?
Опять-таки - смотря чем кодируете. Но раз TIF не воспринимает, а BMP из него - воспринимает - тогда причина, скорее всего, в том, что некоторые TIF-теги не читаются.

m7876

  • Новичок
  • *
  • Сообщений: 38
    • Просмотр профиля
Re: Djvu - размеры файлов
« Ответ #2 : 23 Августа 2010, 10:46:00 »
Это не ответ, просто тема подходит по названию.
Недавно обнаружил интересный эффект: если страницу с вертикально повернутой таблицей или картинкой повернуть в нормальное, горизонтальное положение, то размер файла может стать значительно меньше. Почему -- понятно из логики работы кодера. Раньше я как-то не придавал этому значения, считал, что кнопочки "поворот" в просмотрщике достаточно. Кстати говоря, по-моему, ни в одной из инструкций по подготовке DjVu-файлов про это не сказано.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Djvu - размеры файлов
« Ответ #3 : 23 Августа 2010, 10:51:41 »
m7876
Цитировать
Кстати говоря, по-моему, ни в одной из инструкций по подготовке DjVu-файлов про это не сказано.
Я тоже об этом недавно задумывался. "Не сказано" потому, что штатные средства работы с DjVu почему-то не предусматривают возможность установить конкретной странице внутри многостраничного DjVu свой ортогональный угол поворота. Хотя спецификация DjVu это предусматривает.

Решение я вижу в том, чтобы добавить в djvused такую фичу (установка флага поворота конкретной страницы). Ну и плюс ещё мелочёвку - вроде насильственная установка DPI и гаммы. Можно даже насильно прописать размеры страницы в пикселях - только надо ли?

Filamat

  • Новичок
  • *
  • Сообщений: 4
    • Просмотр профиля
Re: Djvu - размеры файлов
« Ответ #4 : 23 Августа 2010, 14:11:14 »
Кодировал Djvu Solo 3.1 обе книги с одинаковыми установками: 600дпи, чёрно-белый. Пробовал перегнать через Djvu Editor Pro 5 - получилось на 10 метров больше... Djvu Smal - точно так как в Соле. Та книга которая на 600 страниц по формату в два раза больше той которая на 300 страниц, но перед прогонкой в кромсаторе шестьсотстраничной книги каждый второй скан был перевёрнут вверх тормашками))). Та которая на 300стр - все сканы перевёрнуты с вертикального положения в нормальное горизонтальное... Переворачиваю в  FastStone Image Viewer. Сканы делаю с помощью MiraScan 6.1 (5000) настройки одни и те же :300дпи серый тифф. В кромсаторе настройки тоже те же)

57an

  • Постоялец
  • ***
  • Сообщений: 201
    • Просмотр профиля
    • Djvu Bookmarker on SF.net
Re: Djvu - размеры файлов
« Ответ #5 : 23 Августа 2010, 14:52:54 »
Filamat
Привести сами книги невозможно?
Из Вашего описания все еще непонятно, какого вида изображения попадали на вход кодеров.
В частности, есть ли иллюстрации, прогонялись ли сканы через программу сканообработки - Scan Tailor либо ей подобную..

Filamat

  • Новичок
  • *
  • Сообщений: 4
    • Просмотр профиля
Re: Djvu - размеры файлов
« Ответ #6 : 23 Августа 2010, 15:12:39 »
Вот книги: http://ifolder.ru/18632498 и http://ifolder.ru/18978417, у первой пароль: 457gfhdu678$%^%^*RTHJ%&*^*&$HJBVHVH68764645yhu684y hghjr78544
Есть изображения, сканы прогонялись через сканкромсатор согласно статье Scan & Share 1.07
Да, и скажите мне откровенно о качестве этих книг

57an

  • Постоялец
  • ***
  • Сообщений: 201
    • Просмотр профиля
    • Djvu Bookmarker on SF.net
Re: Djvu - размеры файлов
« Ответ #7 : 23 Августа 2010, 15:39:11 »
Если кто еще будет скачивать - правильный пароль - без пробела, т.е.
457gfhdu678$%^%^*RTHJ%&*^*&$HJBVHVH68764645yhu684yhghjr78544

По теме - качество хорошее, а у 600-страничного вообще почти отличное. Единственно - я уже привык к одинаковым размерам страниц, на автомате получаемым на выходе СТ (но такого можно добиться и с помощью СК).
Размер 300-страничному добавило недостаточное сглаживание букв - а они еще и большого размера, поэтому кодеру найти две похожие, чтобы объединить их в словаре, оказалось затруднительно. Кроме того, из-за излишне жирной бинаризации многие буквы склеились между собой с тем же результатом.

Дополнительно уменьшить размер 600-страничного можно увеличив размер словаря. 300-страничный придется перебинаризовать с меньшим порогом и включенным сглаживанием.

Проверил - прогон даже бинаризованных сканов в СТ (для сглаживания) и последующая сборка с 40-страничным словарем уменьшит размер 300-страничной книги в полтора раза (без сглаживания просто увеличенный словарь даст уменьшение размера процентов на 10).
« Последнее редактирование: 23 Августа 2010, 23:14:58 от 57an »

Filamat

  • Новичок
  • *
  • Сообщений: 4
    • Просмотр профиля
Re: Djvu - размеры файлов
« Ответ #8 : 24 Августа 2010, 18:23:06 »
Огромное спасибо за пояснения! Так оно и есть; ранее не обращал вимания на СТ...а теперь, кажется, если ещё придётся чего сканить, на него и перейду.
Только вот как до кодирования книги угадать размер словаря? И что будет если его сделать неумеренно большим?

monday2000:
Цитировать
Опять-таки - смотря чем кодируете. Но раз TIF не воспринимает, а BMP из него - воспринимает - тогда причина, скорее всего, в том, что некоторые TIF-теги не читаются.
Точно в DjVu Small никаких ошибок не было.

57an

  • Постоялец
  • ***
  • Сообщений: 201
    • Просмотр профиля
    • Djvu Bookmarker on SF.net
Re: Djvu - размеры файлов
« Ответ #9 : 24 Августа 2010, 20:05:47 »
Цитировать
Огромное спасибо за пояснения! Так оно и есть; ранее не обращал вимания на СТ...а теперь, кажется, если ещё придётся чего сканить, на него и перейду.
Только вот как до кодирования книги угадать размер словаря? И что будет если его сделать неумеренно большим?
Почитайте здесь
Там и про кодирование после СТ, и про словари.
« Последнее редактирование: 24 Августа 2010, 20:13:08 от 57an »

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Djvu - размеры файлов
« Ответ #10 : 25 Августа 2010, 19:26:58 »
57an
Цитировать
Размер 300-страничному добавило недостаточное сглаживание букв
Я тоже это заметил. Видно, если лупой в WinDjView рассмотреть произвольные страницы обоих книг.
Цитировать
а они еще и большого размера, поэтому кодеру найти две похожие, чтобы объединить их в словаре, оказалось затруднительно.
А почему это так? Если в книге все буквы (а не часть) большого размера - почему это затрудняет поиск одинаковых букв?
Цитировать
Кроме того, из-за излишне жирной бинаризации многие буквы склеились между собой с тем же результатом.
Тоже заметил - и тоже это видно в лупу в WinDjView.

Мне кажется, что "склеенные" буквы - это более весомая причина завышения размера книги, нежели чем зазубренность букв. Вряд ли зазубренность так же сильно раздувает размер, как это делает склееность (но точно не могу сказать, это лишь предположение).

И ещё 300-страничной 900 КБ добавляет встроенный OCR - которого нет в 600-страничной.

И ещё такой момент: обе книги изобилуют чёрно-белыми рисунками в маске DjVu. Это тоже не способствует снижению размера файла. Может, именно из-за каких-то особенностей этих рисунков размеры обоих книг столь близки. ??? Но не факт, что эти рисунки следует отправлять в фон (ради снижения размера книги) - а вдруг они в фоне потом слишком размажутся...

И ещё - в 600-страничной в конце книги имеются цветные страницы - и всё равно её размер остался оптимальнее 300-страничной! :o
Filamat
Интересные примеры. Только я не знаю, что бы Вам посоветовать. Надо бы как-то контуры букв сглаживать - в 300-страничной. Я не знаю, как это делается. Вот Arcand в своей методичке это делает без проблем: http://www.djvu-soft.narod.ru/scan/corel_scan.htm . Жаль, что его методика почти невоспроизводима по сложности.
Попробуйте действительно использовать Scan Tailor (СТ) - вдруг там более сглаженные буквы получатся...
Можно заодно (раз уж СТ будет использоваться) попробовать некоторые чёрно-белые рисунки сделать в СТ в Picture-зонах (чтобы потом в фон их отправить при DjVu-кодировании).

Можно ещё попробовать CPC Tool http://www.djvu-soft.narod.ru/soft/cpc_tool_5_21.rar (112 КБ) - достаточно простой (в использовании) инструмент сглаживания контуров букв. Правда, его почему-то давно никто не использует. Наверное потому, что если им злоупотребить, то он уж слишком буквы обкорнает. :) Да и выигрыш по размеру при его использовании всегда был минимален.
Инструкция по его применению внутри архива с программой.
Цитировать
Только вот как до кодирования книги угадать размер словаря? И что будет если его сделать неумеренно большим?
Да никак его обычно не угадывают. Каждый ставит, сколько кому нравится. :) Чем больше словарь - тем больше будет торможение при чтении книги (навигации по ней). Можете хоть 1000 страниц словарь сделать (т.е. заведомо больше числа страниц в книге) - и тогда он будет один на всю книгу. Но производители фирменного DjVu-софта всегда советовали ставить словарь равным 10-20 страниц. Я, например, всегда ставлю словарь = 10, и не люблю больших словарей (именно из-за торможения).
« Последнее редактирование: 25 Августа 2010, 19:42:49 от monday2000 »

57an

  • Постоялец
  • ***
  • Сообщений: 201
    • Просмотр профиля
    • Djvu Bookmarker on SF.net
Re: Djvu - размеры файлов
« Ответ #11 : 25 Августа 2010, 20:34:46 »
Цитировать
А почему это так? Если в книге все буквы (а не часть) большого размера - почему это затрудняет поиск одинаковых букв?
Это мое предположение -
несглаженность больше сказывается при кодировании крупных объектов, чем малых, т.к. отличий между малыми объектами (в пикселях) будет меньше при равной степени несглаженности.


veala

  • Ветеран
  • *****
  • Сообщений: Я форумный маньяк!!
    • Просмотр профиля
Re: Djvu - размеры файлов
« Ответ #13 : 25 Октября 2018, 21:22:31 »
audiobookkeeper.rucottagenet.rueyesvision.rueyesvisions.comkinozones.rulaserlens.rumedinfobooks.rump3lists.ruspicetrade.ruspysale.rustungun.rulargeheart.ru
lasercalibration.rulaserpulse.rulaterevent.rulatrinesergeant.rulayabout.ruleadcoating.ruleadingfirm.rulearningcurve.ruleaveword.rumachinesensible.rumagneticequator.rumagnetotelluricfield.ru
mailinghouse.rumajorconcern.rumammasdarling.rumanagerialstaff.rumanipulatinghand.rumanualchoke.runameresolution.runaphtheneseries.runarrowmouthed.runationalcensus.runaturalfunctor.runavelseed.ru
neatplaster.runecroticcaries.runegativefibration.runeighbouringrights.ruobjectmodule.ruobservationballoon.ruobstructivepatent.ruoceanmining.ruoctupolephonon.ruofflinesystem.ruoffsetholder.ruolibanumresinoid.ru
onesticket.rupackedspheres.rupagingterminal.rupalatinebones.rupalmberry.rupapercoating.ruparaconvexgroup.ruparasolmonoplane.ruparkingbrake.rupartfamily.rupartialmajorant.ruquadrupleworm.ru
qualitybooster.ruquasimoney.ruquenchedspark.ruquodrecuperet.rurabbetledge.ruradialchaser.ruradiationestimator.rurailwaybridge.rurandomcoloration.rurapidgrowth.rurattlesnakemaster.rureachthroughregion.ru
readingmagnifier.rurearchain.rurecessioncone.rurecordedassignment.rurectifiersubstation.ruredemptionvalue.rureducingflange.rureferenceantigen.ruregeneratedprotein.rureinvestmentplan.rusafedrilling.rusagprofile.ru
salestypelease.rusamplinginterval.rusatellitehydrology.ruscarcecommodity.ruscrapermat.ruscrewingunit.ruseawaterpump.rusecondaryblock.rusecularclergy.ruseismicefficiency.ruselectivediffuser.rusemiasphalticflux.ru
semifinishmachining.rutacticaldiameter.rutailstockcenter.rutamecurve.rutapecorrection.rutappingchuck.rutaskreasoning.rutechnicalgrade.rutelangiectaticlipoma.rutelescopicdamper.rutemperateclimate.rutemperedmeasure.ru
tenementbuilding.ruultramaficrock.ruultraviolettesting.rujobstress.rujogformation.rujointcapsule.rujointsealingmaterial.rujournallubricator.rujuicecatcher.rujunctionofchannels.rujusticiablehomicide.rujuxtapositiontwin.ru
kaposidisease.rukeepagoodoffing.rukeepsmthinhand.rukentishglory.rukerbweight.rukerrrotation.rukeymanassurance.rukeyserum.rukickplate.rukillthefattedcalf.rukilowattsecond.rukingweakfish.ru
kleinbottle.rukneejoint.ruknifesethouse.ruknockonatom.ruknowledgestate.rukondoferromagnet.rulabeledgraph.rulaborracket.rulabourearnings.rulabourleasing.rulaburnumtree.rulacingcourse.ru
lacrimalpoint.rulactogenicfactor.rulacunarycoefficient.ruladletreatediron.rulaggingload.rulaissezaller.rulambdatransition.rulaminatedmaterial.rulammasshoot.rulamphouse.rulancecorporal.rulancingdie.ru
landingdoor.rulandmarksensor.rulandreform.rulanduseratio.rulanguagelaboratory.rufactoringfee.rufilmzones.rugadwall.rugaffertape.rugageboard.rugagrule.rugallduct.ru
galvanometric.rugangforeman.rugangwayplatform.rugarbagechute.rugardeningleave.rugascautery.rugashbucket.rugasreturn.rugatedsweep.rugaugemodel.rugaussianfilter.rugearpitchdiameter.ru
geartreating.rugeneralizedanalysis.rugeneralprovisions.rugeophysicalprobe.rugeriatricnurse.rugetintoaflap.rugetthebounce.ruhabeascorpus.ruhabituate.ruhackedbolt.ruhackworker.ruhadronicannihilation.ru
haemagglutinin.ruhailsquall.ruhairysphere.ruhalforderfringe.ruhalfsiblings.ruhallofresidence.ruhaltstate.ruhandcoding.ruhandportedhead.ruhandradar.ruhandsfreetelephone.ruhangonpart.ru
haphazardwinding.ruhardalloyteeth.ruhardasiron.ruhardenedconcrete.ruharmonicinteraction.ruhartlaubgoose.ruhatchholddown.ruhaveafinetime.ruhazardousatmosphere.ruheadregulator.ruheartofgold.ruheatageingresistance.ru
heatinggas.ruheavydutymetalcutting.rujacketedwall.rujapanesecedar.rujibtypecrane.rujobabandonment.ru

veala

  • Ветеран
  • *****
  • Сообщений: Я форумный маньяк!!
    • Просмотр профиля
Re: Djvu - размеры файлов
« Ответ #14 : 25 Октября 2018, 21:23:43 »
инфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфо
инфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфо
инфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфо
инфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфо
инфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфо
инфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфо
инфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфо
инфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфо
инфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфоинфо