Главное > Общий
Djvu - размеры файлов
57an:
Filamat
Привести сами книги невозможно?
Из Вашего описания все еще непонятно, какого вида изображения попадали на вход кодеров.
В частности, есть ли иллюстрации, прогонялись ли сканы через программу сканообработки - Scan Tailor либо ей подобную..
Filamat:
Вот книги: http://ifolder.ru/18632498 и http://ifolder.ru/18978417, у первой пароль: 457gfhdu678$%^%^*RTHJ%&*^*&$HJBVHVH68764645yhu684y hghjr78544
Есть изображения, сканы прогонялись через сканкромсатор согласно статье Scan & Share 1.07
Да, и скажите мне откровенно о качестве этих книг
57an:
Если кто еще будет скачивать - правильный пароль - без пробела, т.е.
457gfhdu678$%^%^*RTHJ%&*^*&$HJBVHVH68764645yhu684yhghjr78544
По теме - качество хорошее, а у 600-страничного вообще почти отличное. Единственно - я уже привык к одинаковым размерам страниц, на автомате получаемым на выходе СТ (но такого можно добиться и с помощью СК).
Размер 300-страничному добавило недостаточное сглаживание букв - а они еще и большого размера, поэтому кодеру найти две похожие, чтобы объединить их в словаре, оказалось затруднительно. Кроме того, из-за излишне жирной бинаризации многие буквы склеились между собой с тем же результатом.
Дополнительно уменьшить размер 600-страничного можно увеличив размер словаря. 300-страничный придется перебинаризовать с меньшим порогом и включенным сглаживанием.
Проверил - прогон даже бинаризованных сканов в СТ (для сглаживания) и последующая сборка с 40-страничным словарем уменьшит размер 300-страничной книги в полтора раза (без сглаживания просто увеличенный словарь даст уменьшение размера процентов на 10).
Filamat:
Огромное спасибо за пояснения! Так оно и есть; ранее не обращал вимания на СТ...а теперь, кажется, если ещё придётся чего сканить, на него и перейду.
Только вот как до кодирования книги угадать размер словаря? И что будет если его сделать неумеренно большим?
monday2000:
--- Цитировать ---Опять-таки - смотря чем кодируете. Но раз TIF не воспринимает, а BMP из него - воспринимает - тогда причина, скорее всего, в том, что некоторые TIF-теги не читаются.
--- Конец цитаты ---
Точно в DjVu Small никаких ошибок не было.
57an:
--- Цитировать ---Огромное спасибо за пояснения! Так оно и есть; ранее не обращал вимания на СТ...а теперь, кажется, если ещё придётся чего сканить, на него и перейду.
Только вот как до кодирования книги угадать размер словаря? И что будет если его сделать неумеренно большим?
--- Конец цитаты ---
Почитайте здесь
Там и про кодирование после СТ, и про словари.
Навигация
Перейти к полной версии