Просмотр сообщений

В этом разделе можно просмотреть все сообщения, сделанные этим пользователем.


Сообщения - Eugeen1948

Страницы: 1 [2] 3 4
16
Pdf / Re: Конвертирование PDF -> TIF
« : 14 јРав 2011, 08:43:58 »
Acrobat сохраняет PDF в Tiff, PNG и JPEG с хорошим набором параметров регулирования качества и размера.
Только я не очень понимаю, зачем эта процедура?
Если это промежуточный этап перевода в DJVU, то такая процедура уступает по эффективности прямой конверсии из PDF в DJVU тем же DEE 5 (или его производными). Я много раз сравнивал оба результата и всегда побеждал DEE.
В последнее время я "оседлал" новую рабочую лошадку - виртуальный принтер от Caminova. Он прекрасно конвертирует PDF (в DJVU) сканы цветных страниц. Такого соотношения размер/качество мне не удается получить любыми другими способами. Интересно, что принтер "ужимает" также и ранее сделанные файлы DJVU простым их "перепечатыванием".
Еще один важный момент.  PDF файлы, как правило, имеют компрессию контента. Это, в случаях растровых файлов, может приводить к ошибкам или даже к потере информации в результирующем DJVU при использовании DEE.
Оказалось, гарантированный способ борьбы с этим "недугом" - перевод PDF в PostScript, с последующим использованием DEE.

17
DjVu / Re: Просмотр DjVu через web
« : 27 ДХТаРЫм 2011, 20:43:30 »
Смотря что понимать под "доступным". ;) В городской библиотеке книги тоже доступны - но вряд ли кто захочет брать их домой под залог "паспорт+деньги", и платить за каждый день домашнего использования.
Сходите как-нибудь в ближайшую городскую (или просто ближайшую) библиотеку, посмотрите произвольную часть каталога - и спросите себя, многое ли оттуда уже есть в Интернете. :)
Речь идет, вероятно, о технической литературе а не о худлите или всякой попсовой. Но Вы-то точно знаете где можно искать и скачивать техническую литературу (gen.lib.rus, напр.).
Да и всякая-всячина сейчас вполне доступна, надо только пошарить в сети. На Ру-боарде есть огромный список таких сайтов. Я сам там постил более 200 таких  сайтов.   

18
DjVu / Re: Просмотр DjVu через web
« : 27 ДХТаРЫм 2011, 16:26:19 »
Поясню: я работаю над оцифровкой книг в учебном заведении. Оглавление в книгу добавляется обязательно в каждом случае.
Я Вам завидую, видно у Вас в библиотеке очень редкие книги. :)
Мне кажется, что сейчас оцифровано практически все доступное и это можно найти в соответствующих ресурсах, во всяком случае Анурьева я скачал года три назад.
А оглавление в книгу добавляется просто - для PDF  в Adobe Acrobat, для DJVU в DEE 6.

19
DjVu / Re: Как изменить качество изображения?
« : 27 ДХТаРЫм 2011, 16:07:10 »
Я в таких случаях ( и не только) применяю виртуальный принтер Caminova. Он имеет много полезных настроек, позволяющих оптимизировать качество и размер файла. Причем он работает и для PDF и DJVU файлов. можно переделывать неудачные сканы. Особенно хорошо принтер работает для цветных страниц.

20
В Adobe Acrobat есть виртуальный принтер, называется он "Adobe PDF". Выставляете в параметрах у него нужный формат страницы (напр. А4) и "печатаете" свой файл PDF в удобную для Вас директорию.
Ты уж прости за назойливость, не могу найти. У меня 2 программы.
1.Portable Adobe Acrobat Pro 9.3.4 EngRus
2.Adobe Acrobat X Pro 10.0.0
Не нашёл я там опции Адобе PDF. Будь добр напиши, как добраться по меню. Желательно в Portable Adobe Acrobat Pro 9.3.4 EngRus
Открываешь свой файл Акробатом (не портабельным). Нажимешь клавишу Print. Вываливается меню печати. В самой вехней строке меню выбираешь нужный принтер: Adobe PDF. Рядом жмешь кнопку "Properties" и входишь в меню свойств принтера.
Сразу видишь 4 строки с подменю. В последней и есть установка размера страницы, обычно А4, но можешь делать свою. Там еще куча полезных опций, надо просто потренироваться, потом все будешь делать "на автомате". Можешь сделать и свою конфигурацию для принтера и потом ею пользоваться по умолчанию.

21
Pdf / Re: PDF-технология ClearScan
« : 03 ДХТаРЫм 2011, 13:32:51 »
Вот ещё у меня такая идея возникла:

Предположим, что со временем мы научимся разделять в отдельные слои текст от сложного фона. Причём настолько эффективно, что ни один пиксель фона не будет попадать в маску. Затем можно будет продумать новые алгоритмы поиска и объединения схожих символов (выделенных в отдельный слой). Есть, к примеру, проект gamera.sf.net - который занимается этими вопросами (Jakub Wilk даже сделал программу - didjvu на gamera - но это под Линукс). http://jwilk.net/software/didjvu

Я так думаю, что допустимо, если самодельные алгоритмы будут медленнее коммерческих аналогов. Зато за счёт падения скорости работы можно будет наращивать их качество.
Это произведет просто переворот в отношении к формату DJVU!
У меня есть программа нейросетевого распознавания, которую надо обучать на подходящем множестве, а  Ваша идея при реализации сразу даст возможность получать это множество.
Далее уже просто будет получать необходимые атрибуты книг, искать смысловые дубли в библиотеках и т.п.

22
Pdf / Re: PDF-технология ClearScan
« : 03 ДХТаРЫм 2011, 13:25:44 »
Для 300 dpi СlearScan, действительно, не имеет смысла использовать. Как и вообще делать 300 dpi bw сканы. 300 дпи - слишком грубо и для просмотра и для печати.
А вот для 600 дпи - ClearScan делать можно. Словарь шэйпов заметно уменьшается и размер файла можно уменьшить на 20-30 и более %. Читабельность и печатаемость, опять же улучшаются. Правда, меня несколько раздражают небольшие изменения положения символов. Неужели это так трудно программистам - поточнее определять координаты?
По моему опыту, а я обработал не одну тысячу файлов,  СlearScan для 300 dpi вполне приемлем. Гораздо большее влияние на качество оказывает наличие фона, ореола, артефактов в сканах. Поэтому предобработка сканов (возможно неоднократная) сможет значительно улучшить ситуацию.

23
В Adobe Acrobat есть виртуальный принтер, называется он "Adobe PDF". Выставляете в параметрах у него нужный формат страницы (напр. А4) и "печатаете" свой файл PDF в удобную для Вас директорию.

24
Надо просто напечатать PDF-принтром свой файл, п этом выбрать размер стрнцы  и другие параметры выходного файла. Печать можно делать из Акробата.

25
Я попытался зарегиться на  сервере Celartem для конвертации файлов в DJVU с использованием их сервиса, но неудачно :'(
Может кто тоже попробует:
 http://celartem.com/product/doc/doc_djvuserver.html#linkFunc09

26
DjVu / Caminova - полезная утилита
« : 29 ПЭТРам 2011, 14:23:51 »
Установка области предпросмотра для DJVU:
http://dev.caminova.jp/beta/djvu-wic/

27
[Я даже видел уже Portable-версию. В Яндексе по запросу "acrobat X portable" можно найти.
Portable-версия не имеет ряда настроек и опций и годится только для чтения-запмси файлов.  Для полноценой работы лучше полна версия, тем более что проблем с установкой нет ;D

28
Общий / Re: DjVu metadata standard proposal
« : 14 ПЭТРам 2011, 22:56:06 »
Russkiy ne moy rodnoy yazyk, i vot zachem tekct byl napisan na angliskom.
You can write in English and then use the translator Google to create posts at this forum.

29
Pdf / Re: PDF-технология ClearScan
« : 14 ПЭТРам 2011, 22:35:46 »
Я сегодня немного игрался с pdf файлами. Так вот, не могу утверждать, что после обработки ClearScan размер файла уменьшается. Несколько проверок дали обратный результат. Размер увеличивался. Кое-где на много.
Эффективность игрищ с ClearScan определяется довольно просто. В Акробате Вы делаете "Проверка Документа" после ClearScan. В результатах проверки смотрите пункт "Скрытый текст" листая страницы документа. Если Вы видите поле, хорошо заполненное осмысленным текстом, значит ClearScan хорошо поработал и однозначно файл укорачивается пропорционально "хорошести". Если поле скрытого текста покрыто белибердой, иероглифами и другой "китайской грамотой" - ClearScan не справился с работой и только добавил баласта в файл, что и приводит к увеличению его размера. И у меня есть примеры того и другого случая. Другой вопрос: как заставить ClearScan работать? Ответ прост до безобразия и, в то же время, неприятен - надо усиленно работать над сканами, вычищать, ретушировать, удалячть краевые тени, ореол букв и т.д. и т.п.
Но после этой работы можно насладиться результатом ClearScan :D

30
Pdf / Re: PDF-технология ClearScan
« : 14 ПЭТРам 2011, 16:24:19 »
 ClearScan  вообще-то - штучка для PDF, поэтому большего и ждать не стоит. Однако польза в нем есть - выравнивание страниц и даже распознание (при качественном скане очень даже неплохое), уменьшение размера файла 9довольно существенное, после чего  DJVU уже не кажется таким мощным ужимателем.  ClearScan  как и простой PDF OCR  внедряет свой скрытый слой в  PDF-файл.
Надо попробовать "побаловаться" с Preflight-ом для обработки этого скрытого слоя, возможно есть механизм фиксации его для дальнейшего использования в конверсии.

Страницы: 1 [2] 3 4