(http://i036.radikal.ru/1004/ef/ae985a87e79ct.jpg) (http://radikal.ru/F/i036.radikal.ru/1004/ef/ae985a87e79c.jpg.html) | (http://s61.radikal.ru/i172/1004/9c/3858eb963c43t.jpg) (http://radikal.ru/F/s61.radikal.ru/i172/1004/9c/3858eb963c43.jpg.html) | (http://s58.radikal.ru/i161/1004/fb/aa65363f0170t.jpg) (http://radikal.ru/F/s58.radikal.ru/i161/1004/fb/aa65363f0170.jpg.html) |
(http://s42.radikal.ru/i098/1004/c2/d7105dcca61at.jpg) (http://radikal.ru/F/s42.radikal.ru/i098/1004/c2/d7105dcca61a.jpg.html) | (http://s43.radikal.ru/i100/1004/60/4fe3703db07dt.jpg) (http://radikal.ru/F/s43.radikal.ru/i100/1004/60/4fe3703db07d.gif.html) | (http://s40.radikal.ru/i090/1004/bb/64d0b0785ab2t.jpg) (http://radikal.ru/F/s40.radikal.ru/i090/1004/bb/64d0b0785ab2.gif.html) |
Если еще и обводить солнце автозоной на каждой странице книги - то можно вообще потерять интерес к djvu-строению.Т.е. ручной зоной? Да, не очень-то удобно. Но по-другому пока никак. Кстати, в СК такая же проблема возникала. Решение было найдено такое, чтобы запоминать форму выделения в буфер обмена - и потом вставлять на последующих страницах.
автоматически обвести их прямоугольными пользовательскими зонамиСкорее, тут бы круглыми подошло - если бы они существовали. :)
Скорее всего решение лежит в том, чтобы оставить полезную область такой, какая она определена на автомате СТ, при этом поправить нижнее поле макета страницы, чтобы оно включало оставшуюся часть солнца.Не уверен. А как насчёт грязи, прилегающей к нижней кромке страницы? Она может помешать. Да и автоопределённая полезная область может где-то сильно лажануть. В принципе, не так уж сложно пройтись вручную по всем сканам, и вручную чуть подправить полезную область.
(залить даже номер на нем в цвет солнца).Это уж чересчур ИМХО. :)
Сколько страниц в этой книжке - 100, 150?Понятия не имею.
Судя по этим трем сканам нижняя граница по номеру страницы определяется достаточно надежноНет. Там на автомате захватывается крохотная чёрная горизонтальная полоска грязи снизу.
И на каждой придется двигать полезную область и обводить солнце (причем, т.к. солнце находится с краю скана, то обводка еще более усложняется).Да ничего страшного ИМХО. Я вон когда-то вручную в Фотошопе обрезал по фиксированной рамке каждый скан http://www.djvu-soft.narod.ru/b_cr.htm :) .
А по первому пункту существенных недостатков СТ - давно бы уже сделали свой сепаратор - он делается из любой Вашей ST-программы заменой пары строк - и он исчезнет..Да сделаю я - я же сказал, что у меня это в планах. Просто я ещё не успел - не могу же я разорваться на части. :) Но, вообще-то, я считаю, что разумнее встроить "Сепаратор" прямо в СТ - пусть и без размытия растра (а размытие - в отдельной программе). Иначе СТ получается каким-то недоделанным. Впрочем, это тема для отдельного большого разговора по СТ. :)
В конце концов, иногда сканы невозможно корректно разложить на субсканы и приходится полагаться на автосементор..Конечно. В этом примере я как раз с этим и столкнулся - там на 3 скане такой дымчатый голубенький туман по контуру рисунков не определялся автозонами (например, справа от средней кисти) - так что я руками в ломанный многоугольник эти рисунки выделил.
Я предложил максимально автоматизированное решение, требующее минимальных трудозатрат от пользователя,К сожалению, пока что ИМХО это труднодостижимый идеал. Всё равно от пользователя требуется какая-никакая квалификация, понимание основ DjVu-книгосканирования, а также изрядная доля ручного труда, да ещё и определённая сообразительность.
Там на автомате захватывается крохотная чёрная горизонтальная полоска грязи снизу.Видимо, это на STA-версии, в последних версиях СТ такого не происходит.
В этом примере я как раз с этим и столкнулся - ... - так что я руками в ломанный многоугольник эти рисунки выделилЯ говорил о другом - о "журнальных сканах" с текстом поверх фотоиллюстраций, и о автосегментере scanned-профилей djvu-кодеков. Когда никакая ломаная не поможет..
А сейчас мы как лебедь, рак и щукаИМХО, неудачное сравнение. "Воз" далеко не там, где он стоял даже пару месяцев назад и продолжает продвигаться в правильном направлении. Лебеди, раки и щуки прорабатывают свои сегменты (за мелким исключением).
с докой, и толковымЯ еще раз повторяю, на заглавном окне Сепаратора по-русски написано:
То есть, нужно что-то вроде курсов по DjVu-книгосканированиюПредлагаю писать его на английском, чтобы как-то отсеять лиц, принципиально не способных закодировать сканы в Djvu, чтобы не портили статистику. Некоторый прообраз данного подхода есть в СК и в ряде Ваших программ.
Поясните, пожалуйста, конкретнее - что тут бестолкового и какие доки тут еще нужны?Получается нелогично: Вы пишете статью http://tinyurl.com/ycvm85z , где всё подробно расписываете, как и что делать. Но, чтобы понять роль Сепаратора в том описании, его нужно скачать, скачать и поставить .NET, запустить программу, и прочесть в ней её описание.
ИМХО, неудачное сравнение. "Воз" далеко не там, где он стоял даже пару месяцев назад и продолжает продвигаться в правильном направлении. Лебеди, раки и щуки прорабатывают свои сегменты (за мелким исключением).Подробнее, пожалуйста.
Методом ограничения диапазона яркости иллюстраций (официально включен в СТ начиная с версии 0.9.8 )Откуда такие сведения? Я скачал СТ 0.9.8 - вижу, добавились веники. Но какого-либо явного указания от Tulon по поводу "ограничение яркости иллюстраций диапазоном [1..254]" пока что нигде не вижу. Это ограничение нужно как-то руками выставлять? Или оно всегда само делается?
Данная методика использует предложенное U235 и введенное в СТ начиная с версии 0.9.8 ограничение яркости иллюстраций диапазоном [1..254] (это меньше, чем на 1% - т.е. разница между иллюстрацией до и после такого ограничения практически неразличима). Таким образом, пиксели c нулевой и стопроцентной яркостью теперь однозначно относятся к бинаризованной части скана.
Информация напрямую от автора СТ в одном из постов соответствующего топика на руборде.Вот, нашёл:
Посмотрите потом пипеткой цвета той части прямоугольника, которая вошла в зону, и той, которая вывелась бинаризованной.Посмотрел. Собственно, чёрный прямоугольник рисовать даже и не надо - достаточно взять чёрно-белый скан с текстом, выделить кусок текста в пользовательскую зону, и сделать вывод в режиме "Смешанный".
Спасибо за помощь. Пока только бегло пробежалась по рекомендациям, работой займусь в выходные - больше свободного времени.Что значит "избавились от мусора" (в Фотошопе)?
Есть вопрос - может и не уместный , т.к. подробно Ваши рекомендации не изучила и он там отражается, но на всякий случай спрошу: обработала в фотошоп несколько страниц (избавилась от мусора), размер файла уменьшился до 10-50 МБ. Какой следующий шаг мне делать из перечисленных в уроке? Не слишком ли большой размер?
(http://i069.radikal.ru/1004/19/ddfa7d906008.jpg) | (http://s53.radikal.ru/i141/1004/38/2c92211e8333.jpg) |
Какой следующий шаг мне делать из перечисленных в уроке?Все последующие - т.е. 3 и далее:
3. Используем DjVu Small v0.4.2 для создания т.н. DjVu-заготовки - т.е. дежавючим сканы из папки out1 - с профилем User B/W (600 dpi).Размытые сканы кладёте в папку out2 (о которой в инструкции говорится) - вместо тех, что там были до размытия.
Добрый вечер.Конечно, спрашивайте - хуже, когда не понимают, но и не спрашивают.
Отвечаю на ваш вопрос:
Что значит "избавились от мусора" (в Фотошопе)?
я просто обрезала сканы от лишнего (обложка) и при помощи заливки и ластика убрала затемнения от перегиба, получились ровные чистые отсканированные странички.
После Вашах рекомендаций воспользовалась фильтрами фотошопа
1. Imagenomic.Noiseware.Professional
3. PictureCode Noise Ninja
Хотя применяю их методом тыка. Какие ставить параметры в "Imagenomic" не заю. И как использовать
2. Neat Image - тоже.
И зачем применять 3 и 4 пункты, если я не разделяла скана на текст и изображения?
monda2000?
Очень надеюсь, что мои безграмотные вопросы не помешают нам дальше общаться по этой теме, и не только.
Правда?!)
P.S.
Прикрепляю файл после дерастрирования Imagenomic. Вот ссылка http://ifolder.ru/17326033
я просто обрезала сканы от лишнего (обложка) и при помощи заливки и ластика убрала затемнения от перегиба, получились ровные чистые отсканированные странички.Как я понял, это было проделано в Фотошопе. Конечно, это неправильно - такие вещи нужно делать в Scan Tailor, потому что делать это в Фотошопе - просто адская мука, тогда как в Scan Tailor это делается просто, быстро и легко.
И зачем применять 3 и 4 пункты, если я не разделяла скана на текст и изображения?Вот это самый интересный вопрос. Если Вы не разделяли сканы на текст и изображения - то тогда и пункт 2 (размытие иллюстраций) не то, что не нужно было делать - а даже и вредно и нельзя было делать.
И как использовать 2. Neat Image - тоже.Я тоже не знаю. Я упомянул эти программы просто как вариант. Они мне тоже кажутся весьма сложными в освоении. Для Вашего случая фотошоповского размытия хватит за глаза.
Если есть возможность восстановить, лучше восстановить..Пожалуй, не буду пока восстанавливать. Потому что лучше сразу сделать более серьёзную и постоянную статью на эту тему.
обработку детской книги можно в значительной степени автоматизироватьНапишите своё описание, что ли. Я в Ваших утилитах слабо ориентируюсь (т.к. не-любитель .NET).
То есть меня интересует восстановление оригинальных сканов книги.Если не потерял, восстановлю.
Прислали образцы сканов - вот они (в JPG, чтобы снизить размер):
Всего 3 скана, все вместе тут: http://ifolder.ru/17301841 (4,14 МБ)
Пожалуй, не буду пока восстанавливать. Потому что лучше сразу сделать более серьёзную и постоянную статью на эту темуТаки она появилась (статья) или я ее пропустил?