Автор Тема: Модифицирование Scan Tailor  (Прочитано 63518 раз)

dnickn

  • Новичок
  • *
  • Сообщений: 1
    • Просмотр профиля
    • E-mail
Re: Модифицирование Scan Tailor
« Ответ #60 : 12 Марта 2013, 09:45:48 »
Доброго всем дня.
По возможности, помогите, пожалуйста, советом или делом:
при смене железа пришлось перейти на win7x64, соответственно установил ST 0.9.11.1 x64, И тут начались мои мучения - постоянные, практически непредсказуемые, вылеты CrashApp. Причем может вылететь на любом этапе от разрезки страниц до вывода и в любом месте. Однако замечено, что в большинстве случаев падает при обработке сканов в формате tif (уже все варианты перепробовал) и на последнем этапе вывода. На сами сканы  не грешу, потому что ранее уже обработан без проблем не один десяток книг (на win7x86). И да, вот еще, если на вывод ставлю 300dpi B/W то обрабатывает без напряга, а чем ближе к 600dpi, тем выше вероятность вылета.
Пожалуста, разбирающиеся спецы, посмотрите, может где-то есть возможность код поправить? Не знаю, что еще... Билла Гейтса материть?  Скоро психоз начнется из-за вылетов...

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Модифицирование Scan Tailor
« Ответ #61 : 12 Марта 2013, 22:15:27 »
otona.onnanoko
Цитировать
есть ли у вас возможность добавить к функциям ластик?
А области белой заливки Вас не устраивают?

Ластик добавить нельзя - потому что тогда потеряется переносимость задания. Об этом говорил автор программы, и я с ним полностью согласен. Т.е. следы от прохождения ластика - это растровая информация, которую нельзя сохранить в XML-файле проекта программы (там находится исключительно векторная информация).

Я обновил программу на офф. сайте https://sourceforge.net/projects/scantailor/files/scantailor-devel/featured/

Там добавились новые опции: Original_Foreground_Mixed и 10. Picture_Shape. Там же внизу страницы приводится их описание.

yuree

  • Постоялец
  • ***
  • Сообщений: 172
    • Просмотр профиля
    • E-mail
Re: Модифицирование Scan Tailor
« Ответ #62 : 13 Марта 2013, 21:49:34 »
otona.onnanoko
Цитировать
есть ли у вас возможность добавить к функциям ластик?
А области белой заливки Вас не устраивают?

Я совершенно против того что бы делать из СканТейлора ("тем более этой сборки") 2D редактор. Добавим ластик, карандаш, заливку, градиент, чего ещё душа пожелает?!) Не знаю, согласиться ли monday2000 с этим но я категорически против усложнений, к тому же неоправданных, на мой взгляд.
Единственное что не достаёт этой сборке, опять же — на мой взгляд, так это полезная кнопочка под названием Дисэйбл, в пункте Полезная область (есть в Энхенседе). Полезна она тем что при нажатии выделяет весь скан целиком. Зачем это надо? Пропустив через свои руки далеко не одну книгу и журнал (и/или их сканы) я пришёл к выводу о полезности этой функции в журналах, арт-альбомах, там где фото идёт встык к краю листа, там где надо выделить весь скан целиком, таких страниц не мало. Нажал кнопку — выбрал всю картинку, не надо прямоугольную область создавать. Мелочь, скажете вы? Возможно, только после двухсотой страницы это уже' не мелочь.
Скажу откровенно, если бы эта функция появилась бы в сборке — мне больше ничего и не надо от СТ))
Этот билд стал бы идеальным. Не больше — не меньше.

Цитировать
Я обновил программу на офф. сайте https://sourceforge.net/projects/scantailor/files/scantailor-devel/featured/

Спасибо за проделанный труд!

otona.onnanoko

  • Новичок
  • *
  • Сообщений: 6
    • ICQ клиент - 328300195
    • Просмотр профиля
Re: Модифицирование Scan Tailor
« Ответ #63 : 13 Марта 2013, 22:54:27 »
monday2000
Цитировать
А области белой заливки Вас не устраивают?
Устраивают, но чуть меньше, чем могло бы быть) Спасибо за ответ)

yuree
Цитировать
Единственное что не достаёт этой сборке, опять же — на мой взгляд, так это полезная кнопочка под названием Дисэйбл, в пункте Полезная область (есть в Энхенседе). Полезна она тем что при нажатии выделяет весь скан целиком.
А зачем оно надо? Если требуется вся страница без полезных областей, то сделайте ее в режиме "цветной". Нет?

yuree

  • Постоялец
  • ***
  • Сообщений: 172
    • Просмотр профиля
    • E-mail
Re: Модифицирование Scan Tailor
« Ответ #64 : 14 Марта 2013, 01:01:07 »
yuree
Цитировать
Единственное что не достаёт этой сборке, опять же — на мой взгляд, так это полезная кнопочка под названием Дисэйбл, в пункте Полезная область (есть в Энхенседе). Полезна она тем что при нажатии выделяет весь скан целиком.
А зачем оно надо? Если требуется вся страница без полезных областей, то сделайте ее в режиме "цветной". Нет?

Может я не совсем верно артикулировал свою просьбу, понимаю)
Я говорю о той ситуации когда у нас на руках куча сканов по живописи, примерно одинакового размера. На листах, фото к краю листа и рядом текст, чёрными буковками. Сразу точно выделить фото даже с помощью зажатой Ctrl дело достаточно трудное, говорю из личного опыта. А при нажатой кнопке, выделяются все сканы целиком, прогоняем в пакете, сканы выделены, потом правим, там где буковки — отодвигаем одну или две линии, дабы выделить только фото, там где фото занимает всю страницу — оставляем как есть. В противном случае — надо "играться" Ctrl'ом с каждой страницей. Ну-а сохранять всё это в цвете — увеличивать размер альбома ("мне нравиться метод разделённых сканов").
Андестенд?

otona.onnanoko

  • Новичок
  • *
  • Сообщений: 6
    • ICQ клиент - 328300195
    • Просмотр профиля
Re: Модифицирование Scan Tailor
« Ответ #65 : 14 Марта 2013, 02:17:26 »
Цитировать
Андестенд?
Пока еще туманно) Но после десятого прочтения ваших сообщений на эту тему кое-что проясняется)
Цитировать
при нажатой кнопке, выделяются все сканы целиком, прогоняем в пакете, сканы выделены, потом правим, там где буковки — отодвигаем одну или две линии, дабы выделить только фото, там где фото занимает всю страницу — оставляем как есть. В противном случае — надо "играться" Ctrl'ом с каждой страницей.
Как правило, альбомы с живописью имеют достаточно качественные иллюстрации, которые хорошо определяются в зоны картинок. К тому же, как я поняла, mondey2000 усовершенствовал этот механизм определения зон. Мне кажется, что править вручную все ваши 200 страниц картинок еще большее трудоемко, чем подправить их после автоматического распознавания. Сужу только по своему опыту...

yuree

  • Постоялец
  • ***
  • Сообщений: 172
    • Просмотр профиля
    • E-mail
Re: Модифицирование Scan Tailor
« Ответ #66 : 14 Марта 2013, 09:18:18 »
Мне кажется, что править вручную все ваши 200 страниц картинок еще большее трудоемко, чем подправить их после автоматического распознавания. Сужу только по своему опыту...

Вручную всё равно придётся править, хоть и не все 200 стр. Повторюсь, эта функция, лишь приятное дополнение уменьшающее количество минут на оцифровку. Зачастую же люди, сейчас, сканируют книги на белой бумаге, с чёткими чёрными буквами, там да, поставил в автомат и горя не знаешь.
Что-бы было ещё понятней приведу Вам ссылку на раздачу с которой я работал → http://rutracker.org/forum/viewtopic.php?t=4125553
Здесь я не выравнивал каждую область на каждом скане, просто воспользовался кнопкой Дисэйбл и выделил все сканы целиком (полезная область — весь скан), потом отделил фото от текста, раскидал на две папки как это обычно делается.

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Модифицирование Scan Tailor
« Ответ #67 : 14 Марта 2013, 19:26:40 »
otona.onnanoko
Будете коверкать мой никнейм - забаню.
yuree
Пока я не планирую брать что-либо ещё из Enhanced. Нет у меня сейчас на это времени. Но у Вас же есть выход - используйте одновременно и Enhanced и Featured, благо Featured инсталлируется совершенно независимо от всех других СТ-клонов. Можно ещё много чего приятного/полезного добавить в Featured из того, что у меня юзеры просят - но это поглотит уйму времени. Я намерен сконцентрироваться сейчас на самом важном - это picture-зоны и dewarping. Остальное - как-нибудь потом.

Кроме того, журналы меня сейчас вообще не интересуют - только книги. Потому что журналами надо заниматься отдельно и всерьёз. Сначала надо с книгами покончить, а уже потом браться за журналы.
« Последнее редактирование: 14 Марта 2013, 19:47:02 от monday2000 »

otona.onnanoko

  • Новичок
  • *
  • Сообщений: 6
    • ICQ клиент - 328300195
    • Просмотр профиля
Re: Модифицирование Scan Tailor
« Ответ #68 : 14 Марта 2013, 21:07:49 »
monday2000
 :o Я ошиблась, а не коверкала! Господи, да хоть щаз баньте. Не ожидала такого дикарства. Пфи

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Модифицирование Scan Tailor
« Ответ #69 : 11 Апреля 2013, 19:20:47 »
Новая опция:

Quadro_Zoner

Это развитие опции Picture_Shape, позаимствованной из Scan Tailor Enhanced. Я назвал это режимом "Квадро", а новые зоны - "квадро-зоны".

Описание её алгоритма:

Цитировать
1. Я назначил произвольный порог - 25%. Взял просто с потолка это значение.
 
2. Беру верхнюю горизонтальную границу PictureShape-зоны. В цикле перемещаюсь от неё внутрь фигуры (т.е. цикл по горизонтальным рядам зоны). На каждом шаге цикла в другом цикле прохожу по всем словам (32-битным) этой стороны зоны. Если текущее слово - целиком белое - увеличиваю построчный счетчик белых слов. 
 
3. После каждого прохода цикла по словам (внутреннего) смотрю - если отношение счетчика белых слов к количеству слов стороны зоны больше порога (25%) - то выхожу из внешнего цикла, считая при этом, что я нашёл истинную границу прямоугольной фигуры.
 
4. Повторяю то же самое для оставшихся 3-х сторон PictureShape-зоны. Только для левой-правой сторон вместо слов использую, разумеется, просто пиксели.

Готовая зона отрисовывается не как растровая - а как векторная прямоугольная зона, что позволяет пользователю подкорректировать её (двигая "прямоугольно" её углы - с зажатым Ctrl).

Новая версия программы доступна на оффсайте:

https://sourceforge.net/projects/scantailor/files/scantailor-devel/featured/

yuree

  • Постоялец
  • ***
  • Сообщений: 172
    • Просмотр профиля
    • E-mail
Re: Модифицирование Scan Tailor
« Ответ #70 : 21 Апреля 2013, 13:08:31 »
Уж не знаю, хорошо это или плохо но мне наконец-то(?) попался скан который не может корректно пройти этап смешанного режима. Устанавливал Ваши и scantailor-featured-2013.04.10-32bit-install и scantailor-featured-2013.03.12-32bit-install, всё без толку. По разному изголялся. И на ХР и на 7 — один результат. Или картинки "вытягивает" или выбеливает. Вот эти две картинки ("точнее - только вторая") → http://yadi.sk/d/gz9HFJMo4DLIT

Поясню в двух словах. Во всех двух сканах я выбрал "полезная область" - всё поле. Первый скан, титул, я сохранил в формате "фото" а вот второй, попытался сохранить как "смешанный". Вот здесь и началось.
Нет, я согласен, можно во втором файле выделить только фото (текста на нём внизу нет) и загнав в левый верхний угол сохранить как "фото". Но что-же делать когда текст присутствует?
Я-то решил эту проблему, но хотелось бы всё таки раз и навсегда закрыть тему с выбеливаниями. Закрыть её в Вашей разработке.

С уважением — Юрий

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Модифицирование Scan Tailor
« Ответ #71 : 23 Апреля 2013, 19:47:02 »
yuree
Большое спасибо за баг! Если ещё найдёте - обязательно пишите. Вот исправленная версия:

Scan Tailor Featured 2013.04.23
http://rghost.ru/45501577

yuree

  • Постоялец
  • ***
  • Сообщений: 172
    • Просмотр профиля
    • E-mail
Re: Модифицирование Scan Tailor
« Ответ #72 : 23 Апреля 2013, 22:06:12 »
yuree
Большое спасибо за баг!

Простите, если можно так выразиться — "Пожалуйста". Только я совершенно не понял причины данного бага. На всех остальных сканах Ваша последняя, точнее уже' предпоследняя версия, работала "на ура". А здесь, просто рубанула. В чём может быть причина, понятия не имею. 

Цитировать
Если ещё найдёте - обязательно пишите. Вот исправленная версия:

Scan Tailor Featured 2013.04.23
http://rghost.ru/45501577

Хорошо. Надеюсь в последующем, моих сообщений подобного характера будет всё меньше и меньше.
Спасибо Вам за Ваш труд.

_______________________
ПС. Только что проверил свой проблемный скан на Вашей последней версии — проблема исчезла. Спасибо.
« Последнее редактирование: 23 Апреля 2013, 22:31:27 от yuree »

monday2000

  • Администратор
  • *****
  • Сообщений: 985
    • AOL клиент - -
    • Yahoo клиент - -
    • Просмотр профиля
    • Создание книг в электронном виде из бумажных книг (в формате DjVu)
    • E-mail
Re: Модифицирование Scan Tailor
« Ответ #73 : 23 Апреля 2013, 23:45:16 »
yuree
Цитировать
В чём может быть причина, понятия не имею.
Причина в том, что Scan Tailor - всё-таки чужая для меня программа, и её поведение не на 100% для меня предсказуемо. В данном случае сам скан - серый, а "скан подмены" (откуда я беру неосветлённые пиксели зоны) получился почему-то цветной, т.е. 24-битный. Я просто добавил проверку на битность исходного скана, приводящую скан подмены к той же битности. А почему-так - а чёрт его знает. :)
Цитировать
ПС. Только что проверил свой проблемный скан на Вашей последней версии — проблема исчезла. Спасибо.
Пожалуйста. :)

Если ещё будут какие-то баги - прошу мне сообщать.

yuree

  • Постоялец
  • ***
  • Сообщений: 172
    • Просмотр профиля
    • E-mail
Re: Модифицирование Scan Tailor
« Ответ #74 : 24 Апреля 2013, 00:13:22 »
В данном случае сам скан - серый, а "скан подмены" (откуда я беру неосветлённые пиксели зоны) получился почему-то цветной, т.е. 24-битный. Я просто добавил проверку на битность исходного скана, приводящую скан подмены к той же битности. А почему-так - а чёрт его знает. :)

Понятно.

Цитировать
Если ещё будут какие-то баги - прошу мне сообщать.

Хорошо.