Дополнительно > Флейм

Недостатки Scan Tailor

<< < (2/327) > >>

57an:
SorokaSV,
LZW черно-белые tiff - это реакция Tulon на просьбы трудящихся.
Похоже, однозначного решения данной проблемы нет. Только пункт в опциях - тип сжатия 1битных сканов. Либо перекодирование отдельным шагом.

monday2000,
Еще раз повторяю - чудес СТ никогда и никому не обещал. Не подавайте фуфло на вход - не получите фуфло на выходе. Как получить не фуфло на входе - см. советы по сканированию в вики-документации к СТ.
У Вас-то самого есть еще что сказать именно по-существу, кроме майских лозунгов про злого непослушного Tulon'а, который-де позарился на Ваш кусочек пирога? :)

Кстати, по мере возрастания опыта, уменьшается и перфекционизм в отношении постобработки. В большинстве случаев для разделенных сканов с растровыми иллюстрациями я уже нахожу вполне допустимой схему 600dpi для текста, разрешение растра (120 или 150 dpi) для иллюстраций. Тем более, что с учетом сглаживания на экране небинаризованный (попавший в иллюстрации) 150 dpi текст выглядит практически так же, как бинаризованный 600 dpi.

Т.е. все чаще хватает функционала FSD+msepdjvu с его парой-тройкой опций для настройки.

Это к вопросу об "суррогатности" одношагового МРС-кодера.

monday2000:
57an

--- Цитировать ---У Вас-то самого есть еще что сказать именно по-существу, кроме майских лозунгов про злого непослушного Tulon'а, который-де позарился на Ваш кусочек пирога?
--- Конец цитаты ---
Давайте подведём некоторые итоги (т.е. я скажу "по-существу").

Я затеял это обсуждение с одной целью: показать наличие проблемы. Возможно, мне не вполне это удалось - вопрос всё же довольно тонкий. Может, просто с первого раза такие вещи не находят широкого общественного понимания. Думаю, я ещё не раз вернусь к этой теме - стараясь всякий раз подобрать наиболее убедительные примеры. Я "нутром чую", что СТ - это "не то", но объяснить это окружающим непросто.

Зачем мне нужно "доказать, что СТ - плохой"? А для одной цели - открыть желающим дорогу в плане создания иных книгосканировочных программ. Ведь сейчас все словно зазомбированы этим СТ, и вроде как "нет смысла" делать кому-то иную программу по сканобработке.

А смысл - есть, и это главный вывод.

Можно ли исправить СТ? Быть может. Я бы предложил следующее:

1. Убрать из СТ стадии 1. Исправление ориентации и 2. Разрезка страниц. Взамен сделать отдельную программу, и в ней разрезать развороты (со сплошным перенумеровыванием выводных файлов).

2. Сканы, прошедшие стадию 3. Компенсация наклона, сохранять на диск как промежуточные файлы (автоматически внутри самого СТ). Это позволит, во-первых, получить желающим программу для пакетного визуального Deskew. А во-вторых, и это самое главное - см. далее п.3.

3. Реализовав п. 2, На стадии 4. Полезная область делаем ЛАСТИК. И чистим им сканы, сохранённые на диск после 3. Компенсация наклона - с тем, чтобы уже на почищенных ластиком сканах определять полезную область.

4. На стадии 6. Вывод сделать функционал "Сепаратор" + опцию вывода переднего субскана в сером/цветном.

Такова программа-минимум, как можно было бы исправить СТ. Это, конечно, не жёсткая схема - а лишь идея на концептуальном уровне. Но, думаю, Tulon никогда этого не сделает.

--- Цитировать ---Не подавайте фуфло на вход - не получите фуфло на выходе.
--- Конец цитаты ---
А это невозможно. Сколько есть книг, которые как ни сканируй - всё равно получишь низкокачественные сканы.

--- Цитировать ---Т.е. все чаще хватает функционала FSD+msepdjvu с его парой-тройкой опций для настройки.

Это к вопросу об "суррогатности" одношагового МРС-кодера.
--- Конец цитаты ---
Ну я так и знал, что Вы именно так и рассуждаете - именно отсюда "растут ноги" Вашей идеи "скрестить DjVu Small и DjVu Imager". Такие убеждения - это настоящий "корень зла". Tulon-то рассуждает точно также - и это главное, почему СТ обречён "в исторической перспективе" на крах. Нельзя так рассуждать - нужно как раз наоборот. Потому что, откуда Вам знать, что на 10 тыс. "типовых" случаев сырых сканов не встретится один такой, который не впишется в общие рамки? Tulon и Вы этим пренебрегают - потому что так, конечно же, проще - но это дьявольская "простота" - ведущая в ад, если можно так выразиться.

--- Цитировать ---который-де позарился на Ваш кусочек пирога?
--- Конец цитаты ---
Да пусть зарится - я не возражаю. Я лишь возражаю против использования miniDjVu. Нельзя miniDjVu использовать - по крайней мере, пока. Только после гипотетического радикального математического-алгоритмического улучшения.
То, что он "позарился" (как Вы выразились) - это действительно так. Вместо того, чтобы думать об улучшении СТ (что крайне необходимо), он стремится захватить как можно бОльшую долю "рынка" DjVu-книгосканирования.

Подобное я воспринимаю как действия, диктуемые личным честолюбием - а не интересами дела. Возникает вопрос:

И какого ж хрена Вы лезете в создание своего DjVu-кодёра - когда Ваш СТ ещё пока что ниже плинтуса?

И ладно бы, допустим, делал бы он софт высочайшего качества - да ради бога, "захватывай", друг, сколько влезет. Так нет - он делает "на скорую руку" недостаточно качественные поделки (маскируя низкое качество баснями якобы "а лучше и не надо"), и ими старается "захватить рынок" - попутно ловко вводя в заблуждение малограмотных юзеров (относительно качества СТ и его будущего DjVu-кодёра, который с вероятностью 98% будет столь же лишён "ненужных" фич).

К тому же - Tulon не просто хочет "захватить рынок". Он же заодно пытается оттуда вышвырнуть другие программы - путём того, что умышленно и специально делает СТ максимально несовместимым что с DjVu Small+DjVu Imager, что с Book Restrorer 4.2.1. Это ли не есть подтверждение нездоровых честолюбивых амбиций? Напоминает кукушонка, который, будучи подброшенным в гнездо, выкидывает яйца птенцов приёмных родителей.

СТ делать - это ж надо годами, кропотливо как bolega, вылизывать каждую мельчайшую мелочь. "Галопом по европам" не выйдёт.

Конечно, Tulon не в силах чисто физически сделать много высококачественных программ - но честолюбие-то гложет, ему, как я понимаю, захотелось "доминировать" (его желание создать свой DjVu-кодёр) - вот он и пытается "втереть очки", что якобы "так и надо" и "этого качества достаточно".

В нашем деле нельзя рассуждать понятиями "доминирования". В нашем деле нужно уметь подчинить личные амбиции и честолюбие интересам общего дела. Я, к примеру, всегда именно так и поступаю - и потому-то такие, как Tulon, меня не могут не возмущать (тщеславные честолюбцы). И продукция таких людей, как показывает практика, почему-то всегда в конечном итоге идёт всем во вред.

monday2000:
Обнаружился ещё такой момент:

Качество бинаризации, которое делает СТ, оказалось недостаточным. Я сравнил СТ-бинаризацию с бинаризацией Book Restorer - оказалось, что СТ производит более тонкие (худосочные) буквы, нежели чем Book Restorer. После BR текст выглядит таким, приятно-жирным, чётким-пречётким. СТ порождает ощутимо более тонкие буквы. Вроде мелочь - а всё же имеет значение.

СТ, думаю, имеет слишком малый диапазон порога бинаризации - даже после его расширения до +-30. Это ещё одно проявление ложно понятой "простоты" использования программы. А может - дело не только в одном лишь пороге - может, Оцу-бинаризация вообще не самое лучшее. Много ли Tulon над ней экспериментировал? Может, разумнее сделать в СТ несколько видов бинаризации - на выбор пользователя?

И ещё такое у меня возникло соображение: со слов Tulon он проживает сейчас в Лондоне. Я думаю, это тоже негативно влияет на качество СТ. Tulon декларирует, что делает СТ "для домохозяек" - и я думаю, что имеются в виду именно западные "домохозяйки" - а не русские.

Другими словами, Tulon, живя "там", невольно погружён в ту культурную среду, и невольно подстраивается под вкусы и возможные запросы именно пользователей американо-западного толка.

Ведь именно им так и надо - попроще, попримитивней, и не нужно им слишком уж хорошее качество (потому что они вообще гораздо более ленивые ИМХО). Западный обыватель в массе своей гораздо более туп и убог, нежели чем российский.

А DjVu-книгосканирование - явление сугубо русское (точнее, пост-советское). Так что, получается, глупо делать программу для сканобработки, ориентируясь на западников. Такую программу следует делать для нас (а не для английских-американских потенциальных пользователей - им всё это и даром не нужно).

monday2000:
Есть и ещё одно соображение, почему нужно делать альтернативу СТ:

Такая область, как обработка сканов для последующего их дежавючения, слишком необъятна, чтобы какой-то один человек (то ли Tulon, то ли bolega) могли полностью её охватить своими единичными программами, и удовлетворить таким способом запросам всех пользователей.

Я думаю, что число программ по сканобработке следует довести до 5-10. Нельзя допускать такой обречённости, как сейчас: или - СК, или - СТ. Всё. По-другому - никак, "хоть в петлю".

Случай с Tulon характерен тем, что Tulon, ещё только начиная делать свой СТ, заведомо повёл себя как недобросовестная личность - поставив личное превыше общественного. В сущности, именно за это я его осуждаю - а все конкретные недостатки СТ, мною тут раскритикованные, есть лишь производное от такого порочного подхода.

К примеру, того же bolega никак не обвинишь в недобросовестности. Совершенно очевидно, что СК делался с целью "решить проблему сканобработки" - а не "снискать себе лавры великого решателя проблемы сканобработки" (как поступил Tulon).

Tulon постоянно пытается "залакировать" действительность, и выставить свой СТ тем самым в выгодном свете, слегка при этом исказив реальность. В сущности, такие действия полностью подпадают под понятие "пиар" (а по-русски - "обман" и "очковтирательство"). Tulon действует примерно так: он сто раз говорит "сахар, сахар, сахар, ...." - и твёрдо уверен, что от этого во рту станет слаще - но на самом-то деле это не так. Истина - капризная барышня, и она не желает подчиняться директивам Tulon.

В общем, Tulon постоянно пиарит (в нехорошем смысле) свой СТ.

И ещё Tulon постоянно пытается разного рода шулерскими приёмами "подогнать" реальность под свой СТ - а реальность что-то ну никак под СТ не "подгоняется". :) Реальность оказалась "почему-то" гораздо сложнее и многограннее, чем этот примитивный СТ.

Поэтому, необходимо, чтобы следующий человек, начиная делать программу по скан-обработке, с самого начала поставил бы себе цель не "стяжать лавры", а "решить проблему со сканобработкой".

monday2000:
Выскажу свои соображения по поводу функционала разделения сдвоенных разворотов.

Я всегда был твёрдо убеждён в том, что разрезание сдвоенных разворотов (отпиливание ошмётка соседней страницы на одиночном скане) следует делать в отдельной программе - а уже порезанные сканы (и переименованные в новую сплошную нумерцию) загружать в СТ (СК) и дообрабатывать до конца.

Авторы же как СК, так и СТ почему-то убеждены в обратном. Обе программы - и СТ, и СК - делают разрезание разворотов в той же самой программе (как один из этапов), где делается вся последующая сканобработка.

Я думаю, что такой подход в корне неверен. Он ведёт к ненужным усложнениям программы по сканобработке и усложняет жизнь пользователю. Например, в СК существует такое понятие, как "левые" и "правые" страницы (это дико неудобно, ужасно глупо, и т.д.). А в СТ Tulon был вынужден сделать весьма и весьма сложный программный код, цель которого - отображать исходные сканы "виртуально" уже порезанными на всех последующих стадиях.

Но и всё равно - подход Tulon то и дело порождает глюки и неудобства, вынуждает Tulon идти на какие-то хитроумные извращения с нумерацией выводных файлов.

А всё это из-за того, что и bolega, и Tulon ложно понимают понятие "простота программы". Им кажется, что "всё должно быть в одной программе" - якобы в этом и заключается "простота".

Приведу для сравнения такую аллегорию: представьте себе вилку, на кончике которой сделана ложка. В самом деле - ну зачем иметь 2 столовых прибора - тогда как было бы здорово, поесть суп (на "первое") ложкой - а затем, перевернув ложку кверх ногами, "превратить" её в вилку - и ею далее поесть кашу (на "второе").

"О, как здорово!" - скажут bolega и Tulon. :) "Это же как просто! - Не надо иметь целых 2 столовых прибора вместо одного!"  "Мы не хотим "заморачиваться" с отдельной ложкой и отдельной вилкой - боже мой, какая сложность - мы хотим одну единую ложко-вилку!" :)

Tulon скажет "Я делаю столовые принадлежности для домохозяек - которые не хотят "заморачиваться" с отдельной ложкой и отдельной вилкой - поэтому я сделал простую и удобную единую ложко-вилку". :)

Вот именно так bolega и Tulon понимают понятие "простоты". Ну разве не бред? Что можно после этого сказать об этих людях и об их видении мира? :) Как минимум, просто пожать плечами... И вот ТАКИЕ люди делают нам программы для сканобработки...

Я предлагал Tulon вычленить функционал разрезания сдвоенных разворотов в отдельную программу. Я даже привёл ему такой аргумент, что отдельная программа для разрезания сдвоенных разворотов может потребоваться не только для сканобработки - но и, например, для тех, кто делает OCR в CuneiForm (которая не умеет, подобно Файнридеру, сама разрезать развороты).

На что Tulon мне ответил примерно следующее: "а меня не волнуют проблемы пользователей CuneiForm - меня волнует только СТ".

Только теперь я уже понимаю - что это было ещё одно проявление нехорошего честолюбивого эгоизма Tulon. Да он просто боится, чтобы СТ никто не "оттеснил на 2 план", т.е. Tulon всеми силами старается не допустить использования СТ в качестве вспомогательного средства сканобработки - чтобы не потерять "пальму первенства" - и ради этого он готов пуститься во все тяжкие - пиар, пренебрежение реальными интересами дела, и т.п. Такое поведение я рассматриваю на грани преступного.

Да что там "вспомогательного средства сканобработки" - Tulon просто панически боится вообще, чтобы ЛЮБАЯ сторонняя программа прикасалась к сканам, проходящим/прошедшим СТ - вот до чего его довело его болезненное честолюбие!

Есть тут ещё один подлый момент: когда просишь у Tulon "сделайте то-то", он говорит "я очень занят, у меня нет времени, я устал". "Мне приходится делать сложные вещи, и я от этого сильно устаю".

На первый взгляд, вроде бы верно человек рассуждает. Какие нехорошие пользователи, требуют от Tulon слишком многого.

Но тут не всё так просто - тут надо посмотреть повнимательнее. На самом-то деле моя просьба вычленить функционал разрезания сдвоенных разворотов в отдельную программу должна сильно ОБЛЕГЧИТЬ жизнь Tulon - поскольку это привело бы к РАДИКАЛЬНОМУ упрощению программного кода СТ! Но Tulon "прикидывается чайником", и тут выставляя дело так, якобы "он устал от выполнения сложных по реализации запросов пользователей".

Такое поведение Tulon я расцениваю как мелкую подлость - на самом-то деле он таким путём маскирует истинную причину не-выделения в отдельную программу функционала по разрезанию страниц - это его честолюбивая боязнь "утратить пальму первенства".

Но я немного отвлёкся. Я не раз сравнивал процесс сканобработки с горно-обогатительной фабрикой. Сканы, как и руда - всегда разные на входе. Поэтому на горно-обогатительной фабрике руда подвергается ступенчатой обработке - последовательно проходя ряд аппаратов - и в каждом аппарате совершается некая одна-единственная операция. И, в зависимости от вида-качества входящей руды, последовательность цепочки таких аппаратов может варьироваться.

Почему же, спрашивается, на горно-обогатительной фабрике не сделают один-единственный большой аппарат, сочетающий в себе все простейшие операции по обработке руды - по жёсткой схеме? Tulon бы так и поступил - сказал бы, что так "проще". И что итоге? Да вверг бы горно-обогатительную фабрику в огромные убытки - когда пришлось бы его "чудо-аппарат" выкидывать - а взамен делать всё, как было - т.е. ряд простейших аппаратов. Хотя нет - никто бы ему просто не позволил сделать подобное там.

В философии работы горно-обогатительной фабрики заложен большой смысл. Он в том, чтобы последовательно-итеративно, всё более и более, на каждом этапе обработки УНИФИЦИРОВАТЬ входящую руду - постепенно приводя её к "общему знаменателю". Причём, за счёт "элементарности" и независимости каждого отдельного аппарата достигается максимальная гибкость и совершенство процесса унификации руды. И только уже унифицированный рудный полуфабрикат можно вписать в рамки некоей жёсткой схемы по финишной обработке руды.

А Tulon действует так, словно у нас сканы всегда поступают на вход уже унифицированными. Но это ведь не так - и более того - невозможно предположить - а какую экзотическую форму могут принять конкретные входящие сканы.

Сколько бы лет ни проходило - а иной пользователь порой представит образец таких экзотических сканов - что, как говорится, просто "на голову не оденешь". Разумеется, программа сканобработки должна, словно горно-обогатительная фабрика, иметь точно такую же философию унификации и обработки сканов. Как говорится - "всё уже придумано до нас" - и нет нужды заново изобретать велосипед.

Однако - очевидно, что Tulon никогда не пойдёт на реализацию идеи "вычленить разрезание разворотов в отдельную программу" - ему помешает страх "потерять пальму первенства".

Именно поэтому я и говорю о том, что нужен некий новый человек - кто сделал бы ещё одну программу по сканобработке. Подразумевая при этом, что такой человек должен, в отличие от Tulon, с самого начала поставить общественное превыше личного, и засунуть свои честолюбивые амбиции в одно место (а иначе ничего путного не получится).

Навигация

[0] Главная страница сообщений

[#] Следующая страница

[*] Предыдущая страница

Перейти к полной версии