Просмотр сообщений

В этом разделе можно просмотреть все сообщения, сделанные этим пользователем.


Сообщения - yuree

Страницы: 1 ... 11 12 [13]
181
don555

Я выкручивался, предварительно делая вокруг таких (с иллюстрациями, касающимися границ страницы) картинок серую (цвета незаполненного текстом участка страницы) неширокую рамку  в FastStone Image Viewer.

 :o :o

Ну Вы жжёте!!
Можно, конечно, было попросить забубенить в ST что-то типа "гаммы" а не "выравнивания", как в ФШ ::) но думаю, это всё излишки. Править листки с картинками можно хоть на первой стадии, хоть тогда когда они отделены от текста. Юзать ту-же гамму, например, в ФШ.

182
Всё это дело, довольно легко можно реализовать с помощью ФШ. И подключаемых к нему плагинов, независимых производителей ;)
К слову. Нечто похожее на hq2x можно получить с помощью плагина от Alien Skin под названием BlowUp.

183
Программирование / Re: CuneiForm для DjVu
« : 15 °ЯаХЫм 2011, 18:48:44 »
Уважаемый monday2000. Пишет Вам одноимённый юзер с rutracker.org
Итак, я прочёл предоставленную Вами ветку и зарегистрировался.
Теперь понятно почему hOCR пора сдавать в утиль а предпочтение отдать XML'скому формату. Отсюда вопрос.
Каким образом можно организовать единый процесс по созданию OCR слоя (русский-английский) с последующей его правкой, хотя-бы даже в том-же EmEditor, коим я пользуюсь?
Понимаю, о визуальном сличении, как в Abbyy FR например, не может быть и речи но вполне допустимо прогнать OCR-текст через текстовый редактор и словарь. Хотя-бы через тот-же ОРФО или тот что стои'т у меня для проверки правописания в Мозилле или Опере (формат — тупо большой набор слов) и портировать исправленный документ в DjVu. 
Если возможно на страницах данной ветки, "на пальцах", пояснить что за чем идёт и что куда сгружать.
Ведь, думаю, не многие даже знают как запускать из командной строки Ваши экзэшники ::)

И последнее, здесь.
Что-бы там не говорили но, повторюсь, CuneiDjVu довольно не плохой продукт, даже на теперешней стадии реализации. Сравните пару страниц из книги ;)

Document Express 6.5 Professional

дельнОСТЬ существования в самом себе. В иrре
нет никакой идеи) налаrаемой на мир. Она
б (( »
тре ует жить моментом) неисчерпаемым
разнообразием жизненных мrновений и) зна
 
чит) жить воистину) избеrая зависимости от
умственных абстракций) от всяких отвлечен
 
ных понятий. Тирании абстракций
 неиз
 
бежно словесной
 китайцы противопостав
 
ляли молчаливое доверие к самой жизни) к ее
неостановимому потоку) каждое мrновение
ставящему нас перед бездной тысяч превра
 
u "
щении) десяти тысяч перемен .
Китайская мудрость
 это наука бодрство
 
"
вания духа) чуткоrо отслеживания текущеrо
момента". Ее rлавный вопрос
 не что) даже
не как) но
 коzда? Коrда действовать и коrда
"б) ,(
хранить покой? Коrда ыть и коrда не
быть"? Ключевые понятия китайской мысли

 это "случай") который в жизни мудроrо
оказывается неизменной судьбой; всеобъят
 
ная "сила ситуации") которая без видимоrо
воздействиЯ направляет движение Bcero мира;
"сокрытый импульс» жизни) определяющий
изнутри при роду каждой вещи. Знаменитые
"китайские церемонии») мноrозначительная
торжественность жеста были способом такой
виртуальной коммуникации) подразумевае
 
мой стратаrемами. Коммуникации в безмол
 
==========================================================================
==========================================================================

CuneiDjVu

дельность существования в самом себе. В игре
нет никакой идеи, налагаемой на мир. Она
требует "жить моментом", неисчерпаемым
разнообразием жизненных мгновений и, зна-
чит, жить воистину, избегая зависимости от
умственных абстракций, от всяких отвлечен-
ных понятий. Тирании абстракций — неиз-
бежно словесной — китайцы противопостав-
ляли молчаливое доверие к самой жизни, к ее
неостановимому потоку, каждое мгновение
ставящему нас перед бездной тысяч превра-
щений, десяти тысяч перемен .
Китайская мудрость — это наука бодрство-
&l
вания духа, чуткого отслеживания текущего
момента". Ее главный вопрос — не что, даже
не как, но — когда? Когда действовать и когда
хранить покой? Когда "быть" и когда "не
быть" ? Ключевые понятия китайской мысли
— это 'случай", который в жизни мудрого
оказывается неизменной судьбой; всеобъят-
ная "сила ситуации", которая без видимого
воздействия направляет движение всего мира;
"сокрытый импульс жизни, определяющий
изнутри природу каждой вещи. Знаменитые
китайские церемонии", многозначительная
торжественность жеста были способом такой
виртуальной коммуникации, подразумевае-
мой стратагемами. Коммуникации в безмол-
вии, где единичное сходится со всеобщим.
Все, на что мог надеяться гениальный человек
в Китае, — это счастливый случай", позво-
ляющий претворить свою судьбу, реализовать
себя без остатка.
Случай предоставляется нам лишь раз в
день, в месяц, в год, в десять лет, в сто лет,—
писал в XVII в. ученый Тан Чжэнь. — Вот по-
чему нужно быть готовым не упустить его.
Даже если этот случай откроется нам за едой,
нужно тотчас бросить свои палочки и выбе-
жать из-за стола. Ибо может статься, что, ко-
гда мы закончим трапезу, случай уже ускольз-
нет от нас...
Случай — это встреча человека с его судь-
бой, и мгновение, в которое решается, быть
ли победе или поражению..."
Счастливый случай, о котором толкует Тан
Чжэнь, означает не что иное, как мгновенное
и полное претворение предельно малого в
предельно большое, конкретного — во всеоб-
щее. Быть мудрым по-китайски — значит
просто уметь все делать вовремя, без остатка
переносить себя в целокупное движение жиз-
ни и тем самым, как ни странно, не выдавать
своего присутствия, быть "некоронованным
повелителем' мира, 'драконом, сокрытым в
облаках". Или, как резонно замечает автор

Итак, как видно из сравнения, качество распознавания не на стороне Лизардтеха ::)
К тому-же, как Вы заметили CuneiDjVu знак "—" упорно воспринимает как "—". Но мне, в том-же EmEditor ничего не сто'ит произвести замену одной группы знаков на другой знак. Например как здесь:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE DjVuXML PUBLIC "-//W3C//DTD DjVuXML 1.1//EN" "pubtext/DjVuXML-s.dtd">
<DjVuXML>
   <BODY>
      <OBJECT data="file://localhost/fake_filename.djvu" type="image/x.djvu" height="1949" width="2657" usemap="fake_filename.djvu">
         <PARAM name="PAGE" value="36_0007_0001.djvu" />
         <HIDDENTEXT>
            <PAGECOLUMN>
               <REGION>
                  <PARAGRAPH>
                     <LINE>
                        <WORD coords="55,172,269,205">дельность</WORD>
                        <WORD coords="285,165,607,205">существования</WORD>
                        <WORD coords="622,164,644,187">в</WORD>
                        <WORD coords="659,161,792,186">самом</WORD>
                        <WORD coords="807,148,903,183">себе.</WORD>
                        <WORD coords="920,147,946,181">В</WORD>
                        <WORD coords="961,156,1055,191">игре</WORD>
                     </LINE>
                     <LINE>
                        <WORD coords="58,229,128,254">нет</WORD>
                        <WORD coords="155,217,332,253">никакой</WORD>
                        <WORD coords="360,223,471,254">идеи,</WORD>
                        <WORD coords="499,209,742,245">налагаемой</WORD>
                        <WORD coords="770,216,818,240">на</WORD>
                        <WORD coords="846,213,941,248">мир.</WORD>
                        <WORD coords="970,200,1056,235">Она</WORD>
                     </LINE>
                     <LINE>
                        <WORD coords="58,272,219,320">требует</WORD>
                        <WORD coords="256,268,384,305">"жить</WORD>
                        <WORD coords="423,260,676,303">моментом",</WORD>
                        <WORD coords="715,267,1055,304">неисчерпаемым</WORD>
                     </LINE>
                     <LINE>
                        <WORD coords="59,327,382,376">разнообразием</WORD>
                        <WORD coords="400,330,645,358">жизненных</WORD>
                        <WORD coords="663,317,896,352">мгновений</WORD>
                        <WORD coords="915,324,951,353">и,</WORD>
                        <WORD coords="971,322,1055,347">зна-</WORD>
                     </LINE>
                     <LINE>
                        <WORD coords="60,396,145,425">чит,</WORD>
                        <WORD coords="168,393,276,419">жить</WORD>
                        <WORD coords="300,389,509,424">воистину,</WORD>
                        <WORD coords="532,374,691,411">избегая</WORD>
                        <WORD coords="716,379,988,407">зависимости</WORD>
                        <WORD coords="1012,377,1058,401">от</WORD>
                     </LINE>
                     <LINE>
                        <WORD coords="60,448,320,488">умственных</WORD>
                        <WORD coords="340,435,597,480">абстракций,</WORD>
                        <WORD coords="618,440,665,464">от</WORD>
                        <WORD coords="686,438,831,463">всяких</WORD>
                        <WORD coords="851,434,1057,460">отвлечен-</WORD>
                     </LINE>
                     <LINE>
                        <WORD coords="62,507,149,533">ных</WORD>
                        <WORD coords="177,495,369,529">понятий.</WORD>
                        <WORD coords="400,490,588,535">Тирании</WORD>
                        <WORD coords="619,485,863,530">абстракций</WORD>
                        <WORD coords="892,501,918,505">—</WORD>
                        <WORD coords="947,488,1058,515">неиз-</WORD>
                     </LINE>
                     <LINE>
                        <WORD coords="63,554,197,588">бежно</WORD>
                        <WORD coords="222,549,438,585">словесной</WORD>
                        <WORD coords="461,565,488,570">—</WORD>
                        <WORD coords="510,545,695,583">китайцы</WORD>
                        <WORD coords="720,546,1059,585">противопостав-</WORD>
                     </LINE>
                                                        ...............
                     <LINE>
                        <WORD coords="1452,1585,1744,1623">повелителем'</WORD>
                        <WORD coords="1770,1599,1888,1634">мира,</WORD>
                        <WORD coords="1925,1586,2155,1634">'драконом,</WORD>
                        <WORD coords="2182,1598,2402,1633">сокрытым</WORD>
                        <WORD coords="2429,1599,2451,1622">в</WORD>
.................
                  </PARAGRAPH>
               </REGION>
            </PAGECOLUMN>
         </HIDDENTEXT>
      </OBJECT>
      <MAP name="fake_filename.djvu" />
   </BODY>
</DjVuXML>

На
                     <LINE>
                        <WORD coords="62,507,149,533">ных</WORD>
                        <WORD coords="177,495,369,529">понятий.</WORD>
                        <WORD coords="400,490,588,535">Тирании</WORD>
                        <WORD coords="619,485,863,530">абстракций</WORD>
                        <WORD coords="892,501,918,505">—</WORD>
                        <WORD coords="947,488,1058,515">неиз-</WORD>
                     </LINE>
                     <LINE>
                        <WORD coords="63,554,197,588">бежно</WORD>
                        <WORD coords="222,549,438,585">словесной</WORD>
                        <WORD coords="461,565,488,570">—</WORD>
                        <WORD coords="510,545,695,583">китайцы</WORD>
                        <WORD coords="720,546,1059,585">противопостав-</WORD>
                     </LINE>
                                                        ...............
                     <LINE>
                        <WORD coords="1452,1585,1744,1623">повелителем'</WORD>
                        <WORD coords="1770,1599,1888,1634">мира,</WORD>
                        <WORD coords="1925,1586,2155,1634">'драконом,</WORD>
                        <WORD coords="2182,1598,2402,1633">сокрытым</WORD>
                        <WORD coords="2429,1599,2451,1622">в</WORD>
                     </LINE>

Т.е после слов "абстракции" и "словесной" стои'т уже' не "—" а "—".
Весь вопрос в том — как добавить этот исправленный файл в DjVu.

И, простите, получилось несколько овервордовски.

Страницы: 1 ... 11 12 [13]