Я обнаружил, что djvuxmlparser не умеет вставлять в DjVu OCR-слой, детализированный по буквам.

Я сделал Файнридером распознанный DjVu, детализированный на уровне букв (а не слов, как обычно). Благо, что DjVuOCR позволяет сделать побуквенную детализацию.
Затем экспортировал из этого DjVu OCR-данные в XML посредством djvutoxml. И попытался вставить полученный XML-файл обратно в DjVu при помощи djvuxmlparser. OCR-слой не вставился.

Похоже, что такая возможность в djvuxmlparser просто-напросто не реализована.

Очень странно и нехорошо. Вот в djvused это есть, к примеру.
Я написал вчера письмо Леону Боту и Биллу Риемерзу. Пока в ответ тишина. Проблема в том, что, как я понял, Леон Боту активно недолюбливает XML - а взамен хочет, чтобы все использовали только лишь djvused и его LISP-подобный язык. Леон мне ещё ранее сказал, что он не занимается DjVuLibre XML-утилитами, а занимается ими их автор - Билл Риемерз.
Только вот иметь дело с Биллом не очень-то хотелось. Он ИМХО не слишком горит желанием лишний раз шевельнуть ... рукой ради DjVu - в отличие от Леона.
Как бы не пришлось ещё со всех дел самостоятельно делать такую фичу в djvuxmlparser...
Да и вообще, djvuxmlparser выглядит гораздо менее развитым по сравнению с djvused. Хотя, в отличие от djvused, djvuxmlparser умеет менять в DjVu-файле DPI и гамму.
Лично мне хотелось бы со временем полностью перейти от djvused к DjVuXML-утилитам (djvuxmlparser и djvutoxml). А для этого DjVuXML-утилиты нужно доразвить до возможностей djvused. Можно также и слить их в единую утилиту - это ИМХО вполне логично. Ведь djvused тоже не разбит на 2 разные утилиты.
Пускай Леон твердит, что, мол, "djvused-язык ничем не хуже, а наоборот, легче, чем XML" - всё равно куда там тягаться djvused-языку с XML!

Это даже не смешно. XML имеет мировую популярность и используется настолько везде, что сам бог велел использовать его и в DjVu.
Посмотрел я ещё раз на hOCR-файлы, порождаемые CuneiForm. Да, действительно, там имеется информация о координатах каждой буквы - т.е. это OCR-слой, детализированный по буквам.
Это очень хорошо и здорово. Побуквенную детализацию можно использовать для создания "умного деспекла".
Я мог бы, пожалуй, теоретически сделать программу, которая будет удалять прямо из готового DjVu "соринки" между буквами (по принципу despeckle) - используя информацию о координатах прямоугольников, описанных вокруг каждой буквы (побуквенная OCR-детализация). Такие соринки - это те же шейпы, что и для букв используются. Эта задача во многом была бы аналогична раскраске маски (с точки зрения её запрограммирования). Правда, лучше для этого будет всё равно Файнридер использовать.

CuneiForm даже для такой задачи всё равно слабоват.