Что ж — будем рассказывать. Регулярно и методично, каждую неделю, до тех пор, пока либо мобилоп не одумается, либо тариф сам по себе не засохнет и не отвалится.
Теперь переходим к главной теме сегодняшней «Голубятни». Читатели наверняка в курсе, что в октябре месяце увидел свет долгожданный десятый релиз пакета OCR от Abbyy FineReader. Почему долгожданный? По многим причинам. Во-первых, на подготовку «десятки» у Abbyy ушёл не привычный год, а целых два. Во-вторых, «Файнридер» — это программа, банально находящаяся вне конкуренции. Не потому, что конкуренты плохие, а потому что их нет в природе. Где-то в неведомых далях носятся слухи про Iris и ещё пару-тройку летучих голландцев из категории оптического распознания символов, но все эти альтернативы настолько хлипкие, настолько непонятно к чему пришиваемые, а на поверку — ещё и настолько убогие (разумеется, лично ковырял и пробовал — и 10 лет назад, и 5, и минувшим летом), что можно смело говорить об эксклюзивности и уникальности разработки наших соотечественников.
В-третьих, девятая версия «Файнридера», как и восьмая, седьмая, шестая и… и… и… далее — в глубину веков, при всей своей добротности, надежности, в общем и целом высоком качестве распознавания того, что не очень сложно распознать, всегда оставляла сильно желать лучшего по части работы со сложными текстами: встроенными таблицами, надписями на картинках, рукописями, мудреными формулярами и — на мой взгляд, самое главное! — фотографиями документов, снятыми не могучими «зеркалками», а махровыми мыльницами, которыми пользуется 99 % человечества.
Со всеми этими слабинками жить удавалось вполне припеваючи, так что к «восьмёрке» и «девятке» «Файнридера», с помощью которых перегнал по меньшей мере три сотни тысяч (!) книжных страниц в электронный вид (я читаю только электронные книги — бумажные люблю лишь держать-крутить в руках и… нюхать! Да-да, есть у меня такая персональная токсикомания), испытывал давнюю и стойкую приязнь.
Правда, рассказом о двух предыдущих — на мой взгляд, вполне себе удачных — версиях «Файнридера» я бессовестно манкировал, ибо радикальных улучшений и без того пристойного кода не обнаружил. Отсутствие этих улучшений, кстати, надолго отвратило от тестирования программ Abbyy Антонелло, который для себя лично твёрдо решил, что качественное развитие «распознавалки» закончилось где-то на 6-й версии, после которой каждый новый релиз привносил нового лишь по линии рюшечек и шашечек.
Я же, будучи человеком не столько дотошным, сколько романтичным, в чудеса верящим, исправно устанавливал и тестировал всякую новую версию «Файнридера», констатировал её «нехужесть» относительно версии предыдущей и на том успокаивался до лучших времён.
С «десяткой», однако, ситуация изменилась. То ли извелся в ожидании, то ли пресс-релиз Abbyy подогрел: «По сравнению с ABBYY FineReader 9.0 в новой версии программы существенно улучшено качество распознавания документов со сложной структурой — таблиц, контрактов, журнальных статей с текстами поверх картинок, графиками и рисунками. Гораздо проще считываются и переводятся в нужные форматы изображения низкого качества — факсы и снимки, сделанные с помощью фотокамеры мобильного телефона. А документы, снятые обычными цифровыми фотоаппаратами, ABBYY FineReader 10 преобразует на 30 % точнее предыдущей версии программы. В десятой версии увеличено число языков распознавания — теперь их стало 186. При этом качество „понимания“ текстов на азиатских языках улучшилось на 30 %, а на европейских — на 20 %».
Такое впечатление, что разработчики буквально мысли мои читали, внося улучшения в код «десятки» (сравните текст пресс-релиза с моим списком недоработок страницей выше). Добавьте сюда анонс улучшения распознавания формата djvu, в котором у меня скопилось огромное количество электронных книг, и вы поймете трепетное нетерпение, с которым я взялся за тестирование FineReader 10.
День, когда Abbyy представляла новый релиз своего продукта журналистам, я отметил ударным сбором винограда на своей молдавской фазенде, а потому официально-именного вручения коробочной версии не состоялось. Но это, знаете ли, и замечательно (как в том анекдоте про чукчу: «Жена, цяйника закипел?» — «Не закипел!» — «Ну и халасо, ста не закипел!»), потому как по случаю могу позволить себе большую вольность (не помню, делился ли публично своими морально-этическими принципами, которых придерживаюсь беспрекословно в сношениях с разработчиками и производителями: если мне передают программу или железяку на тестирование официально и по собственной доброй воле, я пишу только положительные отзывы, в случае же отрицательных впечатлений просто вообще ничего не пишу).