Выбрать главу

Тематика универсальна. Сколько дают на избирательные кампании Барака Обамы и Хиллари Клинтон их спонсоры-женщины и спонсоры-мужчины? Сколько библиотек закупили книжки о Гарри Поттере - в сравнении с закупками современной классики? (Поттер заметно впереди, что сразу видно по размеру "пузырей" на диаграмме.) Динамика государственной помощи США другим странам с 1946 по 2005 год - ну, здесь не буду ничего комментировать, однако настоятельно рекомендую посмотреть. Карты потребления алкоголя в разных странах, количества заключенных на душу населения, рейтинга приватности. Сети взаимосвязей библейских персонажей, то же для персонажей "Илиады", то же для других, фундаментальных и не очень, повествований.

Очень важно: под каждой картинкой - линк "Источник данных". Поучительно бывает посмотреть на эти источники чуть внимательнее. И осознать, например, что в один клик вы получаете подробную информацию о спонсировании избирательных компаний во всех этих бесчисленных штатах… Милейшая Бернис Роговиц (Bernice Rogowitz), большой энтузиаст проекта, дала дополнительные пояснения.

Думаете ли вы, что эта работа имеет коммерческий потенциал? Ведь ваши посетители могут создавать массу коммерчески ценной информации, выявляемой при визуализации наборов данных.

- Я не уверена, что коммерческое значение имеют сами визуализации как таковые. Но я думаю, что визуализация как компонент системы анализа любых данных - налоговых, расчетных и т. п. - невероятно важна. Полагаю, в ближайшие пять лет нас ждет бум продуктов для визуализации. Я работаю в этой области около десяти лет, и до сих пор только крошечная доля населения задумывалась о том, что ведь можно же изучать данные, можно смотреть на них. Это никогда не было частью нашего типичного культурного багажа. Сейчас все больше людей интересуется этим. В ходе проекта люди находят совершенно неожиданные для них инсайты, даже откровения (подтверждаю! - Л.Л.-М.). Интерактивная визуализация еще больше снижает барьеры. А неожиданные связи и неожиданные образы иногда, между прочим, указывают на ошибки в данных. Очень важно находить такие ошибки. Наши инструменты помогли в этом, например, финансистам и экологам.

Какой объем данных сейчас на сайте?

- Сейчас там семь тысяч наборов данных для визуализации. Провайдеры данных ведут интереснейшие дискуссии друг с другом. Больше всего нас впечатлило количество людей, использующих сайт. Их десятки тысяч, всех профессий.

Разговорная практика

В заключение - о двух разработках в самой трудной, на мой взгляд, области из всех представленных: это распознавание речи и автоматический перевод. Мой персональный урок от знакомства с этими проектами таков: сверхзадачи, о которых мы продолжаем писать и думать как о великих вызовах и недостижимых рубежах, под шумок перешли в разряд более-менее решенных. В прошлом году мне приходилось писать об этом феномене - все более заметных рыночных нишах, где существующий уровень распознавания речи уже достаточен для той или иной практики. Рынок знает, что задача не имеет решения, но ему нужно ее решать.

Айра Форман (Ira Forman) продемонстрировал мне в действии систему, предназначенную для общения с людьми с ослабленным слухом. Проект называется Jumbo - как пояснил Айра, в честь классического диснеевского персонажа, миссис Джамбо, чье потомство обладало очень большими ушами. Беседа велась - что оживило дело - не с кем-нибудь, а с клоном "Элизы", который Форман прикрутил ко второму концу линии связи. Четко и размеренно выговаривая слова (в аудитории было по-настоящему шумно), он сказал в микрофон: "Я - десяти футов ростом!" Элиза не удивилась:

- Когда вы стали десяти футов ростом?

- Я был десяти футов ростом всю мою жизнь.

- Что значит быть десяти футов ростом?

- Это значит, что я слишком часто ударяюсь головой об потолок.

- Я понимаю, что это значит.

- В самом деле?..

Увы, распознавалка ViaVoice 10.5 была натренирована на Формана, поэтому у меня не было случая испытать ее на себе. Но транскрипт беседы выводился на экран (а Элиза отвечала не голосом, а текстом), и было видно, что хоть и редко, но проскальзывают ошибки (Элизу это не смущало). В этом году Айра планирует перейти на новый айбиэмовский движок, не требующий тренировки на диктора. Он сказал, что с нежностью относится к этой работе и уверен в ее успехе - как минимум в части общения с глухими коллегами в компании. Проект включен во внутреннюю программу освоения новых технологий, готовится к полевым испытаниям, программа реализована как плагин к Lotus Sametime. В общем, все довольно буднично - именно это и впечатляет. Распознавание речи как-то обошлось без официального "прорыва", с речами, тостами и цветами - а вроде бы уже и работает…