Выбрать главу

Результаты показывают, что в очень специализированной обстановке эта модель «неотличима» от реального пациента. Конечно, можно справедливо утверждать, что условия этого эксперимента были созданы искусственно, что действительная диагностика паранойи включает множество интервью лицом к лицу с пациентом и что если бы эксперты знали реальную суть задачи, они строили бы беседу по-другому. Хотя Колби с коллегами успешно запрограммировали компьютер отвечать довольно похоже на параноидного пациента и эта программа прошла своего рода тест Тюринга, она очень далека от совершенной модели, способной генерировать и понимать язык.

NETtalk. Совершенно иной тип основанной на нервной сети программы под названием NETtalk разработали Седжновски, работавший тогда в Гарвардской медицинской школе, и Розенберг из Принстонского университета (см. Heppenheimer, 1988; Sejnowski, 1987). Программа NETtalk читает и произносит буквы (рис. 16.8). Модель, имитирующая нервную сеть, состоит из нескольких сотен единиц («нейронов») и тысяч связей между ними. NETtalk «читает вслух», преобразовывая буквы в фонемы — элементарные единицы речевых звуков. Эта система подобно другим, о которых мы уже говорили, имеет три слоя: входной, в котором каждая единица соответствует букве; выходной, единицы которого представляют 55 фонем английского языка; и слой скрытых единиц, в котором каждая из единиц имеет обладающую определенным весом связь с каждой входной и выходной единицей. NETtalk читает, рассматривая одну за другой каждую букву и просматривая три буквы с обеих сторон для получения информации о контексте. Так, буква е в словах net, neglect и red может обозначать различные звуки. Каждый раз, когда программа NETtalk читает слово, она сравнивает его произношение с правильным произношением и затем регулирует вес его связей, чтобы исправить любые ошибки.

Рис. 16.8. Программа NETtalk читает вслух: она переводит буквы в фонемы. Каждая единица-буква посылает сигналы через имеющий определенный вес связи ко всем «скрытым» единицам; если общий сигнал, достигающий скрытой единицы, превышает некоторый порог, единица генерирует разряд, посылая сигналы к единицам-фонемам. Информация на выходе — фонема, которая получает самый сильный общий сигнал. Когда «преподаватель» говорит программе NETtalk, что она допустила ошибку — здесь она только что прочитала m вместо n, — она исправляет ошибку, регулируя все веса связей согласно определенному алгоритму научения. Источник: Heppenheimer, 1988

После нескольких попыток NETtalk заметно улучшает свою работу. Седжновски сообщает:

Мы оставили ее работать на всю ночь. Сначала она выдавала непрерывный поток бессмысленных звуков. Это были лишь предположения; она еще не научилась связывать фонемы с буквами. Со временем она стала распознавать согласные и гласные. Затем она обнаружила, что между словами были пробелы. Теперь поток звука разбивался на короткие порывы, разделенные этими пробелами. На исходе ночи она читала довольно понятно, правильно произнося приблизительно 92% букв (цит. по: Heppenheimer, 1988).

Практическое значение этих систем очевидно; менее очевиден, но в конечном счете более важен концептуальный прорыв, обеспеченный моделями нейронных сетей.

Терри Седжновски. Разработанные им нейронные сети содержали скрытый слой, который соответствует промежуточным нейронам

Как признают Седжновски и другие исследователи, в разговоре между машиной и человеком большое значение имеет контекст. Теперь мы рассмотрим другую важную проблему — проблему значения и искусственного интеллекта.

Значение и искусственный интеллект

Несмотря на то что некоторые из фраз этого компьютера достаточно хороши, чтобы обманывать кого-то некоторое время, он не способен обманывать всех и постоянно. Компьютеры терпят неудачу не из-за недостатка памяти на слова — она почти неограниченна, и не из-за недостаточной способности генерировать значимые предложения — она весьма обширна, и не из-за плохого произношения букв — оно вполне приемлемо, а из-за того, что они недостаточно понимают используемый язык.