Читать онлайн "Диалог с компьютером" - Журавлев Александр - RuLit

И еще одно, не менее убийственное для «семантического пространства» обстоятельство.

Оказывается, при измерении некоторых слов обнаруживается неожиданная картина — слово располагается не в одной точке шкалы, а сразу в двух противоположных точках. К примеру, слово регби по шкале «хорошее — плохое» получает среднюю оценку 2,9, то есть оценивается большинством информантов как бы «никаким». Но это вовсе не так. На самом деле примерно половина отвечающих единодушно считает, что регби — это что-то «хорошее» (видимо, им нравится эта игра), а другая половина столь же единодушно полагает, что это нечто «плохое» («это не игра, а свалка какая-то»). Но почти никто, заметьте, не посчитал регби «никаким». Значит, средняя оценка фиктивна, за усреднением она скрывает разнонаправленные тенденции. И таких слов множество: бокс, хоккей, пушка, огонь, суд, холостяк, женщина — это только несколько примеров слов «двойной оценки».

А вот слово дождь расположилось буквально на всей шкале, что и понятно: если вас спросят: «Дождь — это что-то хорошее или плохое?» — вы наверняка скажете — смотря какой, смотря где, смотря когда. У этого слова нет постоянного качественного ореола, он меняется в зависимости от ореолов слов-соседей.

Вот теперь и прикиньте, как можно расположить слова с двойными или меняющимися ореолами в любом пространстве — хоть трех-, хоть четырехмерном? Трудно что-нибудь придумать. Во всяком случае, «облака» таких слов вытягиваются почти на все пространство, как Млечный Путь.

Автоматический качественный классификатор

Создается впечатление, что в рассказе об осгудовском измерении значения получилось, как в известном анекдоте:

— Правда ли, что Том выиграл в лотерею «понтиак»?

— Да, правда. Только не Том, а Тим. И не «понтиак», а «кадиллак». И не в лотерею, а в карты. И не выиграл, а проиграл.

Но все-таки это не совсем так. Качественный ореол значения слова Ч. Осгуд действительно измерил, только геометрическое представление результатов измерений оказалось не совсем удачным. Во всяком случае, для компьютера.

Поэтому Н. Павлюк, обнаружив четвертую меру семантического пространства и убедившись в невозможности его графической интерпретации, стал искать новые пути семантических измерений. И поиски привели его к разработке простого (а значит, вполне доступного «пониманию» компьютера) и в то же время весьма эффективного способа автоматического оперирования с качественно-признаковыми ореолами слов.

Есть такая настольная игра. На игровом поле установлены разные отражатели, стенки, барьерчики, ловушки. Один или несколько шариков выскакивают на поле и движутся по нему, отражаясь от препятствий, застревая в ловушках. В конце концов шарики собираются в разных частях поля, в зависимости от чего играющими начисляются очки. Придуманный Н. Павлюком автоматический классификатор похож на эту игру. Посмотрите на рисунок.

Представьте себе, что в верхнюю воронку засыпаются слова, которые распределяются по трубам этого сортировочного устройства в зависимости от наличия тех или иных характеристик. Сначала они попадают на первый уровень, где «хорошие» слова направляются налево, «плохие» — направо, а «никакие» — прямо. Теперь каждая из трех групп попадает на второй уровень. Там снова происходит сортировка: «хорошие и сильные» — направо, «хорошие и слабые» — налево, «хорошие и никакие» — прямо. Поскольку каждая из трех групп первого уровня делится еще на три группы, то групп уже получается 9. Затем третий уровень, где каждая из 9 групп делится еще на 3 в зависимости от «активности» слов. Групп уже 27. Четвертый уровень делит слова по признакам «мужественное — женственное», и групп становится 81.

Если остановиться на этих четырех уровнях, то в «осгудовских представлениях» мы получим группировку слов в четырехмерном качественно-признаковом пространстве, то есть как бы разрежем облака тумана на четко разграниченные зоны.

А компьютеру только того и нужно. Теперь он легко разложит по полочкам наши зыбкие и неопределенные представления о качественных ореолах слов. Скажем, попадают в компьютерный классификатор слова автомобиль и лягушка. Компьютер проверяет их оценки по шкале «хорошее — плохое»: автомобиль — 1,9, лягушка — 4,2. Компьютеру ясно — автомобиль нужно направить в «хорошую» группу, а лягушку в «плохую». Далее проверяются оценки по шкале «сильное — слабое», и автомобиль попадает в «хорошую и сильную» группу, лягушка — в «плохую и слабую», так как по этой шкале автомобиль имеет оценку 1,8, а лягушка — 4,3. Затем, пройдя шкалы третьего и четвертого уровней («быстрое — медленное», «мужественное — женственное»), автомобиль оказывается в «хорошей, сильной, быстрой, мужественной» группе, лягушка — в «плохой, слабой, медленной, женственной».