И вдруг оказывается, что те аспекты значения, те ускользающие от жестких определений ореолы, которые мы едва-едва осознаем, а то и совсем не замечаем, поддаются строгому и достаточно точному числовому измерению, и компьютер свободно оперирует ими, создавая поразительную имитацию понимания тончайших их оттенков и сложных переливов.
Такое кажется невероятным, непостижимым, но это так.
Читайте дальше и вы увидите, как это происходит.
Компьютер изучает основы семантики
Не так давно, в 1982 году, вышел из печати «Русский семантический словарь», составленный... компьютером. Авторы-то у словаря есть. Это даже целая группа под руководством члена-корреспондента АН СССР Ю. Караулова. Но они скорее авторы программы для ЭВМ. А составляла словарь и даже писала его все же машина. И добро бы это был обратный словарь, или частотный, или по длине слов, а то ведь семантический!
Немудрено, что вокруг словаря сразу разгорелись страсти. Одни считали, что это новое слово в семантике, первый шаг к постижению языкового значения компьютером, другие были шокированы и даже возмущены тем, что машине доверили такое тонкое и сложное дело, как обнаружение семантических сходств и различий между словами.
Многие посмеивались над компьютером — кто добродушно, кто злорадно — вот, мол, смотрите-ка, в одной группе оказались слова зерно и женщина. Ничего себе, семантическое сходство — в огороде бузина, а в Киеве дядька. Но других те же самые результаты восхищали: ай да компьютер — собрал в одну группу все злаковые, сюда же включил и овощи, да не все, а только с зернышками (огурец, помидор, тыква), про хлеб не забыл, глагол кормить тоже здесь оказался, и даже женщину вспомнил. А как же — она ведь кормилица! И снова споры, снова дискуссии.
Что ж, новое должно доказать свою жизнеспособность в борьбе мнений, должно пробить себе дорогу. А это было не просто новое, это было никогда раньше не виданное и не слыханное: компьютер делал первые шаги к постижению понятийного ядра значения. Пусть даже, как и положено на первых шагах, его вел за руку человек: компьютер, разумеется, значений слов не понимал, он сравнивал по разным словарям описания значений слов людьми — составителями словарей, а найдя сходство в описаниях, относил слова к одной группе, то есть считал слова сходными по значению.
Пока еще не все у компьютера получается гладко, не со всеми его решениями можно согласиться, но главное в том, что оказалось принципиально возможным обучить машину имитации понимания понятийного ядра — основы значения слова.
Скажем, в одну группу со словом бабочка компьютер отнес и слово хоккей. Что-либо общего в значениях этих слов трудно отыскать, не правда ли? Они оказались в одной группе на том основании, что в словарных описаниях и того и другого значений есть слово поле, а откуда машине знать, что хоккейное поле вовсе не тот лужок, над которым порхают мотыльки. Зато другие слова в соседи к бабочке компьютер подобрал с явным «пониманием» их значения: цветок, пыльца, пестик, крыло, птица и т. п.
Получается, что программа, по которой составлялся «Русский семантический словарь», является как бы автоматическим понятийным классификатором слов, распределяющим слова по группам в зависимости от сходств их понятийных ядер.
В целом машина неплохо освоила понятийную семантику почти десяти тысяч русских слов, распределив их по семантическим группам так, что непосвященному человеку и в голову не придет подозревать в этой явно интеллектуальной работе компьютер.
Вот, к примеру, такая группа: архитектура, архитектор, кремль, крепость, башня, пирамида, колокольня, дворец, здание, портал и т. п. Можно ли сомневаться в семантической общности этих слов? Конечно, нет. А ведь их подобрал компьютер, который действительно не понимает их значений. Просто трудно поверить, что машина не знает смысла слов, когда объединяет такую «театральную» лексику: спектакль, актер, балкон, кукла, отделение, премьера, самодеятельность, темп, афиша, кино, опера, постановка, программа, сцена, уборная, балет, кинотеатр, оркестр, представление, пьеса, театр, цирк.
Работа машины особенно поражает в тех случаях, когда семантика сформированных ею групп и человеку-то не всякому доступна. Например: альтруизм, самопожертвование, уступка, польза, делиться, ближайший, сосед.
Электронный языковед настолько правдоподобно имитировал понимание значений слов, что даже критиков словаря ввел в заблуждение. Ведь, подмечая семантические неточности в работе компьютера, они как бы спорили с ним на равных.