Читать онлайн "Алло, робот!" - Кондратов Александр Михайлович - RuLit

Пока что такого удивительного языка-посредника для машинного перевода еще не существует. Но ученые разрабатывают различные проекты этого «всеобщего языка». Например,-создается «универсальная грамматика»: она должна показать самые общие законы, присущие всем языкам мира. Мы расскажем здесь лишь о наиболее увлекательной и многообещающей области машинного перевода. Это создание «языка смысла», с помощью которого ученые надеются научить машину понимать переводимый ею текст!

Как переводит человек с языка на язык? Разумеется, по смыслу. Поиск в словаре нужных слов — это важная, но отнюдь не главная часть перевода. И она, как вы сами убедились, легко автоматизируется. Но как автоматизировать перевод по смыслу?

Решить эту, казалось бы, неразрешимую задачу помогают так называемые «смысловые множители».

«Паровоз», «пароход», «самолет», «вездеход», «вертолет»… Состав этих сложных слов ясен. Ясны и те «единицы смысла», из которых образуется их значение. Ну, а если взять не сложные слова, а простые? Можно ли в них найти «единицы смысла»? Или, может быть, значение отдельного слова (разумеется, простого, а не сложного) как раз и является тем самым «атомом смысла», из которого затем строятся «молекулы» сложных слов и целых предложений?

Этим вопросом занялись сотрудники лаборатории машинного перевода при Первом московском педагогическом институте иностранных языков. По их предположению, «атомом смысла», является не слово, а более мелкие единицы — «смысловые множители».

Вот как выявлялись эти «атомы смысла». Сначала брали два одинаковых по значению высказывания. Например, «он недомогает» и «он нехорошо себя чувствует».

Затем из этих фраз извлекали смысловые множители. Первый- «отрицание» (из слова «нехорошо»); второй — «положительность» (из того же слова); третий — «ощущение» (из слова «чувствовать»). Значение слова «недомогать» можно тогда выразить как сочетание трех смысловых множителей: «отрицание» — «положительность» — «ощущение».

Точно так же можно записывать смысл и других слов, и целых фраз, после того как извлечены другие смысловые множители, новые «атомы смысла». Например, слова «да», «конечно», «так», «верно», «истинно», «правильно», «ей-ей», «как же», «совершенно верно», «именно», «согласен» записываются одним семантическим множителем — «утверждение». Из одних и тех же смысловых множителей могут состоять не только слова, но и целые фразы.

Например, приведенные нами фразы: «он недомогает», «он нехорошо себя чувствует» и, кроме них, «плохо себя чувствует» — имеют одни и те же смысловые множители:

«отрицание» — «положительность» — «ощущение». «Он болеет»: «отрицание» — «положительность» — «ощущение»

(ведь болезнь — это и есть отрицание «хорошего чувствования»), «Он занемог» — те же множители, и т. д. Иногда число фраз, составленных из одних и тех же «атомов смысла», может доходить до четырехсот — настолько богат русский язык.

Зная «атомы смысла», машина-переводчик может анализировать текст, записывать его в виде единиц смысла. Затем мы можем дать ей команду записать этот же смысл, но уже в виде слов другого языка. Ведь основные «атомы смысла», вроде приводимых нами «отрицание» — «положительность» — «ощущение», во всех языках мира одни и те же. Подобно тому как бесконечное многообразие нашего мира строится из «горстки» атомов и молекул, бесконечное многообразие фраз и слов всех языков мира строится из небольшого количества «атомов смысла». Они-то и могут быть «словами» машинного языка-посредника.

Более того: осуществляя перевод с помощью смысловых множителей, машина, по существу, делает то же, что и человек-переводчик, — она переводит по смыслу!

Поиск «атомов смысла» только начат. Часть слов как русского, так и других языков мира потребует особой записи. Например, собственные имена, названия видов животных и растений, домашней утвари, вероятно, будут записываться не в виде смысловых множителей, а обозначаться номерами. Эти номера будут храниться в «памяти» машины.

Большие трудности доставят ученым и стилистические особенности речи. На языке смысловых множителей фразы «ничтожный человек», «маленький человек», «человечек», «ничтожество», «человек без способностей», «бездарность» будут записывать одними и теми же «атомами смысла». Но любому ясно, что это не совсем так — эмоциональная окраска придает словам и фразам различные оттенки смысла, увы, пока что невыразимые в «атомах смысла».

Впрочем, никто и не пытается автоматизировать перевод эмоциональной, обыденной речи. А тем более поэзии и художественной прозы. Перевод научной и технической литературы с помощью электронных вычислительных машин — такова задача сегодняшнего дня. И, как замечает один из пионеров машинного перевода Уоррен Уивер, «Пушкин может не беспокоиться»,

Глава 9

СКАЖИ ПО-ЧЕЛОВЕЧЕСКИ

«ОРГАНЫ ЧУВСТВ» АВТОМАТОВ

Мы говорили о машине-переводчике. И добавляли: автоматический перевод делает электронная вычислительная машина. Вычислительная, ибо технически весь процесс перевода для машины не отличается от других счетных операций.

Например, ей нужно перевести какое-либо слово. Изо всех чисел, которыми закодированы слова ее автоматического словаря, машина начинает вычитать это слово — ведь и оно записано как число! Если остаток при вычитании равен нулю, значит, нужное слово найдено. Операция, конечно, долгая: если в словаре тысяча слов, нужно сделать чуть ли не тысячу вычитаний, пока не наткнешься на нужное. Но ведь и сто тысяч арифметических действий в секунду — не предел для современных вычислительных машин. Необходимые сто, или тысяча, или 10 тысяч вычитаний она проделает за ничтожную долю секунды.

И автоматический словарь, и программа перевода хранятся в «памяти» машины в виде чисел. Мы уже рассказывали, что сделать такой перевод, вернее, кодирование очень легко. Но как ввести эти числа в машину, как превратить их в импульсы электрического тока?

Очевидно, нужно наделить «электронный мозг» машинными «органами чувств». Электрический глаз фотоэлемента — машинное зрение, чуткое «ухо» микрофона — слух. Американские инженеры сконструировали даже «электронный нос» — специальное устройство, которое позволяет машине различать запахи. (Этот «нос» может оказать большую помощь химикам, чутко улавливая ход различных реакций по запаху веществ.)

Примерно 90 процентов всей информации наш мозг получает от зрения, от всех остальных органов чувств — около 10 процентов. Львиная доля из этих десяти процентов приходится на слух. Осязание и обоняние находятся на последнем месте, доставляя ничтожную часть информации. А для электронного мозга единственный «канал связи» — это машинное «осязание». Благодаря ему вводится в машину последовательность чисел, будь это программа или задание.

ПЕРФОКАРТЫ

В начале прошлого века француз Жозеф Жаккар усовершенствовал работу ткацкого станка. Чтобы изготовить ткани со сложным узором, станком приходилось управлять опытному мастеру. Французский изобретатель решил автоматизировать этот процесс.

В плотных картонных картах были пробиты отверстия — они обозначали порядок работы машины. Карты проходили под специальными щупами. Попав в одно из отверстий, щуп опускался и перемещал нити на ткацком станке. В результате карта с отверстиями как бы управляла перемещением нитей. Можно было получать любые сложные узоры автоматически. Такой способ управления получил название «перфорационный», «дырочный». А карты, на которых пробиваются «управляющие отверстия», стали называть перфокартами.

Почти во все современные вычислительные машины информацию вводят с помощью перфокарт. Конечно, они отличаются от тех «управляющих картонов», которыми пользовался Жозеф Жаккар. Но принцип «чтения» с помощью специальных щупов остался тот же, что и во времена наполеоновских войн, когда Жаккар сделал свое изобретение.