Читать онлайн "Алло, робот!" - Кондратов Александр Михайлович - RuLit

Совместная группа ученых Института этнографии и Всесоюзного института информации с помощью вычислительной техники менее чем за полгода проделала большую работу по дешифровке киданьского письма. В результате была воссоздана грамматика киданьского языка, и исследователи смогли вплотную подойти к полной дешифровке — прочтению киданьских текстов.

«Самую сложную работу — выявление статистических закономерностей, которые бы потребовали несколько десятков лет работы, если бы это пришлось делать вручную, — говорит директор Всесоюзного института информации профессор Александр Иванович Михайлов, — вычислительная машина сделала по специально составленным программам менее чем за 30 часов».

Грамматика киданьского языка, воссозданная благодаря работе машины, показывает, что язык киданей, создателей самобытной культуры, принадлежит к монгольской группе языков… Так благодаря помощи «электронного дешифровщика» историки получили окончательное решение «загадки Чингис-хана», создавшего в течение короткого времени могучее и прекрасно организованное государство. Теперь становится понятным, почему он смог сделать это: в XIII веке монголы были не дикими кочевниками, а народом, чья история в лице киданей начиналась не с Чингис-хана, а с киданьского государства. История монгольского народа, его культуры удлинилась почти на три века — время существования киданьского государства. Знаменательно, что это открытие было сделано в 1964 году — в году, когда Монгольская Народная Республика праздновала свой сорокалетний юбилей!

Письмена этруссков и долины Инда, значки кохау ронго-ронго и надпись на фестском диске по-прежнему не разгаданы. Однако новые успехи дешифровки, содружество филологов, программистов, палеографов — специалистов по древним письменам — вселяют уверенность, что не столь уж далеко то время, когда «умные машины», а вернее, люди, руководящие и повелевающие машинами, смогут проникнуть в тайну этих загадочных письмен. Задачи, которые не под силу одному человеческому мозгу, могут быть решены с помощью «мозга электронного».

Глава 8

МАШИННЫЙ ПЕРЕВОД

ЧТО ТРУДНЕЕ!

Что труднее — дешифровать древние письмена или переводить с иностранного языка? Вопрос по меньшей мере странный. Ведь при дешифровке письмен нужно, помимо всего прочего, давать и перевод с чужого языка.

И тем не менее переводить с иностранного языка трудней.

Но только не человеку, а машине.

Во время второй мировой войны секретные донесения противника расшифровывались с помощью электронных вычислительных машин и методов статистики. Эти методы и заставили ученых задуматься: а нельзя ли применить их для перевода текстов с языка на язык?

«Нельзя ли рассматривать проблему перевода как проблему расшифровки тайнописи? — писал один из первых инициаторов машинного перевода американский ученый Уоррен Уивер. — Когда я смотрю на статью, написанную по-русски, я говорю: «Это написано по-английски, но закодировано неизвестными символами. Сейчас начну расшифровывать».

Задача, таким образом, сводится к расшифровке. Только не сообщений, написанных неизвестным секретным кодом, а текстов, написанных на чужом языке. А такая расшифровка секретных сообщений — дело нетрудное для вычислительных машин.

Но первые же попытки применить ее к задачам перевода сразу показали, что этот орешек будет покрепче. Да и к расшифровке древних письменностей эта методика не применима. Когда мы расшифровываем секретное донесение, мы твердо знаем, что оно написано на .каком-то из известных нам языков. Форма, структура языка не затрагивается шифром, он является подобием «морзянки». Поэтому возможно раскодировать самый запутанный секретный шифр.

При дешифровке древних письмен язык неизвестен, и нет никакой уверенности, что можно подыскать среди «живых» языков мира подходящий. Напротив, почти с полной уверенностью можно утверждать, что такой язык не найти.

Вы, наверное, читали рассказ Эдгара По «Золотой жук». Его герой Уильям Легран нашел пожелтевший пергамент с загадочной надписью:

Пользуясь статистикой, Легран сумел прочесть эту шифрованную надпись. Зная, кал часто встречаются буквы английского языка, он приравнял самый частый знак надписи к самой частой букве алфавита; второй по частоте знак шифровки — ко второй букве, и т. д. Но если бы Легран попробовал применить свой метод к расшифровке древних письмен, он не получил бы желаемого результата.

Например, стремясь расшифровать рукописи майя, он быстро бы зашел в тупик. Как отождествлять знаки рукописи? Древний язык майя неизвестен, и неоткуда взять «самую частую букву языка» и сопоставить ее с «самым частым знаком». К тому же знаки майя могут передавать не только одну букву, но и целые слоги и даже слова. И сколько бы ни бился дешифровщик над письменами, при такой методике он ни за что не смог бы прочесть древние знаки. Не помогли бы и электронные вычислительные машины, будь они во времена Эдгара По.

Задача машинного перевода еще бодее сложна, чем дешифровка древних письмен. Ведь при переводе с языка на язык, как замечает один из пионеров машинного перевода в нашей стране Дмитрий Юрьевич Панов, мы «меняем всю ту сложнейшую и тончайшую систему выражения мыслей, которая веками вырабатывалась тем или иным народом и теснейшим образом связана с его мышлением, историей, обычаями, образом жизни».

А это значит, что для машинного перевода нужно искать новые методы, новые программы, а не слепо идти проторенной, но ведущей в тупик «шифровальной» дорожкой.

ВПЕРВЫЕ В МИРЕ

Идея перевода с помощью машины долгое время считалась утопией. Уж слишком невероятным казалось, чтобы робот мог выполнить такую тонкую работу. Даже Норберт Винер, создатель кибернетики, не верил в возможность машинного перевода. «Механизация языка представляется весьма преждевременной», — заявил он в 1947 году. А между тем задолго до этого в нашей стране было запатентовано устройство «для подбора и печатания слов при переводе с одного языка на другой или несколько других одновременно». Придумал его талантливый советский инженер П. П. Троянский. В 1933 году ему было выдано авторское свидетельство на это изобретение.

Переводческая машина Троянского представляла собой автоматический словарь. Ведь именно поиск нужного слова занимает большую часть времени при переводе с языка на язык. Человек, по мысли Троянского, сначала подготавливает иностранный текст: все изменяемые слова записываются в основных формах. Существительное — в именительном падеже и единственном числе, глагол — в инфинитиве, и т. д. Например, слова «приказывающий машинам» были бы записаны как «приказывать машина». Правила грамматики, или, как называл их Троянский, «знаки логического разбора», также ставятся человеком, «препарирующим» текст.

Затем машина заменяет слова препарированного текста на слова чужого языка. Разумеется, они также даются в препарированном виде: без грамматики и в основных формах. Человеку остается произвести «обратное препарирование» — придать словам чужого языка грамматические формы, согласно «знакам логического разбора», и перевод с языка на язык- готов.

В этом проекте автоматического перевода машина выполняет самый трудоемкий, но промежуточный этап работы. Изобретатель, однако, указывал, что в принципе можно поручить машине весь процесс перевода. Она сама будет препарировать текст на одном языке и делать «обратное препарирование» на другом. Ибо грамматика, записанная в виде четких логических правил, также может быть доступна механическому переводчику.

Для того чтобы воплотить свой проект в жизнь, Троянский предложил в 1933 году модель переводческой машины. Она состояла из передвигающейся по столу ленты с нанесенными на ней словами на различных языках. Принцип работы был чисто механический. Это и понятно — ведь в то время не было не только кибернетики, но и электронных вычислительных машин.

В 1941 году изобретатель построил электромеханический вариант своей машины. А в 1948 году предложил сделать ее на электромагнитной аппаратуре связи. Но все эти модели так и не получили путевки в жизнь. Не было необходимой технической базы — электронных вычислителей-гигантов. Именно им был поручен машинный перевод.