Выбрать главу

В частности, по этой причине, я и решил рассказать об автоматическом переводе: о том, как он выполняется ав­томатом, и о том, стоит ли практическому переводчику использовать переводящий автомат в своей работе.

Идея автоматизации перевода возникла почти одно­временно с компьютерами. Уже в 1949 г., через пять лет после запуска в эксплуатацию в США первого достаточно мощного компьютера, математик У.Вивер обратился к ученым с призывом использовать компьютер для перево­да.

Идея Вивера была с энтузиазмом подхвачена многими математиками и лингвистами, и вскоре появились первые модели и системы автоматического, или, как принято го­ворить, машинного перевода.

Первые модели машинного перевода базировались на принципе перекодирования текста на одном языке в текст на другом: грамматика в традиционном понимании в них отсутствовала полностью. Позднее стали разрабатываться

более сложные системы, включающие грамматику, семан­тику и даже экстралингвистическую (фоновую) информа­цию35.

Об основных типах систем машинного перевода мы по­говорим позже, а сейчас давайте посмотрим, на каких принципах основывается работа переводящего автомата.

Как вам уже известно, язык можно представить в виде символьного кода, с помощью которого записываются мыслительные представления о вещах реального мира (концепты).

Мы уже говорили раньше также и о том, что, например, концепт дерева соответствует в русском языке цепочке символов ДЕРЕВО, а в английском последовательности символов TREE.

Тогда, очевидно, можно сказать, что разные цепочки символов, т.е. слова разных языков (например, ДЕРЕВО и TREE), соответствуют одному и тому же концепту (напри­мер, концепту дерева).

В таком случае, если слово одного языка, А, равно кон­цепту, С, и слово другого языка, В, тоже равно этому кон­цепту, С, то по принципу транзитивности, если А=С и В=С, то А=В.

Иными словами, элементы разных языков можно при­равнять на основе их соответствия одному и тому же значению.

На этом принципе и основана работа переводящего автомата - слова разных языков приравниваются друг другу на основе общности значения.

Для создания переводящего автомата соответствия ме­жду словами разных языков закладываются в программу компьютера, и задача такого примитивного автомата дос­таточно проста - для поступающих на вход слов одного

языка он находит соответствие в другом языке и так слово за словом переводит текст.

Однако, как вам тоже должно быть известно, общее значение в разных языках могут иметь не только отдель­ные слова, но и словосочетания, поэтому простейший пе­реводящий автомат ищет соответствия не только для от­дельных слов, но и для словосочетаний, выполняя так на­зываемый пословно-пооборотный перевод.

Кроме того, соответствие слов разных языков друг дру­гу не является однозначным, т.е. одному слову языка А может соответствовать несколько слов языка В и наобо­рот. Следовательно, в переводящем автомате необходимо предусмотреть программу выбора правильного эквивален­та.

Такие программы обычно основываются на двух прин­ципах:

1. На принципе выбора эквивалента по синтаксической модели входного текста, чаще всего по синтаксической модели предложения. Таким образом, например, авто­мат может различить эквиваленты глагола "to book" и существительного "book" (соответственно, "резервиро­вать" и "книга").

2. На принципе выбора эквивалента по семантической мо­дели. По разным семантическим моделям автомат, на­пример, может различать такие эквиваленты слова "solution" как "решение" и "раствор". Обе модели обычно применяют в комплексе. И сами модели, и процедуры выбора эквивалентов довольно сложны. Мы кратко и в общих чертах рассмотрим их ни­же.

В некоторых более сложных системах в дополнение к этим двум принципам выбора эквивалента применяют также и принцип выбора на основе внелингвистической (фоновой) информации. Модели для выбора эквивален­тов, работающие по этому принципу, еще сложнее: их от­носят к разряду моделей искусственного интеллекта.

В зависимости от сложности выбора правильного зна-

чения слов и, соответственно, правильного переводного эквивалента модели и системы машинного перевода мож­но разделить на три уровня.

К первому, низшему уровню относятся простейшие модели пословно-пооборотного перевода, в которых вы­бор эквивалентов не производится и на выход системы перевода поступают все переводные эквиваленты, имею­щиеся в словаре.