Так, например, в результате обработки на этапе анализа уточненная синтактико-семантическая структура того же английского предложения может иметь вид:
N(MATER/ABSTR)(SUBJECT)<=(PREDICATE) V(TRANS,SUBJ=Ninanim, mater; OBJ=Ninanim, mater)=> (OBJECT)N(PROQPARAM).
2. Преобразование структуры входного предложения в промежуточную (ядерную) структуру по правилам машинной грамматики. Например, по правилам грамматики непосредственно составляющих такое преобразование будет иметь вид:
NVN=>NV=>V.
3. Синтез синтаксической структуры выходного предложения. Для нашего простого примера она может быть двоякой:
- для предложения с глаголом-сказуемым в действительном залоге:
Nl(nomin) V(active) N2(accus.);
- для предложения с глаголом-сказуемым в страдательном залоге:
N2(nomin) V(passive) Nl (instr.).
После этапа трансфера следует этап лексического синтеза элементов выходного предложения, т.е. выбор эквивалентов по синтаксическим и семантическим признакам.
За лексическим синтезом следует графемный синтез (преобразование словарных форм переводных эквивалентов в соответствующие текстовые формы - в нужном падеже, лице, числе и т.д.). В результате выходное предложение принимает вид:
свинец (лот / грузило / проводник) всасывает (впитывает / абсорбирует / амортизирует / поглощает) излучение (радиацию) или
излучение (радиация) впитывается (абсорбируется / амортизируется / поглощается) свинцом (лотом / грузилом / проводником).
Так в общих чертах работает переводящий автомат второго уровня, построенный по схеме синтактико-семан-тического трансфера. Такой автомат строится для определенной пары языков и, как вы сами можете судить, использует алгоритмические процедуры анализа и синтеза на основе синтаксической и семантической информации.
Как уже говорилось, большинство коммерческих переводящих систем работает на этом принципе. В некоторых из них синтактико-семантическая информация более полная и алгоритмы анализа более тонкие, чем в других. Такие "электронные переводчики" переводят чуть лучше, чем их более примитивно устроенные "братья по классу", но в любом случае без привлечения фоновой информации они не в состоянии конкурировать с человеком.
Кроме схемы трансфера в переводящих системах второго уровня применяется также так называемый язык-посредник. Язык-посредник (interlingua, pivot language) -это некий универсальный код, с помощью которого можно единым образом выразить грамматическую и семантическую информацию, содержащуюся в тексте на любом языке.
Задача переводящего автомата, применяющего язык-посредник, будет состоять в том, чтобы преобразовать текст на одном языке в форму языка-посредника, а затем, используя средства другого языка, генерировать выходной текст из форматов языка-посредника.
Привлекательность этой идеи достаточно очевидна, но ее практическое воплощение оказалось очень непростым. И хотя некоторые зарубежные системы в своих рекламных буклетах пишут об использовании единого языка-посредника для автоматического перевода с разных языков, это, насколько мне известно, скорее рекламный прием, чем действительное положение вещей.
Описать в едином формате даже структурно подобные языки достаточно сложная задача сама по себе, не говоря уже о ее алгоритмической реализации. Поэтому в настоящее время, несмотря на обширный теоретический материал, едва ли можно говорить о коммерческих системах машинного перевода, работающих на принципе языка-посредника.
Такова ситуация с практической реализацией систем второго уровня.
Что же касается систем третьего уровня, то, как уже говорилось выше, экспериментальные системы такого типы разработаны лишь для некоторых очень ограниченных тематических сфер.
В этих системах окончательное решение о выборе переводного эквивалента принимается "блоком принятия решений" на основе так называемой базы знаний - формального описания фрагмента реального мира (его составляющих и отношений между ними). Сложность концептуальной и программной реализации таких систем, я думаю, очевидна.
Особое место в теории и практике машинного перевода занимают системы, основанные на статистических моделях переводных соответствий.
Согласно статистическому подходу к конструированию систем автоматического перевода, любое слово одного языка может быть переведено любым словом другого, только с разной вероятностью.
Задача переводящего автомата, работающего на вероятностном принципе достаточно проста.
На первом этапе, называемом этапом обучения, этот
автомат должен сравнивать оригинальные тексты и выполненные человеком переводы этих текстов и регистрировать величины вероятности разных переводных эквивалентов.