Очевидное достоинство всех перечисленных моделей — их правильность — адекватное отражение тех или иных специфических характеристик синтаксической структуры текста. Однако ни одна из этих моделей еще не была использована для создания каких- либо действующих систем общения с ЭВМ на естественном языке. Модель деревьев подчинения ориентирована на управляющие связи только по словам, а модель систем составляющих учитывает только иерархическое отношение вложенности словосочетаний в линейной структуре текста. Эти факторы лишь приближенно описывают действительные коммуникативные свойства, содержащиеся в синтаксических структурах текста. Поэтому ученые предприняли попытки построения моделей, обобщающих средства деревьев подчинения и систем составляющих. Так, А. С. Нариньяни, исходя из задач практического программирования систем, взаимодействующих с использователем на естественном языке, предложил модель системы компонент. В этой модели структура предложения описывается в виде системы синтаксических компонентов, связанных отношениями правления и примыкания. Допускаются разрывность и пересечения компонент. Гладкий разработал концепцию синтаксических групп. Здесь наиболее явно подчеркивается важность учета управляющих связей между группами слов, образующих цельный синтаксический объект в структуре предложения. Таким образом, уточнение моделей синтаксических структур идет от уточнения управляющих связей между словами и словосочетаниями к уточнению связей между группами синтаксических единиц. При этом с неизбежностью происходит перемещение точки рассмотрения синтаксических структур из линейного порядка, навязанного последовательностью записи текста, к сложному пространству, образованному синтаксически связанными группами объектов. В пределе (оставаясь в рамках синтаксиса) приходим к пространству представления, не зависящему от порядка записи текста, а значит, и от национального языка, выражающему все предикативные и определяющие отношения, содержащиеся в синтаксических структурах. Это пространство, названное управляющим, образует полную синтаксическую структуру предложения и является рекурсивно-топологическим выражением того процесса, который называется мыслью. В отличие от чисто лингвистического подхода предложение рассматривается как некоторый динамический вычислительный рекурсивный процесс, развивающийся в управляющем пространстве, связывающем синтаксически сгруппированные части предложения информационными каналами. Структура управляющего пространства отражает семантику определяющих и предикативных конструкций языка. Неожиданным оказалось то, что управляющие пространства подобного вида уже рассматривались как вычислительная модель для рекурсивно-параллельных процессов. Это уже упоминавшиеся ПАРУС-структуры. В формальном аспекте предлагаемая модель — это одновременное обобщение деревьев подчинения и систем составляющих, а также других упоминаемых ранее моделей. Реализация этой модели ориентирована на ПАРУС-системы программирования, поддерживающие концепцию рекурсивно-параллельного программирования в управляющих пространствах. При изложении мы ограничиваемся концептуальным уровнем. Подробности и уточнения конкретных деталей выходят за пределы книги.
Деревья подчинения, системы составляющих и синтаксических групп. Ограничимся неформальными определениями.
Считается, что в предложении слово и управляет словом v (v подчинено и), если v выступает непосредственным уточнением (комментарием) слова и. Такую зависимость изображают ориентированной дугой, направленной от слова и к v. Сказуемое — главное в предложении, остальные слова всегда имеют непосредственных «хозяев». Отношение непосредственного подчинения слов образует дерево подчинения предложения. При графическом изображении таких деревьев обычно учитывают порядок слов самого предложения, т. е. соотносят само дерево подчинения с его отображением в линейную запись (рис. 15). В терминах деревьев подчинения можно успешно выражать многие стилистические характеристики текстов.[114]
Рис. 15. Варианты дерева зависимостей предложения
Какой-то тайный смысл был в этих знаках.
2
3
Другая известная модель, отражая иерархическую структуру частей предложения, — системы составляющих. Их удобно задавать в виде скобочной структуры. В скобки заключают синтаксически связные словосочетания. Например,
(Онегин, (добрый(мой приятель))), (родился(на (брегах Невы))).
Очевидно, рассмотренные модели дают важную информацию о синтаксической структуре предложения. Однако у обеих есть существенные недостатки. Деревья подчинения не учитывают связей между словосочетаниями и синтаксически целостными группами слов. В сложных предложениях группы слов могут служить для уточнения одного слова или другой группы слов, что затруднительно выразить связями деревьев подчинения. Системы составляющих игнорируют направленные связи. Кроме того, они не позволяют описывать разрывные словосочетания. Поэтому ни одна из моделей не дает полного представления о синтаксической структуре предложения. Отталкиваясь от такой критики, Гладкий предложил более общую модель, названную им системой синтаксических групп и6. Синтаксическая группа — это подмножество слов (часть текста), связанных согласно определенному критерию. Между синтаксическими группами устанавливается отношение непосредственного подчинения. Деревья подчинения и системы составляющих могут быть интерпретированы как некоторые разные виды синтаксических групп. Разложение предложения на синтаксические группы неоднозначно и зависит от выбора критерия объединения слов в синтаксическую группу. Гладкий рассмотрел ряд критериев получения синтаксических групп.[115]
Алгоритмическая модель предложения (модель охотника и жертвы). Мы пытаемся построить модель, максимально приближенную к реальной синтаксической структуре предложения. Предварительно сделаем несколько замечаний, касающихся будущей модели.
Деревья подчинения и системы составляющих, несмотря на недостатки, отличаются и достоинством: они адекватно отражают существенные свойства синтаксической структуры предложения. Поэтому модель, которую необходимо разработать, должна давать одновременно информацию, содержащуюся и в деревьях подчинения, и в системах составляющих.
Кроме того, что язык дает имена объектам окружающего мира, он обладает фундаментальным свойством выражать динамические отношения, в которые вступают объекты. Например, глагол связывает в отношение объекты, участвующие в схеме его действия, прилагательное задает отношение объекта с самим собой. Из синтаксической модели мы должны знать, какие части предложения связаны между собой через отношения и что это за отношения. Существуют всего два вида синтаксических отношений — предикативное и синтагматическое. Первое выражает зависимость между синтаксическими объектами через понятие, означающее действие и обычно выражаемое сказуемым. Синтагма — это сочетание двух синтаксических объектов, из которых один служит определением другого. Поэтому в разрабатываемой модели должны полностью выявляться именно эти виды отношений. Кроме того, в таком широком понимании синтагмы должны образовывать синтаксические группы.
Адекватная модель синтаксической структуры должна также отражать основополагающее свойство рекурсивности языка — способность развертывать собственные определения, т. е. давать уточнения, характеристики, комментарии к своим частям, а также строить определения определений. «Язык в себе самом содержит свой внутренний принцип развития».[116]
Отнесение подобных вопросов к сфере семантики неправомочно — они должны решаться на уровне синтаксической модели, так как проявляются на уровне общей схемы, не зависящей от смысла высказываний.
115
115 Гладкий А. В. Синтаксические структуры естественного языка в автоматизированных системах общений. — М.: Наука, 1085 — 144 с.