Выбрать главу

2.4.

В-третьих, понятие «грамматической правильности в английском языке» нельзя отождествлять ни в каком смысле с понятием «высокого порядка статистического приближения к английскому языку». С полной уверенностью можно предположить, что ни (1), ни (2) (и фактически никакая часть этих предложений) никогда не появлялись в английской речи. Следовательно, согласно любой статистической модели грамматической правильности оба эти предложения были бы отброшены как равно далекие от английского языка. И тем не менее первое, хотя и бессмысленное, грамматически правильно, а второе нет. Носитель английского языка, если его попросят прочесть эти предложения, первое прочтет с нормальной интонацией предложения, а второе — с интонацией, падающей на каждом слове, т. е. как всякую последовательность бессвязных слов, принимая каждое слово в ней за отдельное высказывание. Отсюда вытекает, что ему гораздо легче припомнить первое, чем второе, что он гораздо быстрей заучит первое и т. д. И все это несмотря на то, что ему никогда не приходилось видеть или слышать ни одной пары приведенных слов соединенными в реальной речи. Еще пример. В прошлом языковом опыте говорящего слова whale «кит» и of могут иметь одинаковую (т. е. нулевую) частотность появления в контексте (I saw a fragile — «Я видел хрупкого — »), и все же говорящий немедленно заявит, что лишь первая из этих подстановок приводит к грамматически правильному предложению. Мы не можем, разумеется, апеллировать к тому факту, что предложения, подобные (1), «могут» быть высказаны в некотором достаточно искусственном контексте, а тип (2) не может быть высказан ни при каких условиях, поскольку нам нужно выяснить именно причину такого различения между (1) и (2).

Ясно, таким образом, что способность производить и распознавать грамматически правильные предложения не основывается на таких понятиях, как, например, понятие статистической приближенности. Источником недоразумения служит здесь обычай считать грамматически правильными предложения, которые «могут встретиться», «возможны» и т. п. Естественно трактовать слово «возможный» как «имеющий большую вероятность» и предположить, что способность лингвиста четко различать грамматически правильное и грамматически неправильное[4] основана на убеждении, что, поскольку «реальность» языка слишком сложна для полного описания, необходимо удовлетвориться упрощенным вариантом описания, называющим «все невероятное и весьма маловероятное невозможным и все, имеющее большую вероятность, возможным»[5]. Мы видим, однако, что это представление совершенно неправильное и что структурный анализ нельзя понимать как упрощенную схему, полученную в результате четкой обрисовки размытых границ полностью статистической картины. Если расположить последовательности данной длины в порядке статистического приближения к английскому языку, мы обнаружим в списке разбросанными в беспорядке как грамматически правильные, так и грамматически неправильные предложения; нет, по-видимому, никакой специфической связи между порядком статистического приближения и грамматической правильностью. При всем несомненном интересе и важности статистического и семантического изучения языка изучение это представляется не имеющим прямого отношения к определению или характеристике понятия множества грамматических высказываний. Я думаю, мы принуждены сделать вывод, что грамматика автономна и независима от значения и что вероятностная модель не дает особого проникновения в сущность основных проблем синтаксической структуры[6].

3. ЭЛЕМЕНТАРНАЯ ЛИНГВИСТИЧЕСКАЯ ТЕОРИЯ

3.1.

Допустим, что нам дано множество грамматически правильных предложений английского языка. Спрашивается, «какого рода механизм может порождать это множество (другими словами, какого рода теория дает адекватное описание структуры этого множества высказываний). Мы можем представлять себе каждое предложение этого множества как последовательность фонем конечной длины. Язык — необычайно запутанная система, и совершенно очевидно, что любая попытка представить непосредственным образом множество грамматически правильных последовательностей фонем привела бы к грамматике столь сложной, что практически она стала бы бесполезной. По этой причине (существуют и другие причины) для лингвистического описания используется система «уровней представления». Вместо того чтобы устанавливать фонемную структуру предложений непосредственно, лингвист исходит из элементов «более высокого уровня»— морфем; затем он отдельно устанавливает морфемную структуру предложений и фонемную структуру морфем. Легко понять, что совокупное описание этих двух уровней значительно проще непосредственного описания фонемной структуры предложений.

вернуться

4

4 Ниже мы покажем, что это четкое различение можно уточнить с помощью понятия уровня грамматической правильности. Однако это не влияет на сказанное здесь. Так, A) и B) оказываются на разных уровнях грамматической правильности, даже если приписать A) меньшую степень грамматической правильности, чем, скажем, C) и D), но они находятся на одинаковом уровне статистической удаленности от английского языка. То же справедливо и в отношении бесконечного числа подобных пар.

вернуться

5

5 С. F. Hockett, A manual of phonology, Baltimore, 1955, p. 10.

вернуться

6

Мы вернемся к вопросу о связи между семантикой и синтаксисом в §§ 8, 9, где будем утверждать, что эту связь можно исследовать после того, как на независимых основаниях будет установлена синтаксическая структура. Я думаю, что то же самое верно и в отношении связи между синтаксисом и статистическим изучением языка. Зная грамматику языка, можно статистически исследовать использование языка различными способами; при этом разработка вероятностных моделей использования языка (отличных от моделей синтаксической структуры языка^ может дать весьма ценные результаты. Ср. В. Mandelbrot, Structure formelle des textes et communication: deux etudes, «Word», 10, 1954, p. 1—27; H. A. S i mon, On a class of skew distribution functions, «Biometrica», 42, 1955, p. 425—440.

Можно попытаться разработать более тонкую систему отношений между статистической и синтаксической структурой, чем отклоненная нами простая модель порядка статистического приближения. В мои намерения определенно не входит утверждать, что всякая такая система немыслима, но мне не известна ни одна гипотеза подобного рода, которая не стоадала бы очевидными изъянами. Заметим, в частности, что для любого п можно найти цепочку, первые п слов которой могут встретиться в качестве начала грамматически правильного предложения S,, а последние п — в качестве конца некоторого грамматически правильного предложения S,, но при stomS, отлично от S2. Для примера рассмотрим последовательность типа the man who... iff here «человек, который... находится здесь», где «...» может быть глагольной группой произвольной длины. Заметим также, что мы можем оперировать новыми, но вполне грамматически правильными последовательностями классов слов, например последовательностью прилагательных более длинной, чем любая до сих пор встречавшаяся в контексте: I saw а house «Я-видел дом». Разные попытки объяснить различия грамматически правильного и грамматически неправильного, как в случае с A), B), на базе частотности типов предложений, порядка приближения последовательностей классов слов и т. п. должны натолкнуться на многочисленные, подобные приведенным здесь факты.