Кроме Основного, в НКРЯ есть десять других корпусов. Мой любимый – Поэтический, в нём планируется собрать всю значимую русскоязычную поэзию. Здесь можно искать по особенностям рифмы, строки, строфики, клаузулы и др. Есть Параллельный корпус, предназначенный для сопоставления русского языка с иностранными. Специально для школы создан Обучающий корпус. В нём предусмотрена грамматическая разметка, соответствующая школьной программе, и адаптированный состав текстов. Например, я только что изучила с его помощью школьную классификацию наречий по значениям. Оказалось, что на весь русский язык всего четыре наречия «цели» (назло, бесцельно, чего, зачем) , тогда как «причины» побольше (недаром, поневоле, невольно, неспроста, незачем, почему, потому, поэтому, что и др.) .
Ориентация на узус
Согласно корпусной лингвистике, любое утверждение о языке должно быть проверено на очень большом – статистически релевантном – наборе текстов. И если раньше лингвистика была ориентирована на абстрактную официальную норму, то сейчас кажется гораздо более интересным изучение того, что происходит в языке на самом деле. Наш язык – живой организм, и за последние тридцать лет он заметно изменился, поэтому сейчас многие кодифицирующие положения нуждаются в проверке. Корпусное изучение узуса, то есть речевых обыкновений носителей языка, того, как мы все говорим и пишем, должно служить для подтверждения или корректировки традиционных положений. Так, для класть / ложить исследование показывает, что норма по-прежнему очень жёсткая. Но вот правило о том, что сказуемое при местоимении кто должно быть в единственном числе ( все, кто пришёл , но никогда не все, кто пришли ), корпусной проверки не выдерживает и, видимо, после всестороннего изучения, будет переформулировано.
Мой ученик как-то спросил: «Что положено знать про носки и чулки ? Правда ли, что у них разные окончания?» В ответ на первый вопрос предлагаю мнемоническое правило: «То, что короче, удлиняем окончанием - ов , то, что длиннее, укорачиваем нулевым». А вот второй вопрос сложнее: я не знаю, «правда ли» это, не знаю, эта норма жива или устарела. Что ж, придётся взять отсрочку и разобраться. Грамматический словарь А.А. Зализняка и толковый Малый академический согласны с традицией. Но вот неожиданный результат: орфоэпический словарь под редакцией А.Н. Аванесова для носок подтверждает вариативность, считает форму с нулевым окончанием не менее правильной, чем традиционная. Основные источники разошлись во мнениях, и поэтому необходимо получить более достоверную информацию.
Начинаю поиск в Газетном корпусе НКРЯ (объём 170 миллионов слов, тексты 2001–2010 годов), чтобы разобраться в интуиции «усреднённого» носителя языка с высшим образованием. Язык печатных СМИ одновременно и достаточно свободен, и стремится соответствовать норме, что поддерживается работой корректоров и редакторов. Вот результат: форма носок встречается 165 раз, носков – 236, чулок – 167, чулков – 3 (не считая двух случаев синих чулков , которые в орфоэпическом словаре упомянуты как правильные). Три неправильные формы чулков , «произнесённые» от имени авторов статей, а не цитатно, – это не так уж и мало. Сравните: разнообразные формы глагола ложить ни разу не встречаются в Газетном корпусе от имени авторов, только 8 раз в репликах персонажей как отрицательная речевая характеристика. Теперь исследую, есть ли среди 165 носок формы родительного падежа. Есть. Тоже три случая.
А как использовали эти формы классики? Создаю в Основном корпусе НКРЯ подкорпус художественной литературы – получается 100 миллионов слов. Форма носок во множественном числе нашлась три раза, из них два в современных текстах, а чулков (не «синих» ) – 17 раз, и из них не менее трети в речи автора, например, у Тургенева, Помяловского, Чернышевского, Горького: