3. Исключение неинформативных фамилий. Очевидно, что часть пришлых, «залётных» фамилий может встретиться и в тех населённых пунктах, где население в основном коренное. Поэтому мы исключаем фамилии, число носителей которых в изучаемом районе меньше заданного порога. Обычно мы пользуемся разработанным нами «демографическим» критерием: фамилия считается неинформативной, если она встречена менее чем у пяти человек в районе (см. раздел 7.3). Программа «ONOMA» позволяет подразделить согласно этому критерию весь список фамилий на условно «коренные» и условно «пришлые». Условия их выделения (строгость критерия) можно выбрать разные. Все дальнейшие операции можно проводить с любыми выделенными группами фамилий — «коренными» (частыми), «пришлыми» (редкими) или по всей совокупности фамилий.
4. Расчёт частот фамилий. Каждая фамилия «прикреплена» в базе данных к тому населённому пункту, где она встречена. Однако мы не проводим анализ на уровне отдельных населённых пунктов[84]. Нами принята организация данных на трёх других более высоких иерархических уровнях. Первый уровень — «популяция» (сельская администрация, волость, сельсовет), объединяющая несколько населённых пунктов. Второй уровень — «район». Он включает все популяции, относящиеся к данному району согласно современным административным границам. Третий уровень — «регион». Он соответствует области или нескольким соседним областям и включает все районы, которые были обследованы в этих областях. Программа работает последовательно с каждым из уровней. Сначала объединяются списки фамилий всех населённых пунктов, относящихся к данной популяции, и рассчитывается частота каждой фамилии в полученном списке. Это частоты на уровне популяций. Далее усредняются частоты фамилии во всех популяциях данного района, и записывается полученная частота фамилии в районе. Далее усредняются частоты фамилии во всех районах данного региона, и записывается полученная частота фамилии в регионе. На всех уровнях иерархии можно рассчитывать и взвешенные, и невзвешенные средние частоты, что определяется конкретной задачей. Программа обеспечивает анализ и на любых других уровнях иерархии — например, населённых пунктов, или же заданных групп районов, или же заданных областей, или, например, географически соседних районов разных областей.
5. Размещение в базе данных. Частоты каждой фамилии в каждой популяции, каждом районе и каждом регионе записываются в базу данных. Причём, частота фамилии в данной группе населения может быть рассчитана разными способами. Осуществляется целый веер расчёта частот. Фамилии могут быть «коренные», «пришлые» или любые. Частоты взвешенные или невзвешенные на том или ином уровне. Население может включаться только сельское или же и городское. Неинформативные популяции могут исключаться в разных вариантах или же включаться в анализ. То есть мы получаем несколько оценок частоты одной и той же фамилии в одной и той же группе населения. Чтобы избежать путаницы, они помещаются в разные разделы базы данных. Весь веер полученных частот для каждой популяции может храниться в БД и использоваться для дальнейшего анализа. Каждый из- этих вариантов расчёта оптимален для решения своего круга задач.
6. Оценка случайного инбридинга. Традиционно в популяционной генетике фамилии используются для расчёта случайного инбридинга (см. раздел 7.6). Инбридинг оценивается просто — методом изонимии (I). Он представляет вероятность случайного заключения брака между носителями одной фамилии (это справедливо при условии панмиксии). Соответственно, вероятность случайного инбридинга рассчитывается как четверть от суммы квадратов частот всех фамилий [Crow, Mange, 1965]. Программа «ONOMA» рассчитывает коэффициент изонимии (I) для популяций любого уровня и для частот фамилий, полученных разными способами.
Перечень признаков: Абрамов, Александров, Алексеев, Андреев, Анохин, Антонов, Афанасьев, Балашов, Белов, Борисов, Быков, Васильев, Веселов, Виноградов, Волков, Воробьёв, Воронин, Голубев, Горбачёв, Григорьев, Гуляев, Гусев, Денисов, Дружинин, Егоров, Ершов, Ефимов, Иванов, Ильин, Калинин, Киселёв, Ковалёв, Козлов, Костеров, Котов, Кротов, Крылов, Кудряшов, Кузьмин, Кузнецов, Курочкин, Лебедев, Макаров, Михайлов, Морозов, Никитин, Николаев, Новиков, Носков, Осипов, Павлов, Пестов, Петров, Поляков, Попов, Прокофьев, Романов, Савельев, Семёнов, Сидоров, Смирнов, Соколов, Соловьёв, Степанов, Тарасов, Тимофеев, Тихонов, Трифонов, Фёдоров, Филиппов, Цветков, Чернов, Чистяков, Щербаков, Яковлев.
84
Во многих деревнях встречаются лишь несколько фамилий. Поэтому слишком велики случайные колебания частот фамилий между отдельными населёнными пунктами. Колебания между соседними «волостями» (объединяющими несколько деревень) значительно меньше.