предполагаем для собственно систем. В этом случае мы имеем
дело с ценозом. Понятно, что различие между собственно системой и ценозом относительно, ибо во всех случаях имеют место оба процесса, и речь может идти только о большем или
меньшем превалировании одного из них. Но в общем ценоз отличается от системы более «свободным» составом своих компонентов (элементов). Соответственно любые ценозы, т.е. сообщества, состоящие из ряда разнородных элементов (в том числе и
из технических устройств), в значительной степени отличаются
случайным набором составляющих. А в таких случаях мы имеем
дело с распределениями. Вопрос в том, с какими именно.
Уже сравнительно давно известен класс распределений, называемых «гауссовыми». Но распределение элементов ценоза в
соответствии с теми или иными их характеристиками не подчиняются законам гауссовых распределений. Сравнительно недавно был выявлен новый класс распределений. Их назвали «негауссовыми», подчеркивая тем самым отличие от симметричных
гауссовых распределений. Эти распределения подчиняются другим законам больших чисел. Первый из них принято называть
«законом Ципфа», а сами такого рода распределения иногда называют «ципфовскими».
Закон Ципфа (Зипфа) (часто называемый также законом
Ципфа-Бредфорда-Парето) — закон обратностепенного распределения, впервые был сформулирован как эмпирическая закономерность распределения частоты слов естественного языка.
Если все слова языка (или просто достаточно длинного текста)
упорядочить по убыванию частоты их использования, то частота
n-го слова в таком списке окажется приблизительно обратно
пропорциональной его порядковому номеру n (так называемому
рангу этого слова). Например, второе по используемости слово
встречается примерно в два раза реже, чем первое, третье – в три
раза реже, чем первое, и т. д. При этом длина слова тем меньше,
чем меньше его порядковый номер. Вероятность случайного появления какого-либо слова длиной n в цепочке случайных символов уменьшается с ростом n в той же пропорции, в какой растет при этом номер данного слова в частотном списке. Потому
произведение номера слова на его частоту есть константа.
204
Впервые на существование такого рода закономерностей
еще в начале прошлого века обратил внимание француз Эсту,
разрабатывая систему стенографии на научной основе, но его
работа осталась незамеченной. Сегодня закон Ципфа – «гиперболический негауссов закон распределения Ципфа-БредфордаПарето», основанный на фрактальной структуре распределения
ресурса по объему, широко используется для ценозов любого
вида (био-, социо-, техно-, информценозов). Сформулировано
значительное число гиперболических распределений − распределения (или законы) Ципфа, Парето, Лотки, Уиллиса, Бредфорда и др. Их общая черта – резкая асимметричность (в отличие от «гауссовых»), а главная особенность – выраженность одной и той же по сути математической формулой, в которой
варьирует только показатель степени (формула может записываться в двух видах – частотном и ранговом).
Таким образом, невозрастающую последовательность р1, р2, ...,
pk (∑ki = 1 pi = 1) частот употребления слов из словаря объема k
в некотором тексте (выборке) называют ранговым распределением для данного текста. При этом номер i слова в словаре, упорядоченном по невозрастанию частоты употребления, называют
рангом этого слова. Если Fi − количество употреблений слова
ранга i (i-гo слова), N − общее количество словоупотреблений в
тексте, то pi = Fi/N. Текст (разбиение) удовлетворяет закону Ципфа, если его ранговое распределение описывается зависимостью
pi = A/i; ∑ki = 1; pi = 1; i = 1,…, k. Величина А определяется как A =
p1 ≈ 1/ln(k). При равенстве pi = Fi/N отсюда следует N = Fi ln(k).
В распределении Ципфа величины pi и k жестко взаимосвязаны. Обычно задаются какой-нибудь одной из этих величин, а другую вычисляют. При этом распределение Ципфа будет зависеть от
того, какая величина, рi или k, определена по реальному тексту.
Выбрать эталонное распределение с учетом одновременно двух
наблюденных величин − pi и k позволяет формула Мандельброта,
включающая формулу для распределения Ципфа в качестве частного случая: Pi = A/(i+B), ∑ki = 1, pi = 1, i = 1,…, k. Коэффициенты A
и В здесь могут быть выражены через pi и k с помощью двух равенств: A/(1+B) = p1; ∑ki = 1 A/(i+B) ≈ Aln((k+B)/(1+B)) = 1.
Говоря о распределении Ципфа или Мандельброта, нередко