Такую же закономерность можно найти на страницах любой современной прессы. Попробуйте сделать это сами! Этот простой трюк можно показывать на вечеринке; его также любят демонстрировать фокусники в пабах. Посчитайте первые цифры — и увидите, что их частотность неизменно снижается: числа, начинающиеся с цифры 1, встречаются чаще всего; затем следуют числа, первая цифра которых 2, потом 3 — и т. д. до цифры 9, которая используется в начале чисел реже всего.
Это действительно невероятно. Большинство людей просто не поверят вам, пока вы не подсчитаете цифры. На интуитивном уровне нам кажется, что числа, указанные в газетах, не могут вести себя столь упорядоченно, особенно учитывая тот факт, что они произвольно взяты из огромного количества самых разных источников. Тем не менее, о каких бы числах ни шла речь — о результатах спортивных соревнований, ценах акций или количестве погибших, — уверяю вас: цифра 1 в начале чисел будет встречаться чаще, а цифра 9 — реже всего.
Этот вывод представляется нам несколько неожиданным, так как мы интуитивно предполагаем, что все числа имеют равные шансы на появление. Безусловно, если поместить в ящик 999 шариков для пинг-понга, пронумерованных от 1 до 999, и извлекать их в произвольном порядке, то вероятность выбора любого числа с определенной цифрой в начале составляет одну девятую, или 11 процентов. Другими словами, у всех цифр в этом случае одинаковые перспективы. Однако очевидно и то, что в газетах первые цифры чисел ведут себя абсолютно иначе: они распределены по явно выраженному асимметричному закону.
Тенденцию к преобладанию чисел, начинающихся с единицы, впервые заметил американский астроном канадского происхождения Саймон Ньюком[36]. В 1881 году он опубликовал в журнале American Journal of Mathematics краткую заметку, в которой объяснял, что выявил данную особенность благодаря книгам с логарифмическими таблицами. Первые страницы с таблицами логарифмов для чисел, начинающихся с цифры 1, всегда были более истрепаны, чем страницы с таблицами для чисел, начинающихся с цифры 9. Подобный феномен уж точно не объяснишь тем, что исследователи якобы внимательно читали первые страницы книги, а затем теряли к ней интерес из-за отсутствия захватывающего сюжета. Здесь причина в другом: они чаще сталкивались в работе с числами, начинающимися с единицы. Ньюком предположил, что частотность первых цифр чисел, выраженная в процентах, примерно такова.
Частота наличия цифры 1 в начале чисел составляет 30,1 процента, цифры 2 — 17,6 процента, цифры 3 — 12,5 процента, причем этот показатель стремительно падает по мере увеличения цифры: шанс встретить цифру 1 в начале чисел в семь раз превышает подобную вероятность по отношению к цифре 9.
Ньюком рассчитал эти показатели с помощью логарифмов. Он утверждал, что вероятность появления цифры d в начале числа определяется по формуле: log(d + 1) — log d. (В Приложении 1 я объясню ее суть.) Однако он не смог четко обосновать ее, поэтому привел вместо этого неформальный аргумент, просто представив его как некую любопытную тенденцию.
Более чем полвека спустя, в 1938 году, физик из General Electric Фрэнк Бенфорд заново открыл феномен первой цифры, тоже обратив внимание на потрепанность страниц в книгах с таблицами логарифмов (по всей вероятности, он не знал о статье Ньюкома)[37]. Однако Бенфорд проанализировал эту закономерность не только на основании книг с логарифмами. Он изучил распределение первых цифр исходя из таких данных, как население городов США, адреса первых нескольких сотен людей из биографического справочника американских ученых American Men of Science, атомный вес химических элементов, площадь бассейна рек и статистика бейсбольных матчей. В большинстве случаев результаты были близки к ожидаемому распределению. Наверное, было очень интересно наблюдать за тем, как одна и та же последовательность возникает в самых разных ситуациях. Разумеется, полученные показатели не были в точности такими, как представленные выше проценты (в реальном мире подобной точности нет). Тем не менее в целом они почти полностью совпадали с прогнозируемыми значениями, отклоняясь от них не более чем на несколько десятых процента. В настоящее время закон Бенфорда нашел свое подтверждение в самых разных областях, в том числе в естествознании, финансах, экономике и вычислительной технике. Этот закон гласит: в любом множестве данных о естественных произвольных процессах, включающем в себя величины нескольких порядков, частота появления цифры 1 в качестве первой значащей цифры составляет около 30 процентов, цифры 2 — около 18 процентов и т. д. Бенфорд считал, что этот феномен отражает универсальный закон, который он обозначил термином «закон аномальных чисел». Но термин не прижился, и открытие получило известность под названием «закон Бенфорда».
36
Simon Newcomb, Note on the Frequency of Use of the Different Digits in Natural Numbers, American Journal of Mathematics, 1881.
37
Frank Benford, The law of anomalous numbers, Proceedings of the American Philosophical Society, 1938.