Покажем, какие богатые выводы можно сделать из постоянства статистических данных.
Во Франции в течение долгого времени число ежегодно рождавшихся мальчиков относилось к числу девочек как 22:21. Иными словами, нормальная кривая для этого отношения, построенная по месяцам за много лет, имеет максимум при 22:21. Просматривая записи рождений мальчиков и девочек в Париже (собранные за 39 лет), Лаплас нашел, что максимум кривой лежит при отношении 26:25. (26:25 < 22:21). Используя теорию нормальной кривой, можно убедиться, что это отклонение – различие в дробях – не может быть случайным. А если так, то оно должно иметь реальное объяснение. «Когда я стал размышлять об этом, – пишет Лаплас, – то мне показалось, что замеченная разница зависит от того, что родители из деревни и провинции оставляют при себе мальчиков (мужчина в хозяйстве – более ценная рабочая сила), а в приют для подкидышей отправляют девочек». Он действительно изучил списки приютов и убедился в справедливости своего предположения.
Встречается множество случаев, когда нет преимуществ у отклонений по кривой «вправо» или «влево». А если эти отклонения являются суммарным эффектом большого числа случайностей, то распределение будет гауссовым. (Математики могут доказать справедливость этого утверждения достаточно строго.)
Если же мы ждали симметричной кривой, а получили «хвост» в одну сторону и даже в стороне от колокола наметился еще один холмик поменьше, то над этим фактом стоит задуматься: вероятно, исследованию подвергалась неоднородная группа явлений. Как это может быть? Например, речь идет об измерениях роста жителей какого-нибудь города, в котором живут представители двух рас. Пусть девяносто процентов жителей относится к высокорослой расе, а десять процентов – к низкорослой. В этом случае результаты измерений роста не создадут симметричную гауссову кривую: сбоку от среднего роста может наметиться добавочный горб кривой, во всяком случае, кривая распределения будет иметь разные хвосты влево и вправо.
Выводы статистики приобретают ценность тем большую, чем обширнее материал, на основе которого построена гауссова или иная статистическая кривая.
Имея перед глазами кривую статистического распределения или статистические таблицы, мы можем делать предсказания двух типов: уверенные – детерминистские, если речь идет о средних значениях, и вероятностные – если речь идет об индивидуальном событии. Правда, обычно вероятностные предсказания не распространяются на конкретное лицо. Скажем, если известно, что средний процент брака в цехе равен 1,5 процента, то есть смысл говорить о вероятности, что 15 деталей из тысячи, изготовленных слесарем Ивановым, попадут в ящик для стружки лишь в том случае, если об Иванове ничего не известно.
На земле живет очень много людей, они выполняют похожие дела, совершают похожие поступки. Поэтому почти все события, в том числе и такие, которые кажутся редкими и исключительными, свершаются достаточно часто и являются предметом статистики.
Обратимся к таким печальным событиям, как автомобильные катастрофы. Их, оказывается, так много, что можно говорить не только о средних числах катастроф вообще, но и «рассортировать» их по типам причин, из-за которых они произошли. Исследователям известно, например, сколько аварий происходит по вине велосипедистов; есть данные для сравнения числа катастроф, происшедших по вине велосипедистов, имеющих фонари и не имеющих; в сводках автомобильных катастроф, публикуемых ООН, можно увидеть, как они распределяются по возрастным категориям водителей. Из этих сводок видно, что наиболее безопасными для окружающих являются водители среднего возраста; наиболее опасными оказываются мальчишки; небольшое увеличение числа несчастных случаев наблюдается у водителей, перешагнувших за семьдесят. Внутри каждой категории возрастов введены графы для разной погоды, разного времени дня и ночи и т.д. и т.п. И приходится только поражаться стабильности этих данных.
Отнесенные к числу, характеризующему интенсивность движения в стране (что-то вроде числа автомобилей на число километров дорог), данные по катастрофам оказываются совершенно универсальными.
Казалось бы, что может быть случайнее столкновения двух машин. Здесь и усталость водителей, и состояние дороги, и то, что автоинспектора называют «дорожная обстановка», тут и случайно подвернувшийся прохожий, и каток, оставленный на обочине дорожными рабочими, тут и состояние тормозов автомобилей, и еще бесчисленное множество маленьких и больших факторов. Да, действительно, это типично случайное событие, но так как причин очень много, то законы статистики здесь выполняются безупречно строго.