Зная гауссовы кривые для разных случайных событий, статистики отвергнут газетное сообщение о новорожденном весом в 6 килограммов, о том, что в городе Киеве 12-го числа рождались только мальчики, а 13-го только девочки, о том, что в Москве в мае месяце не было ни одного дня с температурой ниже 30 градусов, о том, что число автомобильных катастроф в декабре было в десять раз больше, чем в январе, что во вторник по всему городу не было продано ни одного куска мыла, а в среду никто не приобрел в аптеке таблеток пирамидона и т.д.
И право же, такой скептицизм, базирующийся на хорошей статистике и знании закона вероятности, обоснован не хуже, чем расчеты траектории космического корабля. Словом, невероятно – не факт.
Если вероятности невелики…
Во время войны довольно часто стреляли из винтовок по вражеским самолетам. Может показаться, что это безнадежное дело; о прицельной стрельбе здесь и речи быть не может, поскольку лишь пули, пробивающие бензобак или поражающие летчика, приносят результат. Было установлено, что вероятность удачного выстрела равнялась 0,001. Действительно мало. Но если стреляет одновременно много бойцов, то картина меняется.
Примеров, в которых нас интересует вероятность многократно осуществленного события, обладающего малой вероятностью, множество. Например, с задачей попадания в самолет из винтовки полностью совпадает задача о выигрыше в лотерею по нескольким билетам.
Каждая серия «выстрелов» может быть как неудачной, так и закончиться одной удачей, а то и несколькими. Соответствующее распределение вероятностей было найдено французским математиком Пуассоном.
В любом математическом справочнике вы найдете формулу Пуассона, а также таблицы, позволяющие найти интересующую вас вероятность без расчета.
Средняя частота – это результат, идеально совпавший с предсказанием теории вероятностей. Если вероятность выигрыша равняется 0,01, то из ста билетов выиграет 1, а из тысячи – 10. Единица и десять это и есть средние частоты выигрыша для серий в сто и тысячу билетов. Конечно, средняя частота может быть и дробным числом. Так, для серий в десять билетов при том же значении вероятности средняя частота выигрыша равняется 0,1. Это значит, что в среднем одна из десяти серий по десяти билетов будет содержать один выигрыш.
В таблицах Пуассона приводятся цифровые данные для всевозможных значений средних частот. Чтобы было ясно, в каком виде нам сообщаются эти сведения и для общей ориентировки приведем несколько чисел характеризующих распределение вероятности при средней частоте, равной единице. Вот эти числа.
Ста выстрелами при вероятности попадания в 0,01 или тысячью выстрелами при вероятности попадания в 0,001, или миллионом при вероятности в 0,000001, мы поразим цель один раз в 37 процентах случая, 2 раза в 18 процентах, 3 раза в 6 процентах… 8 раз лишь в 0,001 процента. А промахнемся сколько раз? Промахов точно столько же, сколько одноразовых попаданий, то есть 37 процентов.
Приведенные проценты, как и любые числа вероятностей, работают точно лишь для очень большого числа серий. Если миллион людей приобрел лотерейные билеты, выигрывающие с вероятностью в 0,01, то 37 процентов из них не выиграют ни разу, а 37 процентов других лиц обязательно выиграют по одному билету и т.д. Если же мы заинтересуемся выигрышами только 100 человек, то должны считаться с вероятными отклонениями от среднего. В «среднем» 37 из них не выиграют ни разу. Отклонения здесь от «среднего» не превысят 6≈sqrt(37)[Примечание 1]. А с такими отклонениями, как мы уже знаем, следует считаться и помнить, что число неудачников будет находиться между 31 и 43. Конечно, не исключены и бо́льшие отклонения в обе стороны, но их вероятность совсем уж невелика.
Узнав из условий розыгрыша, что в среднем на сотню лотерейных билетов один выигрывает, владелец билетов будет считать себя несчастливым, если на его 100 билетов выигрыш не упадет ни разу. Если же ему не повезет несколько раз, то он, возможно, заподозрит устроителей лотереи в несправедливости. Однако сделаем простой расчет. Если вероятность одного «промаха» равна 0,37 (37%), то вероятность двух «непопаданий» равна квадрату этого числа (0,14), а трех – кубу (0,05). А это не такие уж малые доли, чтобы делать столь решительные выводы.
1
Запись «sqrt(n)» в данной книге означает «корень квадратный из n». В бумажной книге напечатан непосредственно радикал, но в электронной версии для совместимости с текстовыми форматами использована такая запись. Sqrt происходит от англ. «square root» и является распространенным обозначением функции взятия квадратного корня в языках программирования.