В 2015 году Кристиан Томасетти, прикладной математик, и Берт Фогельштейн, доктор медицины, использовали статистическую аргументацию для доказательства того, что две трети случаев заболевания раком были вызваны «невезением»[8]. Хотя некоторые виды рака могут быть связаны с выбором образа жизни (например, рак легких, вызванный курением), это еще не все. Более важная часть заключается в неизбежных клеточных делениях, которые происходят в наших телах. Каждый раз, когда клетка делится, существует малая вероятность генетической мутации, которая может вызвать рак. Кристиан и Берт обнаружили, что рак с большей вероятностью образуется в тех частях тела, где клетки делятся быстрее.
Это исследование вызвало некоторые споры. Если рак такой непредсказуемый, то почему мы должны тратить так много денег на исследование причин его появления? Чтобы оправдать использование термина «невезение» и лучше объяснить свои выводы, Кристиан и Берт провели аналогию с автомобильными авариями. Они сказали, что чем больше времени вы проводите в машине, тем больше вероятность того, что попадете в аварию. Стиль управления автомобилем влияет на вероятность, но время за рулем также очень важно.
Параллель с футболом работает так же хорошо, если не лучше. Вы можете думать о каждом делении клеток в вашем теле как об отдельной минуте футбольного матча. Когда ячейка делится, есть (очень) крошечный шанс случайной раковой мутации, так же как есть (гораздо больший) шанс пропустить гол в футбольном матче. Именно в этом смысле рак может считаться невезением. Иногда наша команда не пропускает ни одного мяча за игру; хотелось бы надеяться, что мы проживем нашу жизнь без того, чтобы заболеть раком. Хотя иногда мы проигрываем потому, что соперник был силен, никто не может отрицать, что удача играет важную роль в любом конкретном матче. Наше здоровье похоже на субботний день, когда вы наблюдаете за игрой с трибун – не все голы можно предотвратить.
Не все происходящее с нами сводится к случайности. Многие болезни можно предотвратить, если мы выберем здоровый образ жизни, а пропущенные голы часто случаются из-за плохой защиты. Но осознание того, что многое из происходящего с нами несет случайный характер, иногда может помочь смириться с вызовами, которые бросает нам жизнь. Не все в жизни можно предсказать.
Объясняется случайностью
Именно непредсказуемость футбольного матча от одной минуты к другой и создает распределение Пуассона по прошествии 90 минут. Мы знаем среднее количество голов, забитых в матче, но их время непредсказуемо. Как итог – некоторые результаты становятся намного более вероятными, чем другие. Парадокс здесь заключается в том, что эти итоги объясняются случайностью. Тот факт, что голы случаются произвольно во времени, делают возможным предсказание закономерности результатов. Эту идею очень сложно понять, но это правда. Факт случайности какого-либо события помогает нам объяснить это и предугадать, как часто оно будет происходить. Случайность позволяет нам делать всевозможные прогнозы о будущем.
Математики используют этот трюк постоянно. В начале нового футбольного сезона, в преддверии чемпионата мира или премии «Оскар» в газетах часто пишут о «гениальном» математике, который предсказал вероятность победы определенных команд или фильмов. Эти прогнозы зачастую выглядят обоснованными, а иногда они оказываются и верными. Но откуда они берутся?
Я открою вам секрет. Эти гении обычно используют распределение Пуассона и немного справочной информации о командах или фильмах. Для моделирования результатов в футбольных матчах используется такая хитрость – рассчитать показатели забитых и пропущенных голов для каждой команды и затем симулировать матчи между ними. Например, в Премьер-лиге сезона-2012/13 «Арсенал» забивал в среднем 2,47 мяча в домашних играх и 1,32 в матчах на выезде. Пропускала команда 1,21 гола дома и 0,74 на выезде. Собирая такую статистику для каждой команды, а затем моделируя игры между всеми парами, мы можем создавать прогнозы на предстоящий сезон. Пример такого предсказания приведен в таблице 1.1, где я использовал данные из сезона-2012/13 и модель, чтобы спрогнозировать четверку лучших в сезоне-2013/14[9].
8
Tomasetti, C. & Vogelstein, B. Variation in cancer risk among tissues can be explained by the number of stem cell divisions. – Science 347(6217), 2015. – p. 78–81.
9
В этой модели я использую четыре параметра для каждой команды: среднее число забитых голов дома (SH), пропущенных дома(CH), забитых(SA) и пропущенных(CA) на выезде. Они оцениваются по голам, забитым в сезоне-2012/13. Когда две команды встречаются в лиге в моем моделированном сезоне-2013/14, я сначала генерирую цели для хозяев. Они распределены по Пуассону со средним значением, равным 1/2 (SH + CA), которое учитывает атакующую силу хозяев и оборону гостей. Голы гостей распределены по Пуассону со средним значением, равным 1/2 (CH + SA). Чтобы получить полный сезон, процедура повторяется для всех матчей.