Выбрать главу

Однако, остается поле для курьезов и шуток. Например, на карте проступают инициалы Стивена Хокинга, буквы SH. Правда, буквы кривоваты, зато достаточно велики. По поводу концентрических колец. Они были найдены на карте определенным алгоритмом поиска — искали везде, заранее не зная размера. Используя подобный метод поиска «эффектов», в богатом статистическом материале всегда можно найти впечатляющий «сигнал». Проблема в том, что довольно сложно оценить вероятность случайного появления подобного «сигнала» в большом массиве данных. Авторы зачастую игнорируют этот ключевой и сложный этап работы, провозглашая эффект в четыре или пять стандартных отклонений, что впоследствии оборачивается подмоченной репутацией.

К первому апреля 2011 года в архиве электронных препринтов вышла статья «Нестандартные космологические реликтовые паттерны в космическом микроволновом фоне» (arXiv:1103.6262), в которой авторы издеваются над поисками «паттернов» в реликтовом излучении, проверяя карту на корреляции с символами ☺, ☹, ликом Христа на Туринской плащанице и еще парой картинок. И, конечно, они находят значимую корреляцию. Чтобы не мелочиться, они оценивают значимость корреляции в ∞ σ. Этот е-принт мог бы по праву войти в сборник «Физики шутят». Кстати, там четыре автора, фамилии всех начинаются на «Z» (Zuntz, Zibin Zunkel, and Zwart) и все — реальные ученые из сильнейших научных центров! Можно предложить читателю в качестве домашнего задания оценить вероятность случайного возникновения такого авторского коллектива. После этой публикации разговоры о кольцах Пенроуза стихли.

Кстати, это не единственная первоапрельская статья данного авторского коллектива. Подбор авторов становится ясен из их предыдущей первоапрельской статьи. Годом раньше они (за исключением J. Zibin, вместо которого фигурировал Т. Zlosnik) выпустили препринт «Орфографические корреляции в астрофизике» (arXiv:1003.6064v1), где исследуется зависимость числа цитирований от первой буквы фамилии автора. По ходу авторы издеваются над некоторыми методологическими приемами, использовавшимися в статьях, написанных на полном серьезе. Вообще, первоапрельские розыгрыши и прочие шутки, видимо, имеют в науке огромное значение, поскольку положительно коррелируют с научным уровнем сообщества. Автор не проверял эту корреляцию на конкретном статистическом материале, но она видна и невооруженным глазом, ее значимость никак не меньше оценки, приведенной выше, — ∞ σ (см. врезку «Что такое сигма…»).

Однако шутки в сторону! На самом деле карта неоднородностей реликтового излучения — кладезь важнейшей информации. В ней зашифрованы ключевые сведения о Вселенной — карта говорит о ней как о целом больше, чем наблюдения далеких галактик и квазаров. По мнению автора, суммарное научное значение результатов WMAP превосходит значение открытия бозона Хиггса. Просто эти результаты оказались растянутыми во времени. Как же расшифровать карту? Для ответа полезно совершить очередной экскурс в прошлое.

Что такое сигма и статистическая значимость

Наверно каждому, кто хоть сколько-нибудь интересуется наукой, приходится время от времени слышать нечто подобное: «Модель противоречит данным на уровне два сигма», «Открытие бозона Хиггса будет официально признано, когда уровень значимости достигнет пяти сигма», «Заявки на доклады о три-сигма-эффектах не рассматриваются» и т.д.

Вездесущая сигма — всего лишь параметр, задающий ширину распределения Гаусса, традиционно обозначаемый как σ. Это жаргон. Официальный термин -стандартное отклонение, но это тот случай, когда жаргон сильно потеснил изначальный термин не только в устной речи, но и в научных статьях. Собственно, вот так выглядит распределение Гаусса, нормированное на единицу:

f(x) = 1/(σ√2π·е^(x-x0)/2σ2)

«Нормированное на единицу» означает, что при таком коэффициенте перед экспонентой площадь под кривой равна единице. Распределение Гаусса крайне важно в статистике по простой причине: сумма многих случайных величин описывается распределением Гаусса (для простоты пользуемся вульгарным языком, пусть даже рискуя навлечь на себя гнев математиков). Например, распределение числа выпадений орла при 100 бросаниях монеты близко к распределению Гаусса со средним х0 = 50 и σ = √50). На самом деле это будет так называемое биноминальное распределение, но при числе выпадений 50 оно достаточно близко к распределению Гаусса и обычно считается таковым при обработке данных.