В нашем гипотетическом примере, если существует корреляция между употреблением в пищу белка и возникновением рака печени, это не доказывает, что белок вызывает или предотвращает данную болезнь. Классической иллюстрацией этой сложности служит тот факт, что в странах с большим количеством телефонных столбов чаще наблюдаются сердечно-сосудистые и многие другие заболевания. Таким образом, существует положительная корреляция между телефонными столбами и сердечно-сосудистыми заболеваниями. Однако это не доказывает, что телефонные столбы вызывают такие заболевания. На самом деле корреляция не означает причинно-следственную связь.
Из этого не следует, что корреляция бесполезна. Когда она правильно интерпретируется, то может быть эффективно использована для изучения взаимосвязи питания и здоровья. Например, в «Китайском исследовании» содержится более 8000 случаев статистически значимой корреляции, и это имеет огромное значение. Когда наблюдается так много подобных случаев корреляции, ученые начинают выявлять взаимосвязь между образом жизни, питанием и болезнью. Это, в свою очередь, помогает понять, как процессы питания и здоровья, которые обычно невероятно сложны, происходят на самом деле. Однако в случае, если кто-то хочет получить доказательства того, что единственный фактор может привести к единственному результату, корреляция – не очень хороший инструмент.
Статистическая значимость
Вам может показаться, что определить наличие корреляции между двумя факторами очень просто: либо они коррелируют между собой, либо нет. Но это не так. Когда вы рассматриваете большое количество данных, вам нужно провести статистический анализ, чтобы определить, имеется ли корреляция между двумя факторами. Ответом не будет однозначное «да» или «нет». Это вероятность, которую мы называем статистической значимостью. Статистическая значимость – это мера измерения того, можно ли считать полученный результат эксперимента надежным, или он всего лишь обусловлен случайными факторами. Если вы трижды подбросите монету и трижды выпадет орел, то, скорее всего, это случайность. Если же вы подбросите монету сто раз и каждый раз будет выпадать орел, вы можете быть полностью уверены, что у этой монеты орел с обеих сторон. В этом и заключается идея, лежащая в основе понятия статистической значимости: это вероятность, что корреляция (или другие результаты) действительно существует, что это не игра случая.
Считается, что результат исследования статистически значим, если вероятность того, что он обусловлен случайными факторами, менее 5 %. Это означает, например, что существует 95 %-ная вероятность того, что при повторном исследовании мы получим тот же результат. Точка отсечения на уровне 95 % произвольна, тем не менее это стандартный показатель. Другая произвольная точка отсечения – 99 %. Если результат соответствует этому показателю, говорят, что он имеет высокую статистическую значимость. В приведенном в этой книге анализе питания и болезней время от времени используется понятие статистической значимости, и оно может применяться для оценки надежности, или весомости, доказательства.
Механизм действия
Часто корреляция считается более надежной, если другие исследования указывают на биологическую взаимосвязь тех же факторов. Например, между телефонными столбами и сердечно-сосудистыми заболеваниями существует положительная корреляция, однако нет исследований, которые бы показывали наличие биологической связи между телефонными столбами и этими заболеваниями. Однако существуют исследования, в которых рассматриваются процессы, посредством которых прием в пищу белка и рак печени могут иметь биологическую и причинно-следственную взаимосвязи (об этом речь пойдет в главе 3). Знание процесса, посредством которого в организме что-либо происходит, означает знание «механизма действия». А знание механизма действия подкрепляет доказательство. Иными словами, это означает, что два коррелирующих фактора взаимосвязаны биологически правдоподобным способом. Если взаимосвязь правдоподобна с биологической точки зрения, она считается гораздо более убедительной.