Мы обновили результаты, включив в них последние испытания, и теперь в Кокрейновском обзоре – 234 испытания, исследующих 60 различных клинических состояний3. Мы подтвердили первоначальные результаты, что плацебо-вмешательства в целом не оказывают важного клинического эффекта и что трудно отличить истинный эффект плацебо от предвзятого сообщения о нем.
Вы, наверное, удивлены, почему я так много говорю об эффектах плацебо, а не лекарств. Это потому, что эффекты лекарств определяют по сравнению с плацебо в плацебо-контролируемых исследованиях. И если ослепление не безупречно, мы ожидаем, что сообщенный эффект от лекарства преувеличен, особенно когда результаты субъективны, как в случае с общим настроением или болью.
Как часто ослепление не работает? Довольно часто, по двум причинам. Во-первых, в испытаниях, называемых двойными слепыми, возможно, не было проведено эффективного ослепления в самом начале. Например, исследователи, которые провели шесть двойных слепых исследований антидепрессантов или транквилизаторов, отметили, что во всех случаях плацебо отличалось от активного препарата по физическим характеристикам, таким как текстура, цвет и толщина4. Во-вторых, даже когда препарат и плацебо неотличимы по своим физическим характеристикам, обычно трудно поддерживать ослепление во время испытания, потому что лекарства имеют побочные эффекты, например, антидепрессанты вызывают сухость во рту.
Из-за всех этих проблем истинная разница в улучшении состояния в 60 % и 50 % при использовании, соответственно, антидепрессантов и плацебо, вероятно, значительно меньше, чем 10 %. Но давайте сначала предположим, интереса ради, что эти показатели верны, и разработаем испытание со следующими показателями улучшения (смотрите таблицу 3.1). Мы случайно разделили 400 пациентов на две группы, при этом у 121 из 200 пациентов (60,5 %) было улучшение на активном лекарстве, а у 100 из 200 пациентов (50,0 %) – на плацебо. Следует ли считать, что лекарство лучше, чем плацебо, или могла ли разница, которую мы наблюдали, возникнуть случайно? Мы можем проанализировать это, задав следующий вопрос: насколько частой будет разница в 21 пациента или более, если повторить это испытание много раз? Правда состоит в том, что лекарство не имеет никакого эффекта.
Таблица 3.1. Результаты рандомизированного исследования, сравнивавшего антидепрессант с плацебо
Это тот случай, когда статистика очень полезна. Статистический тест вычисляет значение P, которое показывает вероятность того, что мы будем наблюдать разницу в 21 пациента или больше, если лекарство не работает. В этом случае Р = 0,04. Медицинская литература полна значениями P, и традиция такова, что если значение P меньше 0,05, то мы говорим, что разница статистически достоверна, и верим, что разница, которую мы нашли, реальна. Р=0,04 означает, что мы наблюдали бы разницу в 21 пациента и более четыре раза из ста, если лекарство не работает, и мы повторили наше испытание много раз.
Если бы на два пациента меньшего чувствовали себя лучше на активном лекарстве, то есть 119, а не 121, то разница все равно была бы почти такой же, но при этом она не была бы статистически достоверной (Р = 0,07).
Этот пример иллюстрирует то, что весьма часто «доказательство» эффективности лечения зависит всего от нескольких пациентов. Это верно даже для случая, когда, как в этом примере, в исследование были рандомизированы 400 пациентов, а это довольно крупное исследование депрессии.
Как правило, не требуется предпринимать больших усилий, чтобы превратить недостоверный результат в достоверный. Иногда исследователи или компании переосмысливают или повторно анализируют данные, после того как получают значение P выше 0,05, до тех пор, пока не придут к значению Р ниже 0,05. Это они делают путем, например, вранья о том, что еще у нескольких пациентов на активном лекарстве было улучшение или еще у нескольких пациентов на плацебо не было улучшения или за счет исключения некоторых рандомизированных пациентов из анализа5.
Это нечестный подход к науке, но, как мы увидим в главах 4 и 8, нарушения в научной практике очень широко распространены.
Помимо такого мошенничества, недостаточное «ослепление» в исследованиях может также подвести нас к представлению, что неэффективные препараты эффективны. «Ослепление» важно не только когда пациенты оценивают свое состояние, но и когда их оценивают врачи. Депрессия имеет сложную шкалу, включающую множество субъективных элементов, и совершенно очевидно, что знание того, какое лечение получает пациент, может положительно влиять на оценку врачом эффективности этого лечения.