Это было убедительно продемонстрировано Хробьяртссоном и коллегами в 2012 году с помощью серии клинических испытаний при различных заболеваниях, в которых участвовали как «ослепленные», так и «не ослепленные» подопытные. Обзор 21 такого испытания, в которых в основном использовались субъективные результаты, показал, что эффект вмешательства был преувеличен в среднем на 36 % при оценке его «не ослепленными» исследователями по сравнению с «ослепленными»6. Это очень большое смещение, учитывая, что заявленный эффект большинства лечебных вмешательств гораздо ниже, чем 36 %.
Таким образом, двойное слепое исследование, в котором «ослепление» недостаточно эффективно, может преувеличивать эффект весьма существенно. Можем проверить это на нашем примере с антидепрессантами, допуская для простоты, что «ослепление» нарушается у всех пациентов. Для расчета соотношения шансов мы переставим числа так, чтобы низкое значение символизировало полезный положительный эффект, что вполне соответствует принятой договоренности (смотрите таблицу 4.2). Соотношение шансов для достоверного эффекта составляет (79×100)/(121×100) = 0,65. Так как мы ожидаем, что этот эффект преувеличен на 36 %, можно оценить, каков истинный эффект. Смещение в 36 % означает, что отношение между смещенным и истинным результатом составляет 0,64. Таким образом, истинный результат рассчитываем так: 0,65/0,64, или 1,02. Так как соотношение шансов теперь около 1, это означает, что антидепрессант не сработал.
Таблица 3.2. Те же результаты, что в таблице 3.1, но переставленные
Этот пример был слишком упрощенным, поскольку «ослепление» редко нарушается для всех пациентов, но упражнение тем не менее отрезвляет. Даже если «ослепление» нарушается только по отношению к нескольким пациентам, этого может быть достаточно, чтобы сделать недостоверный результат достоверным. Хробьяртссон с коллегами отметили в своем обзоре, что 36-процентное преувеличение эффекта лечения, связанное с отсутствием «ослепления» оценщиков, было вызвано неправильным распределением результатов по медиане у 3 % оцененных пациентов на каждое клиническое испытание (что соответствует 12 пациентам из общего числа, в данном случае – 400).
Невозможно переоценить важность этого открытия. Большинство лекарств имеют выраженные побочные эффекты, поэтому не может быть никаких сомнений, что «ослепление» нарушается у многих пациентов в большинстве плацебо-контролируемых исследований. Когда мы используем лекарства, чтобы спасти людей от смерти, нарушения «ослепления» не имеют значения, так как мы можем с уверенностью сказать, жив пациент или нет. Однако такие ситуации редки. В большинстве случаев лекарства используются для снижения симптомов или уменьшения риска осложнений при болезни, и результаты очень часто субъективны, например уровень депрессии или шизофрении, тревоги, слабоумия, боли, качества жизни, функциональных способностей (часто называемых повседневной активностью), тошноты, бессонницы, кашля и одышки. Даже решение о том, перенес ли пациент сердечный приступ, может быть довольно субъективным (смотрите главу 4).
Требуется очень небольшое нарушение принципа «ослепления», чтобы превратить совершенно неэффективный препарат в якобы эффективный.
Рандомизированное клиническое испытание – наиболее надежный метод оценки эффектов лечения. Но мы слишком легко верим результатам этих экспериментов, если клиническое испытание было «слепым» и основной результат сопровождается достоверной величиной значения P.
Тревожнее всего, что все лекарства приносят вред, при этом многие из них вообще неэффективны. Поэтому мы добросовестно вредим огромному числу пациентов, поскольку рандомизированные исследования не всегда дают понять, какие из лекарств не работают.
На этом фоне легко понять, почему компании, которые показали, что их лекарство действует на определенную болезнь, в дальнейшем могут тестировать его при совершенно не связанных с этим заболеваниях и находить, что оно также работает и при них. Нарушение «ослепления» является основной причиной, почему гораздо легче изобретать новые заболевания, чем новые лекарства7, 8. Легко показать определенный эффект на простой или чуть более сложной шкале, которая, в довершение всего, может иметь малое клиническое значение, а дальше пусть маркетинговая машина делает остальное.