1. Гоночная команда готовится к решающему заезду в сезоне, принесшем ей некоторый успех. Команда попала в пятерку лучших в 12 из 15 заездов, когда она пришла к финишу.
2. Автомобиль команды сошел с дистанции из-за отказа уплотнительной прокладки в 7 из 24 заездов (в двух гонках автомобиль не дошел до финиша по другим причинам), и каждый из отказов прокладки приводил к поломке двигателя разной степени тяжести.
3. Механик, отвечающий за двигатель, считает, что отказ прокладки был вызван температурой воздуха. В предыдущих случаях он имел место при 11, 13, 14, 17, 21, 21 и 23 градусах Цельсия. Самый серьезный отказ произошел при наиболее низкой температуре: 11 градусов Цельсия. Вчера вечером температура упала ниже нуля и перед гонкой поднялась лишь до 4 градусов тепла.
4. Главный механик не согласен с мнением коллеги, занимающегося двигателем, он не считает, что отказ прокладки был вызван низкой температурой. По его мнению, гонки не выигрывают, сидя в ремонтной яме.
5. Перед последними двумя заездами команда изменила посадочное место прокладок, посчитав, что это может решить проблему. Однако температура во время обеих гонок была выше 21 градуса.
6. Сегодняшняя гонка – важное событие, освещаемое по общенациональному телевидению.
7. Вы надеетесь: если команда придет к финишу в первой пятерке, то она получит серьезную спонсорскую поддержку, и это позволит ей не беспокоиться о финансах весь следующий год. Однако, если по телевидению покажут, как у вас отказывает прокладка, вы сойдете с дистанции навсегда. Если же команда не будет участвовать в гонке или не придет в первой пятерке, ее конкурентное положение не изменится.
Ну, будете ли вы участвовать? Вам пора принимать решение.
Оригинальные материалы этой первой обучающей ситуации предоставляют более подробные данные для принятия решения, а здесь я передал самую суть. Пока студенты в аудитории читают текст, я три раза предупреждаю их: «Если вам нужна дополнительная информация, скажите мне об этом». Нужна ли дополнительная информация вам? Например, если бы вы захотели узнать, связан ли отказ прокладки с температурой воздуха, какие данные вам бы понадобились?
Большую часть студентов, как правило, не интересует дополнительная информация, и многие из них решают участвовать. Они приходят к выводу, что шансы на возникновение проблемы составляют 7 из 24, тем более что и главный механик говорит: в ремонтной яме гонки не выигрывают. Мои студенты принимают во внимание потенциальную проблему низкой температуры, но считают, что данные по ней неубедительны.
Мало кто желает получить критически важную информацию, необходимую для проверки температурной гипотезы. Какие данные нужны тому, кто хочет узнать, действительно ли отказ двигателя связан с погодными условиями: температура, при которой двигатель отказывал, температура, при которой он работал исправно, или и та и другая? Любой, кто разбирается в двигателях, или имеет представление о статистике, или просто умеет логически мыслить, скажет: и та и другая. Однако, несмотря на то что учащимся несколько раз говорят: «Если вам нужна дополнительная информация, задавайте вопросы», большинство из них не спрашивают, при какой температуре воздуха двигатель работал исправно.
Тем немногим, кто интересуется температурой воздуха во время заездов, не отмеченных отказом прокладки, я даю дополнительный пакет информации. Они узнают, что во время удачных гонок температура воздуха составляла 18, 20, 20, 22, 23, 26, 26, 27 градусов Цельсия, кроме того, две гонки проходили при температуре 21 и 24 градуса и три – при 19 градусах.
Меняет ли это картину? Теперь вы имеете возможность заметить, что команда не дошла до финиша во всех гонках, приходивших при температуре ниже 18 градусов Цельсия, и что между низкой температурой воздуха и отказом прокладки заметна очень высокая корреляция. График на рис. 1 поможет вам увидеть этот алгоритм.
Более того, учитывая данные всех 24 гонок, вы увидите, что вероятность отказа в грядущем заезде согласно логистической регрессии превышает 99 %. Но если у вас нет информации об удачных гонках, то вы не заметите закономерности. Большинство студентов принимают решение об участии без этих данных, потому что не спрашивают о них.
Если вы не знаете, как строить логистическую регрессию, не расстраивайтесь. Вам это и не нужно. Метод «на коленке» тоже сработает. Может быть, вас убедит табл. 1.
Рис. 1. Отказ прокладки при разных температурах