• Измерения при очень малой случайной выборке (например, можете ли вы узнать нечто важное от маленькой выборки из потенциальных потребителей, своих работников и т. д. в условиях большой неопределенности?).
• Оценка некой совокупности, или множества, объектов, которые невозможно увидеть все сразу (например, численность рыб одной породы в океане, растений одного вида в ливневых лесах, сбоев при производстве нового продукта или же таких попыток несанкционированного доступа в вашу систему, которые остаются необнаруженными, и т. д.).
• Измерения при наличии множества переменных, в том числе неизвестных (например, определение причины роста продаж — реализация новой программы повышения качества, экономия, ошибки конкурентов, новая политика ценообразования и т. д.).
• Оценка риска наступления маловероятных событий (например, вероятность неудачного запуска новой ракеты, повторения атаки террористов 11 сентября 2001 г. или еще одного наводнения в Новом Орлеане).
• Оценка стоимости предметов искусства, свободного времени или повышения вашей личной безопасности на основе того, сколько на самом деле люди готовы за это заплатить.
Многие из перечисленных подходов к измерению — просто разновидности базовых методов, включающих выборку и управляемые эксперименты, иногда концентрирующих внимание на других типах вопросов. Такие методы наблюдения практически не используются в принятии бизнес-решений, вероятно, потому, что представляются довольно сложными и формализованными. Считается, что это не те способы, которые можно при необходимости применить сразу же без подготовки и с минимальными затратами. Однако на самом деле это совсем не так.
Вот очень несложный пример быстрого измерения, которое каждый может провести и при этом легко рассчитать статистическую погрешность. Предположим, что вы подумываете над тем, чтобы перевести часть своих сотрудников на дистанционную работу. Один из факторов, который вам необходимо учесть, — сколько времени средний служащий ежедневно тратит на дорогу до работы и домой. Чтобы выяснить это, вы можете официально опросить всех работников, потратив много времени и денег. При этом, скорее всего, ответ будет более точным, чем вам необходимо. Допустим теперь, что взамен вы выберете наугад пять человек. Позже мы еще поговорим о том, что означает «выбрать наугад», а сейчас представим, что вы просто закроете глаза и ткнете пальцем в список сотрудников. Вызовите этих людей и спросите, сколько времени они обычно тратят на дорогу. Предположим, будут получены следующие ответы: 30, 60, 45, 80 и 60 минут. Возьмем самое высокое и самое низкое значения в выборке — 35 и 80. Вероятность того, что медиана значений продолжительности поездок на работу и домой для совокупности работников находится в этом интервале значений, составляет 93 %. Я называю это Правилом пяти. Правило пяти несложно, оно работает, и можно доказать его статистическую обоснованность для решения целого ряда задач. Когда выборка настолько мала, интервал значений может быть очень широким, но если он окажется значительно уже предыдущего интервала, значит, вы провели измерение.
Существует 93-процентная вероятность того, что в любой случайной выборке медиана для всей совокупности находится в интервале между наименьшим и наибольшим значениями.
Кажется, что нельзя быть уверенным в чем-то на 93 %, располагая всего пятью случайными значениями, но это возможно. Чтобы понять, почему это так, важно учесть, что Правило пяти позволяет определить медиану совокупности. Медиана — это такая точка, которая делит всю совокупность на половины со значениями выше и ниже нее. Если выбрать наугад такие пять значений, которые все располагались бы выше или ниже медианы, то медиана оказалась бы вне интервала. Но какова вероятность подобного выбора?
Вероятность случайного выбора значения, превышающего медиану, составляет, по определению, 50 % (вероятность выпадения орла при подкидывании монеты). Вероятность случайного выбора пяти значений, которые все окажутся выше медианы, равна вероятности выпадения орла при подкидывания монеты пять раз подряд, то есть равна 1/32, или 3,125 %. Такова же вероятность того, что пять раз подряд выпадет решка. Тогда шанс не получить все решки или все орлы составляет 100 % — 3,125 % × 2 = 93,75 %. Поэтому вероятность случая, когда по крайней мере одно значение из пяти окажется больше или меньше медианы, составляет 93,75 %, или, если округлить с понижением, 93 % (или даже 90 %, если вы хотите быть очень осторожным). Некоторые читатели, возможно, еще помнят тот раздел статистики, где обсуждаются методы выборочного обследования для малых выборок. Эти методы несколько сложнее Правила пяти, но по причинам, о которых я подробнее расскажу позже, не позволяют получить намного более точные результаты.