Выбрать главу

Копаясь в выложенной в общий доступ статистике ГИБДД, я, к своему удивлению, не обнаружил столь усердно рекламируемой отдельными сенаторами статистики по ДТП с участием праворульных автомобилей. Если она и существует, то простым смертным доступна лишь со слов членов Совета Федерации, утверждающих, что в 2004 году в ДТП с праворульными автомобилями погиб 2 741 человек.

У меня нет никаких сомнений, что члены Совета Федерации, пытаясь запретить ввоз и эксплуатацию автомобилей с правым рулем, руководствовались исключительно благими намерениями, но даже если принять на веру, что статистика такая существует, остается очень много вопросов. Например, по чьей вине были совершены эти ДТП (мы уже видели выше, что в значительной части ДТП виновны пешеходы, которых ни один гаишник, кстати говоря, не трогает)? Как распределились эти аварии по регионам? Например, в Дальневосточном округе попасть в ДТП на леворульном автомобиле затруднительно, так как леворульный автомобиль нужно еще найти. Фиксируют ли сотрудники ГИБДД при оформлении протокола, с правым или левым рулем был пострадавший автомобиль, и если да, как давно они это делают? Можно ли, сравнив количество леворульных и праворульных автомобилей в Москве (если есть такая статистика) или в стране (если есть такая статистика) с количеством ДТП, в которых виноваты водители этих автомобилей (есть такая статистика), сделать вывод, что праворульные автомобили опаснее леворульных или наоборот?

Случай с антипропагандой праворульных автомобилей - чистейшей воды подмена понятий, когда под видом ответа на один вопрос собеседнику дается ответ на вопрос, который мало того что не задавался, так еще никому особенно и не интересен. При этом совершенно неважно, насколько объективна приведенная в ответе статистика.

Проблема среднего

Ремарка

Просто, чтобы расставить точки над i. Мы исходим из того, что если ФЦП повышения безопасности движения поможет спасти жизнь хотя бы одному человеку, то она уже хороша. Но сам механизм социальной деформации вполне адекватных статистических данных любопытен. Тем более, что встречается довольно часто. Так, несколько лет назад в США договорились до того, что ожирение ежегодно уносит больше жизней, чем курение (что, вообще говоря, не совсем так).

Термин "среднестатистический" уже давно используется так широко, что и термином быть перестал. Впрочем, широкое использование не делает это слово яснее. В первую очередь потому, что непонятно, что именно понимать под средним вообще.

Классический пример (который приводит Хафф и почти все его последователи; правда, по-моему, нечто подобное я слышал еще в школе, хотя мои учителя Хаффа, конечно, не читали) звучит примерно так: в некой организации работают 100 человек, из них 95 получают, скажем, 40 тысяч рублей в месяц, четыре менеджера получают 100 тысяч рублей в месяц, а владелец бизнеса, он же генеральный директор, получает пять миллионов, потому что у него большая семья. Вопрос: какова средняя зарплата в этой организации?

Попытка рассчитать среднее арифметическое приводит нас к бессмысленной, в общем-то, зарплате в 92 тысячи рублей. Этот показатель, конечно, близок к зарплате менеджера, но вряд ли 95 рабочих сочтут такой подсчет справедливым. И понятно, что погоду портит директор, который со своей семьей выбивается из распределения. Поэтому для таких случаев обычно используется медиана - выбирается срединное значение (то есть, в нашем случае, сорок тысяч рублей). Разумеется, это тоже неидеальное решение, поскольку ни зарплаты менеджеров, ни зарплата директора в нем не учтены, однако оно куда ближе к реальному положению дел, чем предыдущий вариант.

Это совсем не высшая математика, в этом способен разобраться даже не самый способный третьеклассник. Однако когда мы сталкиваемся не с реальной статистикой, а скорее с ее пересказами, то очень часто понимаем, что у нас нет вообще никакой информации о том, как считались средние показатели (и почему).

Художник

И вот эти неполные, а зачастую дополненные предрассудками статистиков и многочисленных пересказчиков информации (каждый из которых на своем этапе может внести в данные ошибки), попадают наконец к художнику. У художника задача простая. Он должен взять табличку в Excel и сделать из нее хорошую картинку.