Выбрать главу

Среднее количество детей на семью: 3,0

Среднее количество братьев и сестер на ребенка: 3,9[24]

Четыре семьи, в которых нет детей

Шесть семей с одним ребенком — шесть детей, у которых ноль братьев и сестер

Девять семей, в которых два ребенка, — 18 детей, у которых один брат или сестра

11 семей с шестью детьми — 66 детей, у которых пять братьев и сестер

А теперь давайте рассмотрим пример с колледжами. В Соединенных Штатах множество крупных колледжей (например, колледж в штате Огайо или в штате Аризона), где учится более 50 тысяч студентов. Есть также и не такие большие колледжи, где учится менее 3 тысяч студентов (например, Кеньон-колледж или Уильямс-колледж). Если мы включим в наши подсчеты еще и школы, то получим, что в колледже среднего размера учится 10 тысяч студентов. Но если подсчитать количество студентов, то получится, что средний студент ходит в колледж, где учится более 30 тысяч студентов. Это происходит потому, что при подсчете студентов мы получим гораздо больше данных из крупных школ. Схожим образом можно сделать вывод, что средний человек не живет в среднем городе, а средний гольфист не делает среднее число ударов для прохождения площадки с 18 лунками.

Во всех этих примерах меняется изучаемая группа, а потому меняется знаменатель при вычислении среднего арифметического. Рассмотрим еще один пример асимметричного распределения вроде того, с которым мы встретились, обсуждая детскую смертность: средний инвестор не получает средний доход[25].

В одном исследовании средний доход от инвестиции 100 долларов на срок 30 лет составил 760 долларов, или 7 % в год. Но 9 % инвесторов потеряли деньги, а огромному числу инвесторов, 69 %, не удалось достигнуть показателя среднего дохода. Так случилось потому, что среднее арифметическое было смещено из-за нескольких человек, заработавших больше среднего. На графике, предложенном ниже, среднее арифметическое смещено вправо благодаря тем счастливчикам, которым удалось заработать состояние.

Доходность инвестиции в 100 долларов через 30 лет. Обратите внимание: большинство людей получили доход меньше среднего арифметического, а немногие счастливчики — в пять раз больше среднего.

Махинации с осями координат

Человеческий мозг не развит настолько, чтобы обрабатывать большие объемы информации в виде текста, зато наши глаза автоматически ищут шаблоны и схемы в данных, представленных визуально. Самый точный, хотя и не самый простой для трактовки способ представить числовую информацию — составить таблицу, включив в нее все имеющиеся данные. Но для большинства людей сложно — если не сказать невозможно — обнаружить в этом массиве информации какие-то закономерности или тенденции, поэтому мы полагаемся на схемы и графики. Последние бывают двух видов: они либо показывают каждую точку данных (как в графике рассеяния), либо каким-то образом преобразуют данные, обобщают их, фокусируясь при этом, например, только на средних или медианах.

Есть много способов использовать графики для манипуляции и искажения данных. Но человек, которому свойственна осторожность, постарается не попасть впросак.

Необозначенные оси координат

Основной способ манипуляции с помощью статистических графиков — не обозначать оси координат. Если оси никак не названы, вы можете выдумать что угодно. Вот пример, взятый с плаката, который один студент-исследователь показывал на конференции[26]. Выглядел этот график таким образом (я его просто перерисовал):

Что все это значит? Из текста, приведенного на самом постере (а вовсе не на этом графике), нам известно, что специалисты исследуют активацию головного мозга пациентов, страдающих шизофренией (Ш). А что же такое КЗЗ? Нам не говорят, но из контекста — КЗЗ постоянно сравнивают с Ш — мы можем предположить, что это означает «контроль за здоровьем». Кажется, между КЗЗ и Ш должна быть разница, но… эм-м-м… на оси Y отмечены числа, и… единицы измерения могут быть какими угодно! Что мы видим? Результаты теста, уровни активации мозга, количество активированных зон мозга? Количество стаканчиков пудинга Jell-O, которые съели испытуемые, или количество фильмов с Джонни Деппом, которые они посмотрели за последние шесть недель? (Справедливости ради, исследователь позже опубликовал свои заключения в экспертном журнале и исправил все недочеты, на которые ему указали.)

вернуться

24

Среднее количество братьев и сестер на ребенка… — контурограмма детей с сайта Etsy, https://www.etsy.com/listing/221530596/stick-figure-family-car-van-bike-funny; маленький и большой дома нарисованы автором, средний дом взят из источника: http://www.clipartbest.com/clipart-9TRgq8pac.

вернуться

25

…средний инвестор не получает средний доход. — Притворство, см. Tabarrok, A., (2014, July 11). Средний доход от фондового рынка не является средним. http://marginalrevolution.com/marginalrevolution/2014/07/average-stock-market-returns-arent-average.html. Дата просмотра — 14 октября 2014 г.

вернуться

26

пример, взятый с плаката, который один студент-исследователь показывал на конференции. — Tully, L. M., Lincoln, S. H., Wright, T., & Hooker, C. I. (2013). Нервные механизмы, поддерживающие осуществление когнитивного контроля за информацией в случае шизофрении. Плакат был представлен публике на 25-й ежегодной встрече Общества исследований в области психопатологий. https://www.researchgate.net/publication/266159520_Neural_mechanisms_supporting_the_cognitive_control_of_emotional_information_in_schizophrenia. Впервые я обнаружил этот пример на www.betterposters.blogspot.com.