Выбрать главу

К 2012 году некоторые рейтинговые компании вышли далеко за рамки использования одних только демографических данных и были в состоянии указать, какие отдельные люди их смотрят[136]. Этих-то данных и не хватало Вагнеру и его коллегам. Они предоставили таким компаниям списки GOTV («идите голосовать») и «поддающихся убеждению», а взамен получили информацию о том, сколько людей в каждой группе смотрят ту или иную телепередачу[137]. Это позволило легко определить наилучшее эфирное время – то есть те телепрограммы, которые собирают у экранов больше всего GOTV и «поддающихся убеждению» в расчете на доллар рекламных расходов. Вагнер рассказывал: «Мы пришли к мысли покупать время поздних вечерних программ вроде тех, что крутят на TV Land, хотя это и казалось странным. Они считались в целом невыгодными и потому были дешевы. Но их смотрело множество избирателей, поддающихся убеждению, так что мы купили время»[138].

После выборов Вагнер основал компанию под названием Civis Analytics, которая трансформировала этот подход к покупке эфирного времени в готовый продукт и стала предлагать его рекламодателям. По мнению Вагнера, сейчас самое время продавать такие услуги – в основном по той причине, что у многих компаний есть огромные списки отдельных людей: перспективных клиентов, активных клиентов, людей, возможно, склонных к дополнительным покупкам, и прочих. Он говорил нам: «Если вы продаете дорогие шины, то существует сколько-то людей, желающих потратить уйму денег на дорогие шины, и 90 процентов тех, кому на них наплевать, потому что они не водят машину или склонны экономить. У вас есть вполне пригодное представление о вашей целевой аудитории, но раньше вы не знали наверняка, какие телепередачи она смотрит. Что ж, теперь вам это известно»[139]. Для рекламодателей размещение роликов в телеэфире – важное решение, оно принимается на основе определенных данных, но на него также сильно влияют человеческие суждения. Компания Civis стремится изменить эту ситуацию и сделать покупку рекламного времени в меньшей степени интуитивной и в большей степени рациональной.

Разумеется, даже прекрасно отлаженная система, основанная на данных, далека от совершенства, особенно если она имеет дело с неточной информацией. В 2016 году во время кампании Хиллари Клинтон применялись аналогичные методы, но Клинтон проиграла выборы, в частности, потому, что данные опросов ошибочно показали, что у нее будет большой отрыв в трех штатах Среднего Запада, где она в итоге немного уступила.

Еще одна проблема состоит в том, что лица, принимающие решение, не всегда правильно ставят конечную цель; Ронни Кохави (один из авторов термина HiPPO) называет это явление критерием общей оценки[140]. Даже если бы группа Вагнера смогла максимально точно выявить преимущество Клинтон в разных штатах, такая цель не была бы правильной. Президент США избирается коллегией выборщиков, а не прямым народным голосованием, следовательно, здесь требуется более тонкая стратегия, зависящая от штата. Аналогичным образом легко измерить количество просмотров страницы сайта или количество кликов, которые обеспечила сетевая рекламная кампания, однако бизнес больше интересуют долговременные продажи, которые обычно максимизируют иначе. Способность тщательно отбирать входные данные и определять правильные показатели работы – ключевой навык для лиц, принимающих решения на основе данных.

КОГДА АЛГОРИТМЫ ВЕДУТ СЕБЯ ПЛОХО

У передачи решений машинам есть вполне реальное неприятное следствие: ошибки и недочеты в алгоритмах могут закрепить или даже усилить некоторые из вредных предрассудков нашего общества. Например, Латания Суини, известный профессор из Гарварда, встревожилась, после того как ввела свое имя в Google. Вместе с результатами появилось объявление:

Латания Суини. Арестована? 1. Введите имя и штат. 2. Получите доступ ко всей информации. Мгновенные проверки – www.instantcheckmate.com[141]

Такое объявление предполагало, что у нее криминальное прошлое, хотя она никогда не подвергалась задержанию.

Решив исследовать это явление, Суини обнаружила, что поиск по именам, более распространенным среди афроамериканцев (например, Тревон, Лакиша или – да, Латания), с гораздо большей вероятностью приводил к появлению сообщения «Арестована?», чем по именам, чаще ассоциирующимся с белыми (например, Лори или Брендан)[142]. О причинах этого феномена нельзя сказать ничего точно, но Суини дала ему такое объяснение: алгоритм Google, обеспечивающий показ рекламы, заметил, что клики более вероятны, когда объявления связаны с именами, характерными для чернокожих. Это не отражение сознательных дискриминирующих действий людей, размещающих объявления или работающих в Google. Просто алгоритм отражает и усиливает распространенный в обществе расовый предрассудок, проявляющийся в решениях миллионов людей кликнуть по определенным объявлениям. Аналогичным образом по словам «ученый» и «бабушка», набранным в январе 2017 года в сервисе поиска изображений Google, выдавалось ошеломляющее количество фотографий белых людей.

вернуться

136

Эта информация поступает от абонентских приставок, которые люди соглашаются подключить в своих домах.

вернуться

137

Чтобы сохранить тайну личной информации, сопоставлением занималась третья сторона, так что ни специалисты Обамы, ни рейтинговая компания не видели поименных списков.

вернуться

138

Dan Wagner, интервью, данное авторам в июле 2015 г.

вернуться

139

Dan Wagner, интервью, данное авторам в июле 2015 г.

вернуться

140

Ron Kohavi, Randal M. Henne, and Dan Sommerfield, “Practical Guide to Controlled Experiments on the Web: Listen to Your Customers Not to the HiPPO,” 2007, https://ai.stanford.edu/~ronnyk/2007GuideControlledExperiments.pdf.

вернуться

141

“Racism Is Poisoning Online Ad Delivery, Says Harvard Professor,” MIT Technology Review, February 4, 2013, https://www.technologyreview.com/s/510646/racism-is-poisoning-online-ad-delivery-says-harvard-professor.

вернуться

142

Latanya Sweeney. “Discrimination in Online Ad Delivery,” Queue 11, no. 3 (2013): 10.