Выбрать главу

Я собрал архив из тысяч текстовых материалов, опубликованных в The New York Times, начиная от передовиц и мировых новостей и заканчивая спортивными событиями и светской хроникой. Многие из этих статей люди с интересом читали, но лишь часть из них попала в число самых пересылаемых по электронной почте (соответствующий учет велся на сайте). Мы решили выяснить причину.

Для этого предстояло установить, почему тот или иной контент способен стать вирусным. Быть может, дело в том, что статья расположена на первой полосе газеты и потому привлекает больше внимания? Мы изучили, какие разделы интересны большему количеству читателей и у каких авторов больше аудитория. Мы также задались вопросом, может ли определенный стиль изложения вызывать интерес и подталкивать читателей делиться статьями чаще. Чтобы понять это, необходимо было составить список критериев: например, какие эмоции вызывает статья или сколько полезной информации она содержит.

Все началось с набора научных сотрудников. Студенты, заинтересовавшиеся исследованием, обращались ко мне по электронной почте с вопросом, могут ли они помочь. Каждому предлагалось оценить статью и отметить, какие эмоции она вызвала прежде всего – сильные или слабые.

Этот метод работал довольно неплохо, по крайней мере в самом начале. Число оцененных статей возросло до нескольких десятков, однако для тысяч материалов тактика оказалась нерабочей. Чтение статьи занимает какое-то время, а чтение многих статей – много времени. Мы привлекли больше сотрудников, но процесс все равно оставался трудоемким и медленным. К тому же людей стало так много, что возникали сомнения в достоверности результатов. Одному статья могла показаться интересной и вызвать у него сильные эмоции, а другому – нет. Меня тревожило, что это помешает сделать объективные выводы.

Нужен был другой способ, подходящий для более масштабных исследований и дающий результат, которому можно доверять. Этот способ должен был добывать данные без привлечения большого количества людей, которые со временем уставали и теряли интерес.

Я поговорил с коллегами, и кто-то из них предложил компьютерную программу Linguistic Inquiry and Word Count («Лингвистический разбор и подсчет слов»), или LIWC. Программа была гениальна и проста. Пользователь вводил текст (скажем, статью из газеты или что-то иное), и программа оценивала его по многим параметрам, например подсчитывала количество слов, связанных с эмоциями, и определяла, вызывает ли их этот текст.

В отличие от сотрудников программа не уставала. Она была объективна и последовательна. Ничто не могло повлиять на ее оценку. Поэтому LIWC стала моим любимым помощником в исследованиях[3].

МУДРОСТЬ, ДОБЫТАЯ ИЗ СЛОВ

За прошедшие с той поры два десятилетия возникло множество новых инструментов для работы с естественным языком. Изменился подход, появились методы подсчета определенных терминов и способы выявления основных тем в тексте. Так же как изобретение микроскопа произвело революцию в биологии, а телескопа – в астрономии, инструменты обработки языка изменили общественные науки. Они помогли ученым лучше разобраться во всех типах человеческого поведения.

Мы проанализировали звонки в службу поддержки для выявления слов, позволяющих клиентам ощущать себя более удовлетворенными результатом. Детально разбирали разговоры, чтобы выяснить, почему одни более эффективны, а другие менее. Внимательно изучали статьи в онлайн-изданиях, чтобы определить, что поддерживает интерес читателей. Мы также изучили тысячу сценариев фильмов, чтобы понять, по какой причине часть из них становится блокбастерами. Просмотрели десятки тысяч научных публикаций, чтобы узнать, как надо писать, чтобы воздействовать на читателя. Проанализировали миллионы комментариев в интернете, пытаясь выяснить, как слова влияют на работу сарафанного радио. Мы разбирали диалоги между врачами и пациентами, чтобы выявить, что увеличивает доверие, и погружались в слушания дел об условно-досрочном освобождении, чтобы разобраться, какой эффект имеют слова о раскаянии и какие аргументы помогают юристам выигрывать дела. Мы проанализировали сценарии десятков тысяч телевизионных шоу, чтобы дать определение тому, что делает происходящее интересным для зрителей, и изучили более миллиона текстов лирических песен, чтобы обнаружить то, что сделало их хитами.

вернуться

3

Если вы заинтересовались LIWC, рекомендую ознакомиться с прекрасной книгой Джеймса У. Пеннебейкера «Тайная жизнь местоимений». Здесь и далее примечания автора, если не указано иное.