Выбрать главу

Так же работают с текстом. Обучившись на соответствующих примерах, программа способна распознавать воинственную риторику в социальных сетях или определять, в каком разделе издания должна быть опубликована определенная статья.

Исследователи применили аналогичный метод для определения авторства пьесы «Двойная ложь». Сначала они загрузили произведения всех трех авторов, где принадлежность перу была неоспорима. Затем программа провела анализ текста, чтобы определить количество слов в разных категориях, в том числе по частям речи: сколько в каждой пьесе местоимений (например, «я» или «ты»); много ли слов, выражающих эмоции; чаще встречаются одно– и двухсложные или многосложные слова.

Пьесы одного драматурга не всегда идентичны по сотням заданных параметров, но ученые провели анализ дюжины показателей, позволяющих в дальнейшем точно определить авторство. Затем они сравнили лингвистические параметры этих пьес и «Двойной лжи», что дало возможность определить, кто ее написал.

Исследование показало происхождение текста. По крайней мере три первых акта однозначно были написаны Шекспиром. Последующие два, вероятнее всего, создал его соавтор Флетчер. Также обнаружилось вмешательство Теобальда, известного страстью к серьезной редактуре.

Таким образом двое ученых положили конец спорам, которые велись на протяжении нескольких веков, даже не прочитав пьесу.

ЧТО ОТКРЫВАЕТ ЯЗЫК

Первые шесть глав этой книги посвящены тому, как оказывать влияние при помощи языковых средств. Мы говорили о том, как использовать волшебные слова, фразы и языковые стили для достижения счастья и успеха, о том, как наша речь воздействует на коллег, друзей, покупателей и клиентов. Однако, как следует из описанного случая с «Двойной ложью», у языка есть и другая функция. Слова не только оказывают воздействие на людей, которые их слышат или читают, – они также многое говорят о людях, которые их используют.

Шекспир, например, употреблял относительно мало слов, связанных с эмоциями, тогда как Теобальд, напротив, довольно часто прибегал к ним, а еще он использовал много предлогов («из», «в», «от») и артиклей. В тексте Флетчера много вспомогательных глаголов и наречий. У каждого писателя свой неповторимый стиль. В этом есть сходство с отпечатками пальцев. Все люди оставляют следы, по которым их можно найти.

Кроме того, люди, принадлежащие к одной социальной группе, часто используют одинаковый стиль речи, что дает возможность составить характеристику на каждую из этих групп. Молодежь и люди старшего возраста говорят по-разному. Отличается также речь демократов и республиканцев, интровертов и экстравертов[89]. Все они используют разные комбинации слов. Совпадения, безусловно, присутствуют, однако даже небольшой отрывок текста дает возможность довольно точно определить возраст и политические взгляды автора, а также дать в целом описание его личности.

Прогностическая ценность текста заключается не только в этом. Слова, используемые человеком на письме или в устной речи, позволяют понять, лжет он или нет, а сочинения абитуриентов колледжа указывают на то, станут ли они хорошими студентами[90]. Основываясь на постах женщины в фейсбуке, можно предсказать, будет ли у нее послеродовая депрессия[91]. А публикации влюбленной пары в соцсетях показывают, распадется ли она в ближайшее время (полезны даже те посты, в которых ничего не говорится об отношениях)[92].

Люди используют язык для самовыражения, коммуникации и достижения личных целей. Их языковые особенности могут многое рассказать о них – о том, какие чувства они испытывают, и даже о том, чем они станут заниматься в будущем.

Даже если общение людей не имеет конкретных целей и они не стараются намеренно придерживаться определенного стиля, как Шекспир и Теобальд, все же слова, которые они употребляют, скажут о них много важного. Например, насколько высока вероятность того, что они выплатят банковский кредит.

ПРЕДСКАЗАНИЕ БУДУЩЕГО

Представьте, что вам надо решить, кто из двух людей получит ссуду. Каждому из них необходимо по две тысячи долларов для ремонта крыши. Финансовое положение и прочие личные данные просителей практически идентичны: это люди одного возраста, расы и пола, они живут в одном регионе страны, имеют одинаковый доход и кредитную историю. Разница состоит лишь в формулировках, которые они использовали, чтобы попросить о помощи.

вернуться

89

Использование языка отличается в зависимости от пола. (Mehl & Pennebaker, 2003; Welch, Perez-Rosas, Kummerfeld, & Mihalcea, 2019), возраста (Pennebaker & Stone, 2002; Morgan-Lopez et al., 2017; Sap et al., 2014), расы (Preotiuc-Pietro & Ungar, 2018), политических взглядов (Preotiuc-Pietro et al., 2017; Sterling, Jost, & Bonneau, 2020).

вернуться

90

James W. Pennebaker et al. When Small Words Foretell Academic Success: The Case of College Admissions Essays // PLOS ONE. December 31, 2014. Р. e115844, URL: https://doi.org/10.1371/journal.pone.0115844; Matthew L. Newman et al. Lying Words: Predicting Deception from Linguistic Styles // Personality and Social Psychology Bulletin. 2003. 29, № 5. Р. 665–675. URL: https://doi.org/10.1177/0146167203251529.

вернуться

91

Использование определенного языка также может много рассказать о здоровье (для ознакомления см.: Sinnenberg et al., 2017), в том числе о психическом (для ознакомления см.: de Choudhury, Gamin, Counts, and Horvitz, 2013; Eichstaedt et al., 2018; Guntuku et al., 2017; Chancellor and De Choudhury, 2020), при СДВГ (Guntuku et al., 2019) и заболеваниях сердечно-сосудистой системы (Eichstaedt et al., 2015). Часто эти результаты оказываются более полезными, чем тестов или анализа социально-экономического положения.

вернуться

92

Sarah Seraj, Kate G. Blackburn, James W. Pennebaker. Language Left Behind on Social Media Exposes the Emotional and Cognitive Costs of a Romantic Breakup // Proceedings of the National Academy of Sciences of the United States of America. 2021. 118, № 7. Р. e2017154118. URL: https://doi.org/10.1073/pnas.2017154118.