Выбрать главу

Доклад демонстрирует эффективный пример применения в практической психологии хорошо опробованных методов статистического моделирования. В ней показано, как именно относительно простые, рутинные протокольные цифровые записи о действиях пользователя киберпространства могут быть использованы для автоматической оценки широкой палитры персональных характеристик («атрибутов»). Проводя в сети все больше времени, пользователи Facebook"клик за кликом" рисуют удивительно точную картину самих себя и не ощущают при этом того, что раскрывают свою конфиденциальную информацию. Авторы этого исследования честно признались, что специально выбрали те параметры, "наклонности" и "атрибуты" личности пользователей, которые в наибольшей степени иллюстрируют, насколько точными и настораживающими могут быть результаты их прогнозирования на основе общедоступной информации. Им удалось создать программу, достаточно точно "предсказывающую" не только пол и возраст пользователей, но также и такие высокочувствительные их личные данные ("персональные атрибуты"), как сексуальная ориентация, этническая и религиозная принадлежность, политические взгляды, личные наклонности, уровень интеллектуального развития и удовлетворенности своей жизнью ("уровень счастья"), употребление наркотиков, разобщенность родителей и проч. В общем виде схема проведенного исследования представлена на рис. 1.

Общая схема исследования

1) В Facebook были выбраны 58 466 добровольцев из США, которые согласились поработать с приложением My Personality Facebook (www.mypersonality.org/wiki) и расставить свои пометки like("нравится") на различных материалах (контенте), доступных в этой социальной сети: фотографиях, "друзьях", интересных страницах, спорте, музыке, книгах, ресторанах, популярных Web-сайтах и проч. В среднем каждый из участников расставил примерно 170 пометок, всего пометок удостоились 55 814 материалов, при этом абсолютное большинство из них отмечалось неоднократно, то есть разными участниками. По завершении работы с этим приложением оно содержало информацию об участниках, взятую из их "профилей Facebook", список расставленных ими пометок like, а также некоторую иную информацию.

Далее была сделана матрица "участник — пометка" (представлена на рис. 1 слева), составленная из строк, каждая из которых содержит пометки, поставленные одним участником. В клетку матрицы ставилась "1", если данный участник (строка) пометил данный материал (столбец) словом like, и "0" — в противном случае. Всего в такой матрице было проставлено около 10 млн. единиц (? 58466*170, то есть произведение количества участников на число помет).

2) На втором шаге размерность матрицы "участник — пометка" была сокращена с помощью формального математического метода "сингулярно-значимой декомпозиции" (singular-value decomposition, SVD)[14]. В результате исходная матрица была преобразована в матрицу "участник — компоненты" (представлена на рис. 1 в центре), у которой количество столбцов сокращено до 100 в соответствие с числом выделенных значимых факторов (компонент). Клетки этой матрицы заполнялись не "1", а специально рассчитанными "коэффициентами значения" той или иной компоненты.

3) На третьем шаге весь массив предсказываемых параметров ("атрибутов"), характеризующих каждого из участников, был разбит на три группы (на рис. 1 справа):

а) параметры, соответствующие профилю Facebook;

б) демографической "картине"

;в) проведенным тестам.

К группе а) были отнесены такие параметры, как возраст, пол, политические и религиозные взгляды, семейное положение, сексуальная ориентация, размеры и плотность личной социальной сети. В группу б) вошёл только один параметр — этническая принадлежность. В группу в) были включены психологические параметры, характеризующие индивидуальность личности человека по общепризнанной 5-факторной модели (невроз или эмоциональная стабильность, экстраверт или интраверт, открытость к новому опыту или закрытость, уступчивость или конфликтность, добросовестность или нет)[15]. В данной работе использовались данные по 5-факторной модели для 54 373 участников, полученные с помощью обобщения ответов на вопросы международного обследования[16].

вернуться

14

Golub, G. H., Kahan, W. Calculating the singular values and pseudo-inverse of a matrix / SIAM (Society for Industrial and Applied Mathematics) // Journal on Mathematical Analysis. 1965, Vol. 2, No. 2, pp. 205–224.

вернуться

15

Costa, P. T., McCrae, R. R. Revised NEO Personality Inventory (NEO-PI-R) and NEO Five-Factor Inventory (NEO-FFI) professional manual. Odessa, FL: Psychological Assessment Resources, 1992.

(Далее: Costa, P. T., McCrae, R. R. Revised NEO Personality Inventory…)

вернуться

16

Goldberg, L. R., et al. The international personality item pool and the future of public-domain personality measures / Presidential Symposium at the sixth annual meeting of the Association for Research in Personality, New Orleans, January 20, 2005 // Journal of Research in Personality. 2006 (40), pp. 84–96.