Выбрать главу

Подход детального анализа и просмотра фильма ради сбора материала для исследования категорически нам не подходит, поскольку требует огромных ресурсов. Реккья в своем исследовании предлагает иной способ оценки наших представлений: при помощи математических и лингвистических моделей, анализа ключевых слов, реплик и в меньшей степени анализа событий, ассоциирующихся с интеллектуальной машиной.

Конечно, нет ничего проще, чем, используя алгоритмы больших языковых моделей (Large language model, LLM), нейронных сетей, натренированных на тексте и применяющих в анализе миллиарды параметров систематизирования текстовой информации, разобрать связь между словами, фразами в больших массивах текста, таких как сценарий фильма, текст книги, комментарии в интернете. Несложно развернуть на домашнем компьютере LLM, натренировать ее преимущественно на текстовом материале, который необходимо разобрать, попросить провести анализ через серию запросов. Получится даже немного романтично: искусственный интеллект изучает человеческие представления о себе. Но не стоит слишком усложнять простую задачу. Грубый пересчет, как у Реккья, вполне нам подойдет, чтобы произвести первичную оценку и наметить дальнейшее направление исследования.

Считаем слова

Ключевое слово

Любой фильм, сериал или шоу на специализированных сайтах, таких как «Кинопоиск» и IMDb, могут быть отсортированы и найдены по названию, дате выхода, жанру и ключевым словам. Ключевые слова в анализе играют важнейшую роль, поскольку именно они сортируют и организуют фильмы по тем качествам, которые им присущи. К сожалению, на страницах отечественного «Кинопоиска» найти удобный функционал работы с ключевыми словами не удалось, поэтому использовался IMDb, который на момент написания этой книги имеет базу в более чем 14 млн фильмов, шоу и сериалов и более дружественный интерфейс для чтения ключевых слов.

Мы повторяли некоторые шаги, описанные в оригинальном исследовании Реккья. Это означает почти полную воспроизводимость результатов исследования.

В IMDb ключевое слово — это слово или группа слов, с которыми ассоциируется фильм, шоу, сериал или даже эпизод многосерийного произведения. Они используются для описания значимых объектов, событий и идей, которые показаны в кинокартине. Ключевые слова назначаются в ряде случаев автоматически, но часто их вводят и уточняют пользователи ресурса для большей детализации. В нашем случае вышеназванные кинокартины имеют следующее количество ключевых слов.

Во всех фильмах ключевые слова «искусственный интеллект» присутствуют наряду с другими: «геноцид», «насилие», «восстание», «трагический финал», «рабство», «будущее», «темное будущее». Вот лишь небольшой набор, объединенный ключевым понятием «искусственный интеллект». Существенное различие в количестве ключевых слов в фильмах «Терминатор-2» и «Матрица» мы связываем со знаковостью данных произведений и наличием ключевых слов, говорящих об этом, таких как «культ», «жидкий метал», «известный саундтрек». Всё это ключевые слова, свойственные известным и культовым фильмам.

Важно отметить, что мы намеренно не использовали в смысловом ряду вместе со словами «искусственный интеллект» иные, имеющие схожие, если не сказать дублирующие смыслы, например «андроид», «робот», «кибернетический организм», «киборг». Любой, у кого есть желание повторить исследование, может включить фильмы из этой выборки; результат будет схожим.

полную версию книги