Владельцы Интернет магазинов получают от поисковиков массу информации о посетителях своего сайта: возрастной состав, деление на мужчин/женщин, география, ссылки и т.д. Какие страницы ссылаются на магазин. С каких страниц приходят посетители.
У компании Яндекс есть два ресурса, прямо участвующие в сборе данных пользователях:
Вебмастер https://webmaster.yandex.ru/
Яндекс-Метрика https://metrika.yandex.ru/
Большие данные имеют прямое отношение к работе цифрового интеллекта. Все пользователи работают бесплатными экспертами для поисковых компаний. Только два параметра – число загрузок страницы и время пребывания на странице – позволяют строить оценку странице.
Вывод:
пользователи непроизвольно ставят оценки веб-страницам; эти оценки собираются в гигантскую базу данных поисковых компаний.
Интеллект растет на экспертном обучении
Вслед за BigData или даже одновременно поисковики начали применять искусственный интеллект. Еще одна причина обращения к цифровому разуму – это тесное технологическое соприкосновение Больших Данных и цифрового интеллекта.
Современная наука о цифровом интеллекте относится к числу сложнейших наук. Полагаю, передовые достижения этой области могут освоить лишь специалисты с уровнем образования не ниже, чем аспиранты лучших математических факультетов. Просто для общей информации приведу названия разделов в этой науке: машинное обучение; нейронные сети; глубокое обучение; обучение с учителем; предсказание категории; регрессия; кластеризация; выявление зависимости.
Вместе с тем, начальное взаимодействие с цифровым интеллектом очень похоже на воспитание ребенка. Вспомните как ребенка учат выбирать кубики по цвету, или собирать кольца в пирамиду. Ровно эта же процедура применяется в цифровом интеллекте. Машину обучают применять осмысленные решения.
Вот совсем элементарный пример, полностью для чайников, см. следующий рисунок. На вход компьютера поступают объекты в виде привычных нам букв (строка №2). Каждый объект пронумерован цифрами (строка №1). Компьютер должен отобрать те буквы, которые нравятся. Понятно, что категория «нравится» полностью субъективна. Одному нравится, другому нет. Именно по этой причине возникает обучение компьютера. На первых объектах, с номерами от 1 до 7 компьютер переводится в режим обучения. Оценки ставит специальный эксперт, который в цифровой науке имеет еще звание «учитель». Если буква нравится эксперту, он ставит плюс (см. строку №3). Если не нравится, ставит минус. Компьютер устроен так, что может анализировать действия учителя и выявлять причину, по которой одни объекты нравятся, другие нет. В данном случае, причина находится мгновенно, нравятся буквы зеленого цвета.
После процесса обучения компьютер переводится в режим обработки входящих объектов и машина должна самостоятельно, без помощи учителя дать оценку.
Следующий пример также связан с обучением, но объекты немного сложнее. На вход компьютера поступают наборы из 5 символов. Например, так может выглядеть один из наборов:
А Б Н Ф В
Учитель из этого набора делает новый набор:
Б Ф А Н В
В процессе обучения учитель демонстрирует компьютеру несколько подобных примеров из объектов разного начертания. Здесь, как и в предыдущем примере, нетрудно догадаться, что учитель расставляет буквы по жирности шрифта. Сначала буква с самым жирным шрифтом, затем оставшиеся. Современные компьютеры легко решают подобные «детские» задачки.
Следующий пример алгоритмически похож на приведенные «детские», но является абсолютно практическим. В каждом банке перед выдачей кредита надо оценить надежность заемщика, какова будет вероятность невозврата кредита. Кроме традиционных банковских методов, в наше время привлекаются и цифровой интеллект. Первым делом проводится обучение компьютера по реальной базе данных банка. В базе хранятся тысячи профилей заемщиков. В каждом профиле содержатся значения: возраст, образование, должность, уровень зарплаты, впечатление менеджера банка. То есть, профиль выступает объектом на входе интеллекта. В качестве «учителя» выступает сама жизнь, ведь, по каждому профилю имеется факт: возврат либо невозврат кредита. В задачу искусственного интеллекта входит классификация профиля на группы. В простейшем случае возможны лишь две группы: группа с высоким риском невозврата и группа с низким риском невозврата. Более сложные алгоритмы могут присваивать профилю уже численное значение вероятности невозврата.