Вывод:
всякий раз, говоря о проявлении искусственного интеллекта, на самом деле мы имеем в виду какую-то ограниченную часть деятельности, где работа компьютера оказывается подобной работе человеческого мозга, где компьютер дает результат, подобный результату от человека.
Поисковые технологии
Взглянем на работу поисковых компаний с учетом небольшого ликбеза про цифровой интеллект, а точнее про человекоподобные системы, представленный в предыдущих разделах. Понятно, что под поисковыми компаниями имеются в виду два основных монстра, Яндекс и Гугл.
Для начала отметим неудачность термина «поиск». Этот термин в равной степени относится и к простому текстовому поиску, и к работе сверхмощного поискового алгоритма, основанного на самой современной, высоко профессиональной математике. Приставка «поисковые» появилась у поисковых компаний и у поисковых технологий с самого первого дня их появления в мире. Вероятно, из-за кнопки «поиск» на странице создания текстового запроса. На тот момент приставка была адекватной. Теперь алгоритм поисковых компаний только в малой степени связан с поиском, тем не менее, названия остались и компании не хотят их менять в силу очевидных маркетинговых традиций.
Посмотрим на результат поиска компанией Яндекс в ответ на запрос «ипотека».
Мы сразу видим поражающий воображение факт. Более 700 миллионов веб-страниц содержат в своем тексте слово «ипотека» в той или иной словоформе. Примерно по 5 страниц на каждого жителя России, включая младенцев. Как будто мы все озабочены только ипотекой. Из этого безумного числа алгоритм Яндекса выбрал 10 страниц, что показаны на самых верхних позициях в поисковой выдаче. По мнению Яндекса – это самые важные страницы из ипотечной вакханалии. Самые полезные и информативные для пользователя
Каждый из читателей может легко повторить этот эксперимент и легко проанализировать каждую ссылку из первой десятки. Уверен, абсолютное большинство экспериментаторов сделают одинаковый вывод:
все 10 ссылок сильно привязаны к теме ипотеки.
Задумаемся над результатом. Задача «найти страницы со словом ипотека» является логически простой. Пусть на выходе получается 700 миллионов страниц, но алгоритм вполне понятен. Читаем текст каждой страницы, если есть слово, включаем в список, нет слова – отбрасываем. Как из этого числа получить 10 самых лучших страниц. Существует ли простая формула, пусть длинная, но логически простая, в которую подставляешь слово «ипотека», а на выходе получаешь список из 10 страниц? Автору данной книги подобная формула неизвестна. Как я понимаю, здесь применяются сложные алгоритмы из самой современной математики.
Поскольку общую формулу обозреть невозможно, давайте немного иначе взглянем на работу поискового алгоритма. Попробуем увидеть аналогию с ограниченным тестом Тьюринга. Представим, что параллельно алгоритму Яндекса работает эксперт-человек. Забудем о невозможности прочитать 700 миллионов страниц, допустим, это возможно. После прочтения 700 миллионов страниц эксперт должен составить свою десятку веб-страниц, которые наиболее подходят в качестве отклика на поисковый запрос. Алгоритм отбора может быть попарным, как в кубковых соревнованиях. Эксперт сравнивает две страницы, и из двух страниц отбирает ту, где лучше отображена тема ипотеки. Из двух победителей снова отбирается лучшая, и так до тех пор, пока не останется 10 страниц. Понятно, что отбор будет отражать субъективное мнение эксперта, но сам алгоритм логически понятен и вполне корректен.
Задание можно повторить с большим числом экспертов. Лучшие десятки от всех экспертов можно объединить и сформировать единую лучшую десятку. По мнению автора данной книги, лучшая десятка от экспертов совпадет с десяткой Яндекса. По крайне мере, между ними будет сильная близость (корреляция).
Читатель может самостоятельно повторить данный анализ. Для этого придется потратить некоторое время и проверить страницы с номерами 10-100. Уверен, читатель убедится, что страницы из первой десятки лучше соответствует теме ипотеки, чем страницы из последующих десяток.
Получается, что ответ Яндекса неплохо совпадает с ответом эксперта, пусть и виртуального. Другими словами, алгоритм Яндекса проходит ограниченный тест Тьюринга в случае запроса на слово «ипотека», что означает:
ответ Яндекса становится человекоподобным! Если хочется, можно говорить о том, что ответ Яндекса приготовлен цифровым интеллектом.