В другой раз мне понадобилось просмотреть работу Мулхерина о катастрофе "Челленджера", которую я упомянул ранее. Я не мог вспомнить имя автора и набрал "реакция фондового рынка на катастрофу Челленджера". Мне было предложено 2370 веб-страниц. На первой была статья в Slate Дэниэла Гросса о работе Мулхерина. Третьей была собственная страница Мулхерина со ссылкой на запрашиваемый мною отчет. Поиск (в котором, если помните, не присутствовало имя автора) занял 0,10 секунды. Несколько минут спустя я поискал текст песни Рамона о том, как Рональд Рейган посетил кладбище в Битбурге, и это заняло 0,23 секунды, и первая ссылка в списке оказалась именно той, которую я искал.
Если вы регулярно пользуетесь Интернетом, эти примеры эффективности Google вас не удивят. Мы привыкли ожидать от поисковой системы мгновенного ответа с нужной нам страницей в начале списка. Но все же давайте копнем немного глубже и попробуем разобраться в том, что же происходит в эти десятые доли секунды. Каждый раз Google пролистывает миллиарды веб-страниц и выбирает именно те, которые точнее соответствуют запросу пользователя. Суммарное время всех упомянутых мною поисков заняло примерно полторы минуты.
Google была создана в 1998 году, когда лидером бизнеса поисковых систем была Yahoo!, a AltaVista и Lycos наступали ей на пятки. Но уже спустя два года самой популярной поисковой системой среди постоянных пользователей Интернате стала Google — только потому, что она действует быстрее и предоставляет самые точные результаты поиска. Способ же, которым она этого добивается (пролистывая при каждом запросе три миллиарда веб-страниц), построен на мудрости толпы.
Создатели Google не раскрывают все детали своей технологии, но известно, что сердцевиной системы является алгоритм PageRank, который был описан основателями компании Сергеем Брином и Лоренсом Пейджем в теперь уже легендарной работе 1998 года The Anatomy of a Large-Scale Hypertextual Web Search Engine. PageRank — это алгоритм (метод калькуляции), согласно которому все страницы в Интернете сами решают, какие из них лучше соответствуют критериям заданного поиска. Вот как объясняет это сама Google: PageRank пользуется преимуществами уникальных демократических особенностей Сети, применяя в качестве инструмента организации поиска широчайшую структуру ссылок. По сути, Google интерпретирует ссылку страницы А на страницу Б как голос, отданный страницей А в пользу страницы Б. Google оценивает соответствие страницы критериям заданного пользователем поиска по числу полученных ею голосов. Однако Google учитывает не просто число голосов или ссылок; система анализирует также страницу, отдавшую голос. Голоса, отданные страницами, которые заслуживают доверия, оцениваются выше и помогают определить другие страницы как достаточно надежные.
В эти десятые доли секунды Google сканирует всю Всемирную сеть, чтобы решить, какая из ее страниц содержит наиболее полезную информацию, и страница, получившая большинство голосов, помещается на первое место в итоговом списке. И эта страница или стоящая в списке сразу за ней чаще всего оказывается именно той, в которой содержится самая ценная информация.
В настоящее время система Google — это республика, но не идеальная демократия. Как гласит описание, чем больше людей обращаются к странице, тем больше повлияет эта страница на окончательное решение. Заключительное голосование — это "взвешенное среднее" (так же, как курс акции или разброс результатов игр НФЛ), отличающееся от простого среднего, как в случае с оценкой веса каких-то предметов. Тем не менее крупные порталы, имеющие большее влияние на окончательный вердикт толпы, получают его лишь благодаря голосам, которые отдали им мелкие сайты. В противном случае релевантность поиска Google не оказалась бы столь высокой. Итак, и здесь правит толпа. Мудрость на вершине системы обеспечивается разумностью по всей ее вертикали.
Если возможность делать ставки на результаты спортивных игр в конечном итоге ведет к созданию механизма, успешно предсказывающего итоги состязаний, возникает закономерный вопрос: будут ли ставки на другие события так же успешны, если исход предскажет группа? Зачем ограничивать себя информацией о шансах команды Лос-Анджелеса против команды Сакраменто, если есть способ узнать, какова вероятность, скажем, у Джорджа Буша обойти на президентских выборах Джона Керри?
Способ определить шансы Джорджа Буша на победу существует — это опросы общественного мнения. Если хотите узнать, как собираются голосовать люди, спросите у них. Опросы общественного мнения дают относительно точные результаты. В их основе лежит солидная методология, и они статистически скрупулезны. Но есть причина задуматься о том, не может ли рынок спортивных тотализаторов (который позволяет его участникам опираться на многие виды информации, включая опросы, но не ограничиваясь ими) предложить альтернативную конкуренцию институту Гэллапа. Именно поэтому появился Iowa Electronic Markets (IEM) ("Электронный рынок штата Айова").