Выбрать главу

Когда люди спрашивали меня, что будет после Web 2.0, мне не приходилось долго думать над ответом «коллективные интеллектуальные приложения, работающие на данных, поступающих скорее от сенсоров, чем от людей, печатающих на клавиатуре». Определенно, все успехи в области распознавания речи и образов, в определении обстановки на дорогах в режиме реального времени, в области беспилотных автомобилей, зависят от огромного количества данных, собираемых с датчиков на подключенных устройствах.

Текущая гонка автономных транспортных средств – это гонка не только в сфере разработки новых алгоритмов, но и в сфере сбора все бо́льших объемов данных от водителей об обстановке на дорогах и все большей детализации карт мира, создаваемых миллионами невольных участников. Многие уже забыли, что в 2007 году Стэнфорд выиграл соревнования автомобилей-роботов DARPA Grand Challenge, пройдя семимильный маршрут за семь часов. А уже к 2011 году компания Google располагала информацией об обычных автомагистралях общей протяженностью более чем в миллион миль. Их «секретное оружие» – обычные автомобили, снимающие панорамы улиц Google Street View, управляемые водителями-людьми, использующими камеры, GPS и LIDAR (Light Identification Detection and Ranging – обнаружение, идентификация и определение дальности с помощью света) для сбора данных. Как однажды мне сказал директор исследовательской компании Google Питер Норвиг: «Для ИИ это сложная проблема, идентифицировать светофор на видеоизображении. Гораздо проще сказать, зеленый он или красный, когда вы уже знаете, что он там находится». (Годы спустя после этого высказывания Питера первая задача стала для ИИ легче, но идею вы поняли.)

Сегодня такие компании, как Tesla и Uber, претендуют на лидерство в сфере беспилотных автомобилей, потому как обладают большим парком автотранспортных средств – автомобилями, датчики которых используются не только для выполнения поставленной задачи, но и для формирования вклада в алгоритмические системы будущего. Но запомните: эти машины управляются людьми. Обработка данных, которые они фиксируют, станет следующим этапом в использовании коллективного разума миллиардов людей, оснащенных привычными инструментами.

Данные – это intel inside следующего поколения

Тезис о вкладе пользовательских данных в коллективный интеллект звучит как песня кумбая[4]. И в первые годы нового века многие люди, прославлявшие сайты, созданные пользователями, такие как Wikipedia или новые сетевые средства массовой информации, такие как блоги, считали идею утопической. Я доказывал, что эти данные окажутся ключом к обретению ведущего положения на рынке для таких компаний, как Google и Amazon. Как я заметил в то время в одном разговоре: «Использование коллективного разума» – это то, чем начинается революция Web 2.0; «Данные – это Intel Inside» – то, чем она заканчивается».

Intel была той компанией, которая вместе с Microsoft захватила монопольное положение на рынке персональных компьютеров, вследствие чего на каждом ПК красовалась наклейка INTEL INSIDE. Компания Intel добилась этого, став единственным поставщиком процессоров, мозга ПК. Microsoft добилась этого, контролируя доступ к своей операционной системе.

Программное обеспечение с открытым исходным кодом и открытые сетевые протоколы передачи данных изменили правила игры для Microsoft и Intel. Но моя карта сказала мне, что игра на этом не заканчивается. В соответствии с Законом сохранения привлекательной прибыльности Клейтона Кристенсена я знал: станет ценным что-то еще. Те самые данные. В частности, я считал, что накопление критической массы данных, предоставляемых пользователями, привело к самоусиливающимся сетевым эффектам.

Термин «сетевой эффект», как правило, относится к системам, которые приносят тем больше пользы, чем больше людей ими пользуются. Телефон сам по себе не особенно полезен, но, как только он появляется у достаточного количества людей, очень сложно не присоединиться к сети. Таким образом, конкуренция социальных сетей заключалась в привлечении как можно большей базы пользователей, поскольку захват цели осуществляется не через программное обеспечение, а через количество других людей, пользующихся одной и той же услугой.

Сетевые эффекты, которые я наблюдал относительно пользовательских данных, носили в большей степени косвенный характер и были обусловлены тем, каким образом компании учатся получать выгоду от пользователей своих систем. У Barnes & Noble были все те же продукты, что и у Amazon, но у Amazon было намного больше отзывов и комментариев пользователей. Люди заходили в эту сеть не только ради продуктов, но и ради информации, добавленной другими пользователями. Кроме того, в дополнение к превосходным алгоритмам Google и постоянным улучшениям продукта, поисковая система Google продолжает улучшаться еще и благодаря тому, что ее использует большое количество людей, а это значит, что Google может накапливать больше данных и, следовательно, учиться быстрее, чем конкуренты, оставляя их далеко позади.

вернуться

4

Песня в жанре спиричуэлс, впервые записана в 1920-е годы. (Прим. ред.)