По поиску в портале вся статистика открыта. Шестьдесят процентов пользователей Интернета пользуется поиском на «Яндексе» (еще 20 процентов у «Рамблера», по шесть процентов у Google и Mail.ru). От контекстной рекламы, которая завязана на услугу поиска, мы получаем порядка 80 процентов всех доходов. Остальное это баннеры и всякая мелочевка типа продажи ПО — «Спамообороны» и «Яндекс.Сервер». По сравнению с другими порталами баннеры для нас — сравнительно небольшая часть дохода, но, возможно, в этом году что-то изменится. Большие рекламодатели — в частности, Video International — собираются в этом году прийти в Интернет. Если это произойдет, то рынок будет расти не только за счет контекста, как сейчас, но и за счет медийной рекламы. И через год-два доля Интернет-рекламы от рекламного рынка будет не два процента, как сейчас, а четыре.
«Яндекс.Деньги» не считаем?
— А там нулевой доход. Не совсем, конечно, ноль, но так… Внизу, на радарах. «Яндекс.Деньги» растут очень быстро, но пока потребляют все, что зарабатывают.
Введение веб-интерфейса благотворно повлияло на популярность проекта?
— Дааааааааа! — Это Себрант на минутку оторвался от ноутбука и включился в разговор.
— Введение веб-интерфейса расширило аудиторию «Яндекс.Денег» за счет офисных людей, — кивает Волож. — До этого нашей платежной системой пользовались в основном веб-мастеры, гики, люди, которые в Интернете давно. А сейчас пришли простые офисные сидельцы. Теперь им удобно. Сдвиг виден по тому, как сместились платежи. Раньше пользователи платили либо за интернет-услуги (хостинг, к примеру), либо друг другу. Сейчас же пошли и коммунальные платежи, и телефон. Изменилась и средняя сумма платежа — у пользователей «новой волны» она меньше.
Место действия: большая переговорная в старом офисе «Яндекса».
Действующие лица те же.
Сегалович: Наша задача — обеспечить пользователю идеальную подборку ссылок на его запрос, как мы его пониманием. То есть все упирается в уровень понимания запроса. А это понимание обусловлено не только текстом, но и контекстом запроса. Например, география пользователя или тематический класс, к которому этот запрос относится по ассоциациям запроса других пользователей.
Вот классический пример. Человек вводит в строку поиска слово «жизнь». Что выдавать? Что он ожидает увидеть?
«КТ»: Да какая разница? Все равно понятно, что этот человек — идиот.
Сегалович: Вы почти угадали. Но этот запрос можно понять. Оказывается, люди так ищут газету «Жизнь».
«КТ»: А нет опасности, что вы додумаете что-то не то?
Сегалович: Конечно, есть. Но это статистический процесс, и мы обязаны давать лучшую аппроксимацию, чем сейчас. Наша задача — как можно точнее (с помощью статистики, лингвистики, понимания запроса на уровне технологии отвечания на вопросы) понимать, что именно человек спросил, и максимально точно ответить на его запрос.
«КТ»: А вообще, с поисковым движком много работы? Или все основные задачи уже решены и теперь идет подкрутка?
Волож: (бледнеет от возмущения) Да вы что, это же главный проект компании…
Сегалович: Работы море. Во-первых, мы должны лучше научиться распознавать истинную ценность информации и лучше отличать оптимизированные страницы от неоптимизированных. Кроме того, идет работа с ядром, улучшение базовой функциональности. Мы видим, что и где можно улучшить. Мы хотим, чтобы качество ответов повышалось, и мы знаем, где мы плохо отвечаем.
«КТ»: Это где, например?
Сегалович смотрит на Воложа. Волож смотрит на Себранта. Себрант смотрит в ноутбук.
Сегалович: Ну, если в общем виде, то мы когда-то первыми стали аккуратно искать по всем словоформам. И концептуально это очень правильная вещь, которая работает у нас почти в неизменном виде уже много лет. Но иногда ее полезно отключать. Мы умеем это делать, но не на уровне ядра. Вот вам одно направление. На уровне ядра будем также работать над поддержкой многоязычности, постараемся реализовать возможность включения в запрос не только букв, но и специальных символов. Кроме того… (Воложу) Мы это не анонсировали еще, да?
Далее следует бурный обмен междометиями и жестами, которые должны пояснить собеседнику, какое именно «это» имеется в виду. Через минуту Волож, воспользовавшись знанием лингвистики и глубоким пониманием контекста, пожимает плечами: мол, сам решай. Сегалович решает ответить, но полезной информации в его ответе чуть больше, чем на среднестатистическом дорвее.
Сегалович: У нас на новостях справа есть колоночка, в которую выводятся имена людей, упомянутых в сюжетах. В общем, в этом направлении будем работать.
Себрант: Расскажи лучше про географию.
Сегалович: Речь вот о чем. Мы в ближайшее время собираемся включить более детальный географический каталогизатор. Нынешний основан только на каталоге, а мы уже научились распознавать сайты и страницы на лету — исходя из IP-адреса, содержания страниц и других факторов. Благодаря этой технологии мы резко увеличим полноту локализованного поиска — текущий алгоритм все же сильно сужает спектр сайтов, доступных для регионального поиска. Объем информации увеличится в разы. Кроме того, география будет помогать отвечать на запрос, который, по нашим представлениям, является географически локализованным. Если человек ищет компьютер в Санкт-Петербурге…
Волож: (перебивает) …то мы будем выдачу немножко подстраивать.
Сегалович: Это тонкий вопрос, будем ли мы подстраивать выдачу. Но это качественно новый уровень продвижения в регионы. У нас, конечно, есть «Яндекс.Города», но это поверхностная локализация. А теперь вся база будет промаркирована посайтно, постранично — что к какому региону относится.
Волож: И если для заграничных сайтов регион — это Россия, то для нас регион — это, скажем, Новосибирская область.
Сегалович: Плюс работа с тематической классификацией. Более глубокое понимание, к какой теме относится сайт. И использование этого понимания при формировании выдачи. В общем, работы много. С «Картинками» работа идет, будем делать новую версию. Поправим, например, ранжирование, на «Картинках» оно пока не очень хорошее.
«КТ»: А насколько это все востребовано? Есть же масса людей, которые днюют и ночуют на одном портале, потому что на нем есть все, что им нужно для жизни.
Сегалович: У меня ощущение, что человек — исключительно требовательное существо. Лично я жутко недоволен «Яндексом». Я к нему отношусь одновременно и с любовью, и с ненавистью, и мне очень стыдно за огромное количество недоработок и недоделок.
Есть какие-то сервисы, которыми вы недовольны?
— Есть любимые, но больные дети, — первым отвечает Илья.
Это, например, кто?
— Ну, например, «Открытки», — печально произносит Себрант.
Илья Сегалович называет «Закладки» и «Народ».
— Но и до них дойдут руки, — философски замечает Волож.
Закладки, кстати, жалко. Идея ведь верная, что блистательно доказал несколько лет спустя del.icio.us.
— Да, любимые, — соглашается Сегалович, — да, жалко.
Аркадий Волож, еще минуту назад хладнокровно комментировавший естественный отбор, благодаря которому выживают лишь самые сильные и востребованные сервисы, неожиданно с какой-то ностальгией произносит: «2001 год. Хороший сервис».