Себрант: Расскажи лучше про географию.
Сегалович: Речь вот о чем. Мы в ближайшее время собираемся включить более детальный географический каталогизатор. Нынешний основан только на каталоге, а мы уже научились распознавать сайты и страницы на лету — исходя из IP-адреса, содержания страниц и других факторов. Благодаря этой технологии мы резко увеличим полноту локализованного поиска — текущий алгоритм все же сильно сужает спектр сайтов, доступных для регионального поиска. Объем информации увеличится в разы. Кроме того, география будет помогать отвечать на запрос, который, по нашим представлениям, является географически локализованным. Если человек ищет компьютер в Санкт-Петербурге…
Волож: (перебивает) …то мы будем выдачу немножко подстраивать.
Сегалович: Это тонкий вопрос, будем ли мы подстраивать выдачу. Но это качественно новый уровень продвижения в регионы. У нас, конечно, есть «Яндекс.Города», но это поверхностная локализация. А теперь вся база будет промаркирована посайтно, постранично — что к какому региону относится.
Волож: И если для заграничных сайтов регион — это Россия, то для нас регион — это, скажем, Новосибирская область.
Сегалович: Плюс работа с тематической классификацией. Более глубокое понимание, к какой теме относится сайт. И использование этого понимания при формировании выдачи. В общем, работы много. С «Картинками» работа идет, будем делать новую версию. Поправим, например, ранжирование, на «Картинках» оно пока не очень хорошее.
«КТ»: А насколько это все востребовано? Есть же масса людей, которые днюют и ночуют на одном портале, потому что на нем есть все, что им нужно для жизни.
Сегалович: У меня ощущение, что человек — исключительно требовательное существо. Лично я жутко недоволен «Яндексом». Я к нему отношусь одновременно и с любовью, и с ненавистью, и мне очень стыдно за огромное количество недоработок и недоделок.
Есть какие-то сервисы, которыми вы недовольны?
— Есть любимые, но больные дети, — первым отвечает Илья.
Это, например, кто?
— Ну, например, «Открытки», — печально произносит Себрант.
Илья Сегалович называет «Закладки» и «Народ».
— Но и до них дойдут руки, — философски замечает Волож.
Закладки, кстати, жалко. Идея ведь верная, что блистательно доказал несколько лет спустя del.icio.us.
— Да, любимые, — соглашается Сегалович, — да, жалко.
Аркадий Волож, еще минуту назад хладнокровно комментировавший естественный отбор, благодаря которому выживают лишь самые сильные и востребованные сервисы, неожиданно с какой-то ностальгией произносит: «2001 год. Хороший сервис».
— Модель была неправильная, как мы теперь понимаем, — говорит Сегалович. — Там нет тегов и круга друзей. Но я надеюсь, что мы сделаем revival.
— Мы потихонечку, — вступает Волож. — Руки-то у нас доходят до всего, но «только Аллах может все, и даже Аллах не может все сразу». Главный вопрос, который решается на еженедельных менеджерских встречах, — что мы НЕ делаем. Мы растем очень быстро, у нас уже работает больше трехсот человек, но все равно не успеваем.
«Поиск по блогам и форумам», по мнению присутствующих, — это любимый и здоровый ребенок. Довольно оригинальное на первый взгляд решение — объединить поиск по блогам с поиском по форумам — вызвано тем, что в «Яндексе» особых различий между блогами и форумами не делают: «Первое сообщение форума ничем не отличается от первого сообщения в комьюнити» (Сегалович); «Форумы и блоги — это почти один формат» (Волож). Еще один довод в пользу объединенной индексации — полезность форумов: «Сообщество ru_seo на порядки менее интересно форума на Search-Engines.ru» (Себрант).
— По-хорошему, нужно индексировать все, включая комментарии, что в блогах мы делать пока не умеем, — говорит Сегалович, — но при поиске следует понимать разную ценность разных частей — очевидно ведь, что первое сообщение форума важнее всех остальных. Форумы отдают RSS так, как они его отдают, и отрезать первое сообщение от остальных трудно. Но мы уже умеем искать отдельно по форумам и отдельно по блогам (это появится в ближайшей версии). Они у нас не в одной куче, это только так кажется.
Форумы и блоги отделены от «большого робота», потому что важный признак, объединяющий форумы и блоги и четко отделяющий их от всего остального, — это время. Даже выдача на запрос по умолчанию сортируется по времени.
— Вот эта временная шкала совершенно перестраивает мозги, — продолжает Илья, — это не алгоритм PageRank, а совершенно иная мера.