ПС Яндекс, как правило, выбирает в качестве сниппета наиболее релевантный кусок текста по соответствующему ключевому слову. Предпочтение отдается тексту, расположенному ближе к началу страницы.
Вариант 1 — Если кликабельность участка текста, который выбрал Яндекс, можно улучшить, добавив в него незначительные изменения (можно добавить продающие слова или скорректировать текст так, чтобы плотность ключей в данном участке осталась неизменной), — делаем.
Вариант 2 — Если Яндекс в качестве сниппета выбрал кусок текста из контента страницы, который обладает низкой степенью кликабельности, то необходимо провести работы по увеличению кликабельности сниппета.
Для этого нужно снизить релевантность данного участка текста (убрать ключи) и добавить текст, такой же по объему и плотности ключей, ближе к началу страницы. Также можно найти более подходящий для сниппета участок текста и преобразовать его таким образом, чтобы плотность ключей была аналогична исходному.
1.3. Основные понятия.
TF-IDF — статистическая мера, используемая для оценки важности слова в контексте документа, являющегося частью коллекции документов или корпуса. Вес некоторого слова пропорционален количеству употребления этого слова в документе, и обратно пропорционален частоте употребления слова в других документах коллекции.
TF – частота слова в документе
IDF – обратная частота запроса
TF — (частота слова в документе) - отношение числа вхождения некоторого слова к общему количеству слов документа. Таким образом, оценивается важность слова ti в пределах отдельного документа.
,
где ni есть число вхождений слова в документ, а в знаменателе — общее число слов в данном документе.
IDF (inverse document frequency — обратная частота документа) — инверсия частоты, с которой некоторое слово встречается в документах коллекции. Учёт IDF уменьшает вес широкоупотребительных слов.
,
где
|D| — количество документов в корпусе;
— количество документов, в которых встречается ti (когда ).
Таким образом, мера TF-IDF является произведением двух сомножителей: TF и IDF.
Большой вес в TF-IDF получат слова с высокой частотой в пределах конкретного документа и с низкой частотой употреблений в других документах.
Вхождения в текст, TITLE, strong, H1-6 и др. считаются не только по формуле TF- IDF, но и по модифицированной формуле Okapi BM-25.
Okapi BM25 учитывает длину поля (в данном случае title, strong или h1) в котором произошел хит (встретилось слово запроса). Чем меньше длина — тем выше значение релевантности конкретного хита.
Формула расчета BM
BM25 = IDF + log ((k1+1)*TF)/(k1(1-b)+b(Dl/ArgDl)+TF)),
где b, k1 – const
Dl – длина нашего документа
ArgDl – средняя длина документа
TF считается для каждого слова, BM – для конкретного запроса.
http://ru.wikipedia.org/wiki/Okapi_BM25 - дополнительная информация
2 Техническая оптимизация сайта.
Техническая оптимизация сайта – это комплекс мер, направленных на корректировку технических аспектов сайта, с целью улучшить его взаимодействие с роботами поисковых систем.
Основная задача технической оптимизации – обеспечить максимально полную и быструю индексацию страниц сайта.
2.1 Общие правила
Грамотная техническая оптимизация позволяет роботам поисковых систем хорошо и быстро индексировать сайт, такой сайт не выдает ошибки и сбои в работе, каждой странице сайта соответствует только один адрес и др. Ниже представлены некоторые моменты на которые стоит особенно уделить внимание. Полный список параметров для проверки оптимизатором, которым должен соответствовать сайт согласно технической оптимизации, описан в чек. листе по тех. оптимизации (на портале в разделе «Документы»).
Robots.txt – файл, специально предназначеный для роботов поисковых систем. В этом файле указываются параметры индексирования сайта: какие страницы заносить в поисковую базу, а какие исключить. В нём можно указывать директивы, как для всех роботов поисковых систем сразу, так и для роботов каждой поисковой системы в отдельности.
Про составление этого файла и настройку можно подробнее узнать на сайте помощи вебмастерам от Яндекса http://help.yandex.ru/webmaster/controlling-robot/robots-txt.xml.