Выбрать главу
Недостатки использования веб-журналов в качестве механизма сбора данных

• Веб-журналы прежде всего предназначены для фиксации технической информации (ошибок 404, тенденций использования сервера, типов браузера и т.д.). Они не оптимальны для сбора деловой или маркетинговой информации.

• При необходимости фиксировать дополнительную маркетинговую и коммерческую информацию потребуется плотное взаимодействие с группой информационных технологий и полная зависимость от нее. Это несколько сложнее, чем у других механизмов сбора данных, так что переход на них оправдан.

• Если веб-сервер не устанавливает файлы cookie, идентификация посетителей с любой степенью точности крайне сомнительна.

• Веб-журналы создавались для фиксации всех обращений к серверу. Следовательно, при их использовании для получения точных тенденций трафика и поведения необходимо правильно отфильтровать запросы изображений, ошибки загрузки страниц, трафик роботов, запросы файлов каскадных таблиц стилей (Cascading Style Sheet — CSS) и т.д.

• Кеширование страниц провайдерами (ISP) и прокси-серверами может привести к тому, что некая часть трафика (порядка 10 процентов) окажется неучтенной, поскольку когда некто в сети ISP запрашивает ту же страницу, которую кто-то другой уже запрашивал до него, ISP передаст ее из своего кеша и не будет беспокоить веб-сервер. Следовательно, у владельца веб-сервера не появится в файле журнала запись об этом запросе.

Рекомендация

К лучшему или нет, но в использование веб-журналов как источников данных для веб-анализа внесено не много новшеств. К веб-журналам следует обращаться для анализа поведения роботов поисковой системы, чтобы замерить успешность усилий по ее оптимизации. Для выполнения практически всех остальных типов веб-анализа, которые могут понадобиться, оптимальными будут другие механизмы сбора данных. Веб-журналы, в лучшем случае, можно использовать для дополнения данных, собранных с применением других методик, но будьте готовы к сложностям и большому количеству усилий.

Веб-маяки

Веб-маяки (Web beacon) разрабатывались в те времена, когда в веб царили баннеры в стиле “вырви глаз”, которые “липли” к веб-сайтам, обращения к которым следовало измерить. Компания распространяла баннеры по многим веб-сайтам, и зачастую их оказывалось по несколько на одной странице. Имелась насущная потребность выяснить не только количество людей, видевших баннер и щелкавших на нем, но также и то, сколько раз это был один и тот же человек. Или наоборот, если тому же человеку были предоставлены разные возможности (баннер, текст и т.д.), то что сработало эффективнее?

Веб-маяки — это обычно прозрачные изображения размером 1x1 пиксель, которые помещают на веб-страницу при помощи дескриптора HTML img src. Прозрачные изображения, как правило, находятся на сервере стороннего исполнителя, отличном от сервера, содержащего веб-страницу.

Рис. 2.2 демонстрирует, как веб-маяки фиксируют данные.

Процесс протекает следующим образом:

1. Клиент вводит URL в браузере.

2. Запрос страницы поступает на один из веб-серверов.

Рис. 2.2. Как веб-маяки фиксируют данные

3. Веб-сервер посылает страницу клиенту наряду с запросом прозрачного изображения размером 1 х 1 пиксель, которое находится на сервере стороннего исполнителя.

4. При загрузке страницы она запрашивает изображение размером 1 х 1 пиксель, оповещая таким образом стороннего исполнителя о просмотре страницы.

5. Сервер стороннего исполнителя посылает изображение браузеру пользователя наряду с кодом, способным читать файлы cookie и собирать анонимные данные о посетителе, включая сам факт просмотра страницы, IP-адрес, время просмотра, файлы cookie, которые были установлены ранее, и т.д.

Веб-маяки применимы также в электронной почте (например, информационные бюллетени или рекламные письма, которые мы все получаем). Здесь, как и на веб-странице, в ходе загрузки электронной почты в приложение ее чтения запрашивается прозрачное изображение, и данные о доставке письма отсылаются обратно и записываются. К типичным данным, собираемым таким образом, относится сам факт получения и чтения сообщения, соответственно, адрес электронной почты и любые другие параметры, которые могут быть добавлены в конец запроса прозрачного изображения, встроенного в сообщение электронной почты. С распространением дескрипторов JavaScript использование веб-маяков стало менее популярным; обычно они применяются для отслеживания баннеров и сообщений электронной почты.