• Не у всех посетителей веб-сайта разрешено выполнение кода JavaScript, зачастую для защиты его отключают. Об этих пользователях платформа аналитики не сможет собрать никаких данных. Реальная статистика отсутствует, но примерно у 2-6 процентов посетителей установлена защита от JavaScript, в результате они окажутся невидимы.
• Данные, собираемые при помощи дескрипторов JavaScript, отделены от других метаданных. Следовательно, практически неизбежно понадобится более тщательное обдумывание и планирование при создании дескриптора, который будет фиксировать таксономию сайта и его иерархию с учетом оптимальности анализа. По мере развития сайта это может превратиться в напряженный процесс, требующий регулярного обслуживания.
• Сбор данных при помощи дескрипторов JavaScript базируется на “стороне браузера”, а не на “стороне сервера”. Некоторые веб-сайты, вместо того чтобы хранить данные в файлах cookie или параметрах URL, хранят их в течение сеанса посетителя на сервере. В таком случае, дескрипторы не зафиксируют существенной информации. Если принятая стратегия подразумевает содержание ключевых данных на сервере, а не в браузере (машине посетителя), то дескрипторы могут не подойти (либо придется пройти процедуру изменения стратегии информационной технологии).
• Фиксация данных о загрузке (например, файлов PDF или EXE) и переадресации при помощи дескрипторов JavaScript сложнее, чем с использованием веб-журналов, хотя некоторые исполнители предпочитают интеллектуальные решения.
• Если веб-сайт чересчур перегружен большим количеством дескрипторов JavaScript, пытающихся сделать побольше умных веб-аналитических вещей, то не исключены конфликты между дескрипторами. В некоторых случаях последние для сбора данных просто неприменимы (они не позволяют веб-сайту функционировать).
Возможность применения дескрипторов JavaScript при сборе данных следует рассмотреть в первую очередь. Большинство новшеств веб-аналитики исходят от тех производителей, которые совершенствуют свои инструменты в области использования дескрипторов JavaScript. Кроме того, их применение может быть оптимальным при необходимости управления собираемыми данными, что позволяет группе аналитики фиксировать именно то, что нужно. Единственное возможное дополнение — это использование веб-журналов для замера оптимизации поисковой системы (Search Engine Optimization — SEO), а также поведения веб-роботов на веб-сайте.
Анализ пакетов (packet sniffing) — один из наиболее технически сложных способов сбора веб-данных. Появившись практически одновременно с другими, эта методика по ряду причин не стала столь же популярной, как другие, описанные в данной главе. Среди производителей, предоставляющих решения веб-аналитики на базе анализа пакетов, следует отметить Clickstream Technologies. Появляются также некоторые интересные способы применения анализаторов пакета, например SiteSpect использует данную технологию для многопараметрической проверки, устраняя необходимость в применении дескрипторов на веб-сайте.
Процесс сбора данных с использованием анализа пакетов представлен на рис. 2.5.
Рис. 2.5. Сбор данных с использованием анализа пакетов
Сбор данных осуществляется в пять этапов.
1. Клиент вводит URL в браузере.
2. Запрос направляется на веб-сервер, но прежде чем достигнуть его, он проходит через программный или аппаратный анализатор пакетов, который может фиксировать атрибуты запроса и другие данные о посетителе.
3. Анализатор пакетов пересылает запрос на веб-сервер.
4. Результат запроса возвращается клиенту, но сначала проходит через анализатор пакетов. Последний фиксирует информацию о возвращении страницы и хранит эти данные. В некоторых решениях на базе анализа пакетов используются также дескрипторы JavaScript, которые могут возвращать анализатору пакетов большее количество данных о посетителе.
5. Анализатор пакетов пересылает страницу браузеру посетителя.
Анализатор пакетов может быть программой, установленной на веб-сервере и выполняющейся “поверх” его уровня данных. Это может быть и физический компонент аппаратных средств, который подключен к центру данных и пропускает весь трафик веб-сервера через решение анализатора пакетов.