Зачем нужна аналитика, как и чем лучше собирать статистику сайта?

2 Октябрь, 2014

Здравствуйте, уважаемые читатели блога KtoNaNovenkogo.ru. Не так давно я опубликовал статью «Как работает Google Analytics». Там мы познакомились с этой бесплатной системой аналитики как бы изнутри, т.е. узнали, как собираются данные, как они обрабатываются, хранятся, и как на их основе формируются нужные нам отчеты.

Эти знания безусловно нам пригодятся в дальнейшем. Ну, а сейчас я хочу уже непосредственно перейти к разговору об аналитике, как таковой. Для чего она нужна? Какие способы анализа сайта существуют и какие критерии эффективности при этом стоит отслеживать.

Также мы посмотрим, каким образом осуществляется сбор статистики сайта, какие методы и инструменты при этом чаще всего используются, а главное — каким образом эти самые данные снимаются. В связи с этим мы подробно остановимся на таких понятиях, как посетитель, сессия и хит, которые являются основой всей веб-аналитики. Без понимания этих вещей вам очень трудно будет дальше постигать все тонкости повышения эффективности вашего сайта, о котором мы будем говорить в статьях этой рубрики.

Что отслеживать и как ставить задачи для аналитики?


Из приведенной чуть выше статьи мы с вами узнали, что, по сути, система Google Analytics состоит из нескольких блоков, основными из которых можно считать:

  1. Инструмент сбора данных
  2. Инструменты анализа, обработки и отображения собранных статистических данных

Для чего же нам могут понадобиться подобные системы аналитики? Давайте посмотрим:

  1. Самое очевидное это, кончено же, оценка текущей посещаемости вашего сайта (трафика, через него проходящего). Это может быть суточная посещаемость, источники трафика, показатель отказов, время и глубина сессии, точки входа и выхода, поисковые запросы, по которых заходили пользователи, и многое другое, о чем мы довольно подробно говорили в статье про то, как узнать посещаемость своего или чужого сайта. В принципе, большинство владельцев сайтов на этом и останавливаются, считая, что в этом как раз и заключается вся аналитика.
  2. Также мы обычно сравниваем текущую посещаемость сайта с тем, что было раньше. Если идет рост трафика, то хорошо, а если падение, то мы начинаем лихорадочно искать причины этого и зачастую находим (как это, например, было со мной полтора года назад после попадания моего блога под фильтр Яндекса). Наблюдение за посещаемостью, таким образом, позволяет в общих чертах понять, в правильном ли направлении вы движетесь, и вовремя забить тревогу, когда возникают проблемы по тем или иным причинам.
  3. Естественно, что глядя на динамику развития можно делать прогнозы на будущее, хотя тут уж очень много форс-мажоров может вмешаться. Но общую тенденцию развития все равно увидеть можно.

Это в общих чертах, а вообще аналитика нужна именно для улучшения положения дел с вашим сайтом (и бизнесом). Благодаря ей вы сможете что-то измерить и отследить влияние вносимых вами изменений на какие-то важные для вас характеристики (посещаемость, конверсию и т.п.). То, что измерить нельзя, также не получится и осмысленно улучшить, поэтому так много внимания последнее время все SEO специалисты уделяют сбору статистики, ее обработке и анализу. Дело это не простое, но очень перспективное.

Что именно вам нужно отслеживать с помощью систем подобных Гугл Аналитикса, зависит от типа вашего сайта. В принципе, вариантов не так уж и много, поэтому давайте их просто перечислим:

  1. Продажи — актуально для онлайн-коммерции
  2. Сбор лидов — например, регистраций на сайте, подписок на новостную ленту, заполнений формы заказа и т.п. Актуально для многих видов ресурсов, которые собирают коллекции различных действий пользователей, чтобы потом их монетизировать тем или иным способом.
  3. Вовлеченность аудитории и посещаемость ресурса — актуально для информационных и новостных ресурсов
  4. Помощь пользователям в поиске информации — актуально для информационных ресурсов типа поисковых систем, каталогов, энциклопедий и т.п.
  5. Повышение узнаваемости торговой марки, а также лояльности аудитории к ней — актуально при брендировании, т.е. раскрутке бренда

Соответственно, вам нужно будет понять к какому типу относится ваш проект, и на основе этого вы уже будете выбирать те показатели его эффективности, которые следует отслеживать с помощью системы аналитики (Гугла или Яндекса — не важно). В теории процесс постановки задач, которые призвана будет решать аналитика, выглядит довольно-таки просто:

  1. Определяем бизнес-цели — скорее всего, это будет что-то вроде повышение спроса на ваш продукт
  2. Разрабатываем стратегии. К примеру, первой стратегией будут собственно продажи продукта, а второй — его брендирование. Разрабатываем методы реализации стратегий, т.е. тактику. Например, для реализации стратегии продаж продукта можно использовать две тактики — онлайн продажи в самом интернет-магазине и оффлайн продажи в реальном магазине, куда вы будете привлекать пользователей с сайта какими-нибудь заманухами в виде купонов, бонусов или акций. Ну, а для реализации стратегии повышения лояльности (брендирования) можно создать блог-спутник, где обсуждать что-то актуальное и интересное.
  3. Выбираем ключевые показатели эффективности (KPI). Например, для онлайн-продаж продукта это будут, скорее всего, доходность и средний чек, а для продаж оффлайн это может быть, например, число распечатанных купонов с вашего сайта, по которым пользователи получат какую-то скидку. В случае блога-спутника KPI могут служить, например, число расшариваний постов в социальные сети и частота возрата пользователей на блог (формирование ядра посетителей). Среди наиболее часто используемых показателей эффективности можно выделить:

    1. ROI — коэффициент возврата инвестиций, который показывает какой процент от потраченных денег вы вернули. Считается по формуле: (прибыль минус затраты) деленное на затраты и помноженное на сто процентов. Отрицательное значение означает убытки, а положительное — прибыль. Например, получив прибыль в размере 1200 рублей, но потратив 1500, вы получите ROI равное «-20%» (на двадцать процентов в минус ушли).
    2. ROAS — этот показатель часто применяется для наглядного отображения расходов на рекламу. Считается он по простой формуле: прибыль делится на затраты (чаще всего это именно рекламные бюджеты) и умножается на сто процентов. Вместо него иногда используют коэффициент ДРР (доля рекламных расходов), который высчитывается по обратной формуле — затраты делятся на прибыль и все это умножается на сто процентов. Он показывает долю расходов на рекламу в общем объеме доходов и часто используется рекламными агентствами в рунете.
  4. Разбиваем (сегментируем) аудиторию по каким-то важным показателям. Наверное следует отслеживать эффективность различных каналов привлечения пользователей на ваш сайт, что может служить одним из показателей сегментации (из контекстной рекламы, из поисковых систем, из социальных сетей и т.д.). Также может быть интересно, например, разделение по географическому признаку — откуда зашел на сайт тот или иной посетитель. Или по принципу — новый это посетитель или вернувшийся.
  5. Настраиваем цели в той системе статистики, которую будем использовать

Самое неприятно заключается в том, что все описанное выше, по-хорошему, нужно продумывать еще до того, как вы создаете сайт. Зачастую уже готовый и работающий интернет-проект очень сложно бывает привести к такому виду, что можно было бы мерить нужные показатели эффективности. Без всего этого использование мощнейших систем аналитики на вроде Google Analytics становится не более эффективным, чем забивание гвоздей микроскопом.

Основные варианты сбора статистики вашего сайта


Однако, абстрагируемся от этого и допустим, что по всем вышеозначенным пунктам у вас появились более-менее осмысленные ответы. После этого встает вопрос — а каким образом можно собирать нужные нам для анализа данные. Как я уже упоминал в статье про статистику посещаемости сайта, технически сбор данных можно реализовать двумя способами:

  1. Собирать их непосредственно на веб-сервере, где находится ваш сайт, фиксируя все запросы к нему. Для этого используются данные журналов и логов сервера, а также специально предназначенные для этого скрипты. Данный способ имеет свои плюсы и минусы:
    1. На своем сервере придется кроме сайта еще хранить и большие объемы собранных статистических данных, что может потребовать дополнительных затрат.
    2. Встроенные серверные механизмы не обладают широкими возможностями по сбору статистики, в результате чего серверная аналитика чаще всего уступает тому, что можно получить вторым способом (читайте об этом чуть ниже).
    3. Однако те данные, которые все-таки возможно собрать, будут отличаться очень высокой точностью, ибо они собираются на сервере прямо в момент запроса, что приводит к минимуму потерь.
    4. Вся собранная вами статистическая информация будет принадлежать вам и никому более. Вы не зависите в этом случае от правил внешних систем аналитики, о которых пойдет речь чуть ниже.

    В плане технической реализации такой метод представляет из себя программу, которая устанавливается непосредственно на сервер, где, собственно, ваш сайт и расположен. Самые популярные из серверных систем аналитики:

    1. Awstat — весьма популярная система, которая зачастую устанавливается хостерами на сервера по умолчанию.
    2. Piwik — очень мощный инструмент, который по возможностям ничем не уступает, например, такой популярной клиентской системе сбора статистики, как Яндекс Метрика (хотя вебвизора в пивике, конечно же, нет).
    3. Loganalyzer — чуть более продвинутая аналитика, чем у Awstat.
    4. Weblog Expert — тоже похож по сути на Awstat.
  2. Но в то же время собирать нужные данные можно и непосредственно в браузерах пользователей, которые ваш сайт посещают. Есть такой клиентоориентированный язык программирования под названием JavaScript, команды которого можно включать в Html код вебстраницы. Как раз на этом принципе и работает большинство счетчиков посещений и систем аналитики вроде Гугл Аналитикса или Яндекс Метрики.

    Вы добавляете на все страницы вашего сайта предлагаемый вам фрагмент кода, который выполняясь будет собирать все необходимые данные из браузеров посетителей вашего сайта (и потом ее передает на сервера системы аналитики, которую вы используете). У этого способа тоже имеются свои плюсы и минусы:

    1. Собранные данные будут не такими точными, как в случае серверной статистики. Степень этой неточности определить довольно сложно, и зависит она как от используемых методов, так и от случайных обстоятельств (в браузерах каких-то пользователей может быть принудительно отключено исполнение команд, записанных на ДжаваСкрипте, или же вы забыли внедрить скрипт в какие-то отдельные страницы своего сайта).
    2. Все данные будут собираться и храниться на серверах третьей стороны (системы аналитики, которую вы используете). Правда, в этом случае будет ограничен срок их хранения, да и ваш доступ к данным в исключительных случаях (утерян пароль, нарушены правила использования и т.п.) может быть ограничен. По сути, эти самые данные и являются вашей платой за бесплатность большинства из этих сервисов, которые могут использовать эту огромную статистическую базу по огромному числу сайтов как в своих целях, так и передавать, например, заинтересованным игрокам рынка поиска за деньги.
    3. То, что массивы с собранным данных не нужно будет хранить на своем сервере, является одновременно и положительным моментом, ибо это не потребует дополнительных затрат, как в случае с серверной статистикой.
    4. Возможности аналитики клиентских систем (тех, кто снимает данные в браузерах пользователей, т.е. клиентах), как правило, серьезно превосходят серверные аналоги.

    Примерами клиентских систем сбора статистики могут служить:

    1. Рамблер Топ 100 — те ресурсы, которые разместят у себя этот счетчик, автоматически попадают в данный рейтинговый каталог (довольно-таки трастовый).
    2. Hotlog — еще один счетчик статистики, на основе которой выстраивается рейтинг самых посещаемых сайтов в тематике.
    3. Лайвинтернет — самый популярный в рунете способ сбора статистики своего сайта.
    4. Top.mail.ru — довольно популярный в рунете рейтинг сайтов.
    5. OpenStat — чуть более продвинутая система сбора статистики с рейтингом сайтов, которые установили их счетчик.
    6. Яндекс Метрика — это уже полноценная система сбора и анализа статистических данных сайта, имеющая довольно увесистый бриллиант в своей короне — вебвизор.
    7. Google Analytics — самая продвинутая из всех доступных бесплатно систем аналитики. Вообще, довольно давно Аналитикс назывался немного иначе и был платной системой (несколько сотен долларов в месяц за то, чтобы узнать посещаемость и сопутствующие ей параметры), но потом его купил великий и ужасный Google, после чего сделал доступным всем желающим. Однако, несколько лет назад появилась платная версия Analytics для крупных сайтов, которая имеет расширенный функционал.
    8. Adobe SiteCatalyst — основной конкурент платной версии Гугл Аналитикса. Данный пакет тоже платный, и имеет довольно-таки высокую популярность в буржунете.
    9. WebTrends — тоже довольно мощный инструмент, широко распространенный в буржунете.

    Мы с вами в продолжении этой серии статей будем рассматривать именно клиентские системы сбора статистики, поэтому поговорим о них поподробнее.

Как работают системы аналитики при сборе статистики сайта?


Итак, на практике сбор статистики сайта в клиентской системе осуществляется с помощью внедрения во все его страницы небольшого фрагмента кода, написанного на ДжаваСкрипте. Хотя, по сути, это не сам код, а лишь способ его вызова. Сам же код сбора статистики довольно-таки объемный, и загружается он одновременно с загрузкой этой вебстраницы с серверов Гугла или Яндекса (в случае использования Аналитикса и Метрики, соответственно), если, конечно же, ранее он не был закеширован в браузере пользователя.

Браузер этот код исполняет, запуская его в своем интерпретаторе ДжаваСкрипта. В результате собираются и отправляются на сервера Яндекса или Гугла различные данные (что за страница, откуда на нее пришел посетитель, какие куки хранятся для него в браузере, какое у него разрешение экрана, какой браузер, какая ОС и многое другое). А уже далее собранная статистика хранится в базе данных той системы аналитики, которую решили использовать.

К этим данным уже обращается система аналитики, когда мы через ее веб-интерфейс пытаемся посмотреть те или иные отчеты по своему сайту. На основании этих отчетов мы можем уже проводить дальнейший анализ. Вот и все, очень просто. Если говорить о мобильных приложениях, то, как я уже упоминал в статье про работу Google Analytics, там для отслеживания используется не ДжаваСкрипт код, а так называемый пакет средств разработчика (SDK). Статистические данные, снятые в мобильных приложениях, отправляются не постоянно, а пакетами через определенное количество времени.

Все собранные кодом отслеживания статистические данные, которые прошли обработку, будут вам доступны в виде отчетов в веб-интерфейсе системы аналитики. В Google Analytics в основе всех отчетов лежат комбинации параметров (метрик) и показателей (измерений).

Однако для того, чтобы в дальнейшем нам с вами разговаривать на одном языке, нужно будет дать определения тем основным понятиям (терминам), которые мы будем использовать. В общем-то я говорил о них в статье про Гугл Аналитикс (см. ссылку в начале этой публикации), но не мешает это повторить.

При анализе статистики сайта используются три основных понятия: хиты, сессии и пользователи. Все собранные статистические данные в любой системе аналитики организованы иерархически по трехуровневой системы. В самом низу находятся хиты, чуть выше расположены сессии, ну, а в самом верху — пользователи.

Таким образом хиты являются составляющей частью сессии (набор действий, совершенных за время визита данного пользователя на сайт), а набор сессий характеризует уже поведение пользователя на сайте (сколько раз он заходит на сайт и как долго продолжались его визиты). Давайте рассмотрим все это более подробно и досконально:

  1. Хиты (взаимодействия) — это действия пользователей на сайте. В физическом же плане хитом называется любая передача информации из браузера пользователя на сервера системы аналитики (в случае Гугл Аналитикса данные передаются в Get запросе на подгрузку прозрачной гиф картинки размером в один пиксел). Отправка хита происходит после исполнения ДжаваСкрипт кода счетчика, который вы встроили во все страницы сайта. Если страница перезагрузится, то будет отправлен еще одни хит.

    Именно хит является самым маленьким кирпичиком, на котором строится все здание аналитики. Хитом может быть открытие (обновление) страницы, событие (например, нажатие кнопки), которое происходит без перезагрузки страницы, а также многое другое. Например, оплата товара в интернет-магазине, расшаривание страницы в социальные сети или лайк, измерение интервала времени между какими-то событиями и т.п.
  2. Сессия (более понятным, на мой взгляд, является термин сеанс или визит) — это время, проведенное на сайте или в приложении. По сути, это коллекция хитов (действий) одного посетителя, которые объединены вместе. По какому принципу идет объединение? По принципу непрерывности. Сессия считается прерванной, если пользователь в течении получаса не предпринимал никаких действий на сайте (это время называется тайм-аутом).

    В этом случае время сессии фиксируется, как интервал между первым и последним хитом (действием), хотя пользователь мог читать страницу или смотреть видеоролик, еще какое-то время никаких действий на сайте не предпринимая. В связи с этим делаем вывод, что время, проведенное пользователем на сайте, измерить точно пока не представляется возможным. К сожалению, некорректная интерпретация собранных статистических данных является ахилесовой пятой современной веб-аналитики.

    Однако, время таймаута (простоя, после которого сессия считается завершенной) и в Google Analytics, и в Яндекс Метрике можно изменить, если специфика вашего сайта этого потребует. Это позволит несколько снизить погрешность измерения. Например, очевидно увеличение таймаута для онлайн-кинотеатров, ибо во время просмотра фильма пользователь никаких действий на сайте, как правило, не предпринимает (чтобы не получить время сессии в пару минут, когда на самом деле он просидел там полтора часа).
  3. Пользователь — это посетитель вашего сайта или мобильного приложения. Не путайте пользователей с резальными людьми, ибо, по сути, это всего лишь браузеры, через которые с сайтом общаются какие-то люди, но идентифицировать их не представляется возможным. На одном компьютере и в одном браузере может работать попеременно несколько человек, и в то же время один и тот же человек может посещать ваш сайт с разных устройств в течении дня (с компьютера, планшета, смартфона, рабочего компьютера, ноутбука и т.п.). Системы аналитики пытаются начать идентифицировать именно людей, но пока это еще в полной мере не реализовано.

    Как определяется то, что действия на сайте производит один и тот же пользователь, а не другой? Довольно просто. При фиксации первого хита данному пользователю присваивается уникальный ID (идентификационный номер), который хранится в куках его браузеракэше). Ну, а все остальные хиты, совершенные этим пользователем, будут идентифицироваться по этому ID, считанному из кукисов. Именно поэтому я поставил чуть выше знак равенства для систем аналитики между реальным пользователем (человеком) и его браузером. Такое вот допущение делается, и уйти от всех связанных с этим погрешностей измерений пока не получается.

Чуть подробнее остановимся на кукисах. Это небольшие фрагменты данных в текстовом формате, которые хранятся в кеше браузера. Их довольно часто используют как механизм, позволяющий запоминать посетителя и его предпочтения — хранить сделанные им на сайте настройки, параметры авторизации и что-то еще. При повторном посещение данного сайта браузер считывает записанные для него куки и посетитель попадет в привычный ему интерфейс, ему не требуется при каждом обновлении страницы заново авторизовываться на этом сайте.

Куки можно разделить на два типа — основные (куки того сайта, куда зашел посетитель) и сторонние (они не относятся к этому сайту, но присутствуют на открытой странице). Примером источника сторонних кукисов может служить баннер, отображаемый на странице, но загружающийся со стороннего сервера. В настройках браузерах прием сторонних куков можно отключить, что, собственно, многие и делают.

Тем не менее лимит, отведенный для одной статьи, исчерпан, поэтому продолжим разговор про кукисы и все остальное, что позволит нам освоить науку осмысленного сбора статистики сайта и работы с построенными на ее основе отчетами, в последующих публикациях рубрики «Статистика сайта».

Продолжение следует >>> (Тут можно подписаться на почтовую рассылку с анонсами новых статей)

Ну, и еще предлагаю вам поделиться — какими системами сбора статистики вы пользуетесь:

Удачи вам! До скорых встреч на страницах блога KtoNaNovenkogo.ru

Еще:

Рубрики :Статистика сайта

Комментарии и отзывы

Иван

Как по мне , так метрика удобней всего

Роман

Много материала повторяется из статьи в статью

Василий

Да как то много всего и и маловато практического и дающего результаты. Чисто теория

Вячеслав

Очень много написано во всех статьях. Тоже самое можно написать в 2 раза меньше объемом. И много материала, которые уже были написаны в других статьях.

Подписаться не комментируя