...

среда, 16 июля 2014 г.

Синдром ступеньки и срез посещаемости Хабра

Последнюю пару недель внимательно слежу за работой Хабра с помощью Хабра-аналитики и решил собрать свои наблюдения в статью. Сегодня мы обсудим: когда и в каком количестве читают Хабр; что такое «синдром ступеньки»; как получить данные о своих статьях и чем можно провести их анализ.

  1. Статистика посещаемости

  2. Просмотры статей: синдром ступеньки

  3. Публичность данных

  4. Хотлинк Хабра-графиков

  5. Весь инструментарий онлайн


Статистика посещаемости






(интерактивная версия доступна здесь и, если сайт упадет, то здесь)



Самые интересные факты из графика:


  • В выходные Хабр читают в среднем в два-три раза меньше человек, чем по будням

  • Ночью (по Москве) минимальная активность, примерно в 10 раз меньше чем на следующее утро

  • Пики активности подозрительно совпадают с рабочими часами по Москве

  • В будни основной всплеск активности утром до обеда, а в пятницу и к концу рабочего дня

  • Активность в понедельник сравнима с остальными рабочими днями т.е. никого супер-пика активности в понедельник утром




В один прекрасный день у нас будет свой iconosquare с интеллектуальным анализом текста и бендерами!

Просмотры статей: синдром ступеньки




За время работы сайта с 1го июля было проанализировано более сотни статей и фактически все они имеют «синдром ступеньки». Для примера рассмотрим график просмотров одной из статей:



(По клику открывается интерактивная версия)

Наиболее характерное поведение таково: до 24х часов просмотры растут близко к полиному 2-3ей степени от числа часов, при этом характер роста меняется во время выхода статью на главную и становится схожим с экспоненциальным. Однако, после выхода с главной, наступает момент насыщения и количество просмотров и добавлений в избранное выходит на константу. Это насыщение просмотров т.е. выход просмотров фактически на константу во времени я и окрестил синдромом ступеньки.



Основная гипотеза связана с тем, что после ухода статьи с главной у неё больше нет методов распространения. Это можно заметить по насыщению количества репостов во времени.



(интерактивные версии просмотры, избранное, репосты, там же доступны и данные)


Необходимым условием «живучести» статьи является продолжение её распространения в сети после ухода с главной. Т.е. либо статью продолжают передавать в виде сарафанного радио, например у автора подобный опыт связан со статьёй "Как правильно лгать с помощью статистики". Отследить распространение можно через яндекс-блоги, например через такой запрос [link:http://ift.tt/1mJQCx0] или для новых статей через Хабра-аналитику. Либо статья выходит в «Лучшее недели\месяца\за всё время» и получает просмотры за счет основной аудитории хабра.


Публичность данных




Одна из новых возможностей — это импорт данных статей и пульса:



Их можно скачать, кликнув по графику и затем нажав «import data», пример импортированных можно посмотреть тут pulse.csv c git репозитория HabraData (кстати говоря, это репозиторий, в котором я собираю всякие интересные данные связанные с сайтом, а здесь HabraAnalyticsTool консольные утилиты для анализа подобных данных).

Данные доступны (согласно платформе plotly) пермаментно, но в время слежения за статьёй ограничено 52 часами (к сожалению, если увеличить время до недели, то пул статей разрастается и система отрисовки начинает падать с ошибкой авторизации после большого количества запросов).


Хотлинк Хабра-графиков




Благодаря тому, что визуализация перешла на платформу plotly, теперь можно встраивать пульс и мониторы статей в html вот такой конструкцией.

<div class="container">
<div class="jumbotron">
<div class="row-fluid">
<iframe class="container well span12" id="pulse_stream" src="http://ift.tt/1ypzf8n"
seamless="seamless" height="600px" scrolling="no" ></iframe>
</div>
</div>
</div>




Если вы вдруг захотите сделать визуализацию своих статей (или пульса) в блоге достаточно просто встроить полученную ссылку (или автоматически распарсив сайт аналитики и вынув ссылку из страницы).

Весь инструментарий онлайн




Как и ранее доступен онлайн: анализ статей пользователей («история пользователя»), пересечение хабов и анализ аудитории.

image

Автор медленно, но верно допиливает предыдущие запросы и всегда рад услышать идеи (фактически через любые каналы связи, но лучше всего работают комментарии ниже и почта), что еще бы реализовать и улучшить.


This entry passed through the Full-Text RSS service — if this is your content and you're reading it on someone else's site, please read the FAQ at http://ift.tt/jcXqJW.


Комментариев нет:

Отправить комментарий