Сбор данных для LTV

Для расчета LTV есть подробная статья с примером от Алексея Куличевского. От себя я хотел бы добавить в нее один важный пункт, который автор упустил, сославшись на помощь программиста. На практике оказывается, что не все программисты знают и в состоянии справиться с задачей получения данных по когортам. Если ваши данные находятся в Google Analytics, то эта статья для вас. Я расскажу, как получить данные за год и более без участия программиста. И у меня в арсенале есть два способа, как это сделать.

Способ первый

Для тех, кто думает, что R – это только буква алфавита и никогда не работал с API. К сожалению вам недоступны все прелести работы с сырыми данными и вы будете вынуждены делать все в ручную. Но LTV стоит того!
Итак, вам надо создать сегменты в Google Analytics для каждого исследуемого месяца.
Создание сегмента в Google Analytics
А после применяете сегмент к следующим месяцам года и собираете информацию.

Отчет по сегменту в Google Analytics

Некоторых будет ждать еще одна проблема – это семплинг:

Семплирование данных в Google Analytics

Для борьбы с ним вы можете собирать данные по меньшим временным промежуткам, например за половину месяца или неделю и объединять их в месяца. Либо же смириться, собирая семплированные данные или изучить язык программирования, например R.

Способ второй

Доступен для тех, кто имеет начальные знания в программировании. Я приведу код на R.

Код на R
library("readxl")
library("RGA")

#Авторизация
rga_auth <- authorize(client.id = "xxxxx.apps.googleusercontent.com", client.secret = "xxxxxxxx")

#Загрузка данных
gaData <- get_ga(profileId = "ga:XXXXX(view ID)",
start.date = "2016-02-01",
end.date = "2017-01-31",
dimensions = "ga:month",
metrics = "ga:sessions, ga:transactions, ga:transactionRevenue",
segment = "users::condition::ga:sessionCount==1;dateOfSession<>2016-02-01_2016-02-29",
fetch.by = "day",
samplingLevel = "HIGHER_PRECISION",
max.results = 10000,
token = rga_auth)

[свернуть]

Пояснения к коду:
– Как работать с пакетом RGA написано тут
– start.date и end.date – Диапазон сбора статистики
– Сегмент (когорта 2016-02-01_2016-02-29) по которой будет собрана статистика в указанном диапазоне в разрезе месяцев (dimensions = “ga:month”,)

segment = "users::condition::ga:sessionCount==1;dateOfSession<>2016-02-01_2016-02-29",

С помощью скрипта мы фактически делаем тоже самое, что и в первом случае – собираем информацию по сегментам, только через API. И еще мы обходим семплирование и тратим меньше времени на сбор. В результате работы скрипта получаем вот такой датасет, который можно сохранить в excel или еще куда-нибудь:

Результат работы скрипта

Обратите внимание на столбец month, там указан номер месяца. Поскольку мы создали сегмент за февраль 2016, то данные за этот месяц будут в строке №2, соответственно, данные за первый месяц февральской когорты (март) будут в строке под номером 3.А в первой строке будут данные за январь 2017.

В итоге

Вы узнали как собрать данные по когортам из Google Analytics за более чем 3 месяца. И еще, надеюсь, осознали все прелести программирования и работы с API.

Добавить комментарий

Ваш e-mail не будет опубликован.