Влияние погоды на продажи в e-commerce

Решил проверить старую байку о том, что погода влияет на продажи в интернет-магазинах. Отчасти здесь логика есть: на улице дождь, делать нечего, сижу дома и скупаю весь интернет. Но по факту это лишь один из многих сценариев. Эволюция не научила нас рационально оценивать события в уме. Мы находим одну интересную идею и женимся на ней. Плохо, если так на свет появляется очередное экспертное мнение.

Проверка гипотезы

Для проверки гипотезы я взял статистику изменения атмосферного давления в Москве (с gismeteo) и данные по московским продажам в интернет-магазине. Получил такой датасет:

Датасет с информацией об атмосферном давлении и продажах

Здесь:

Date – дата с 16.01.17 – 19.06.17

Day – день недели

DayOfWeek – рабочие или выходные дни

Press – Среднее атмосферное давление в Москве за день

Revenue – Доход интернет-магазина по Москве

Поскольку продажи в выходные и рабочие дни различны, будем исследовать их раздельно. И для начала, строим диаграмму рассеяния:

Диаграмма рассеяния дохода

Тут мы видим, что:

  1. Доходы в выходные ниже чем в будни и это статистически подтверждается, поскольку доверительные интервалы не пересекаются.
  2. Зависимость дохода от давления не линейная
  3. Доходы и давление слабо коррелируют между собой, хоть это уже бросается в глаза, мы все-таки проведем несколько тестов.

Интересный факт, если же попытаться построить прямую линию тренда и посмотреть на корреляцию, пусть слабую

Диаграмма рассеяния с линией тренда

Можно сказать, что в рабочие дни есть положительная корреляция, т.е. с  ростом давления растет и доход. А в выходные наоборот: чем выше давление, тем ниже продажи. Уверен, вы подумали, что это логично – в выходные на солнышке не до шоппинга, а в будни при хорошей погоде – хорошее настроение и почему бы не прикупить чего-нибудь? Но стоп! Не будем спешить с выводами и их обоснованиями.

Лучше построим регрессионную модель с одним предиктором. Что бы исследовать взаимосвязь давления с продажами в нашем магазине. Начну с выходных:

Регрессионная модель с одним предиктором для выходных дней

Итак, тут сказано, что моя выборка подходит под регрессионную модель по всем параметрам. Но коэффициент при предикторе и интерсепт статистически не отличны от нуля. Что означает, что моя линейная модель ничего не означает:)

К слову, если посмотреть на значение R-squared = 0.001. Можно сказать, что моя модель объясняет лишь 0,1% изменения дохода по давлению. Совсем не густо.

Для будней ситуация такая:

Регрессионная модель с одним предиктором для рабочих дней

Тут мне не удалось выполнить все предписания для построения линейной модели. Я извлек квадратный корень из переменной Revenue, что бы “нормализовать” распределение, но в итоге не все условия оказались выполнены.

Но не суть. Суть снова в R-squared, и он тут: 0,01. Отлично, эта модель объясняет уже 1% изменений.

Выводы

А вывод у меня таков – глядя с утра на барометр, я не стану делать ставки относительно продаж в этот день.

Но стоит заметить, что данное исследование относится только к конкретному магазину и вполне возможно, что в какой-то другой нише или у конкурента ситуация совершенно иная.

Добавить комментарий

Ваш e-mail не будет опубликован.