Проект по статистике: анализ поведения пользователей, расчёт выручки и проверка гипотез (t-тесты, биномиальное и нормальное распределения) для обоснования бизнес-решений.
Главный вывод: подписчики выгоднее для сервиса — их поездки дольше, а месячная выручка выше (363 ₽ против 329 ₽), и оба различия статистически значимы (p < 0.05).
Сервис аренды самокатов GoFast работает по двум тарифам: без подписки (8 ₽/мин + 50 ₽ старт) и с подпиской Ultra (199 ₽/мес, 6 ₽/мин, старт бесплатно). По данным о пользователях и поездках нужно проверить гипотезы, которые помогут бизнесу расти: действительно ли подписчики ценнее, и что это значит для маркетинга.
Три таблицы: пользователи (город, возраст, тип подписки), поездки (расстояние, длительность, дата) и подписки (тарифные условия). Выполнены предобработка, объединение таблиц, помесячная агрегация и расчёт выручки по каждому пользователю с учётом тарифа.
| Гипотеза | Критерий | p-value | Вывод |
|---|---|---|---|
| Поездки подписчиков дольше | t-тест, независимые выборки, односторонний | < 0.001 | H₀ отвергнута — дольше |
| Среднее расстояние подписчиков > 3130 м (порог износа) | одновыборочный t-тест | 0.92 | H₀ не отвергнута — износ в норме |
| Месячная выручка с подписчика выше | t-тест, независимые выборки, односторонний | < 0.05 | H₀ отвергнута — выше (363 ₽ vs 329 ₽) |
Дополнительно: для оценки эффекта обновления сервиса (число обращений в поддержку до/после) обоснован выбор парного t-теста — наблюдения зависимы, это те же пользователи.
- Промоакция: через биномиальное распределение рассчитано минимальное число промокодов — 1161, — обеспечивающее выполнение цели акции с вероятностью 95%;
- Push-рассылка: вероятность получить менее 399.5 тыс. открытий при 1 млн отправлений — около 15% (нормальная аппроксимация), то есть такой результат — естественное колебание, а не сбой.
- Продвигать подписку Ultra как выгодную модель для активных пользователей — она статистически подтверждённо повышает выручку;
- Стимулировать оформление подписки в первые недели использования (акции, персональные предложения);
- Использовать географию и возраст активных подписчиков для таргетирования рекламных кампаний.
Python · pandas · NumPy · SciPy · Matplotlib · Seaborn · Jupyter
git clone https://github.com/foxypandas/gofast-stat-analysis.git
cd gofast-stat-analysis
pip install -r requirements.txt
jupyter notebook notebooks/gofast_statistical_analysis.ipynbДатасеты предоставлялись в рамках образовательной программы Яндекс Практикума и не распространяются публично, поэтому в репозиторий не включены. Все выводы ячеек сохранены в ноутбуке — анализ можно посмотреть целиком без запуска кода.
├── notebooks/ # основной ноутбук
├── images/ # графики
└── requirements.txt