Skip to content

foxypandas/gofast-stat-analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🛴 GoFast: статистический анализ сервиса аренды самокатов

Проект по статистике: анализ поведения пользователей, расчёт выручки и проверка гипотез (t-тесты, биномиальное и нормальное распределения) для обоснования бизнес-решений.

Главный вывод: подписчики выгоднее для сервиса — их поездки дольше, а месячная выручка выше (363 ₽ против 329 ₽), и оба различия статистически значимы (p < 0.05).

📋 Задача

Сервис аренды самокатов GoFast работает по двум тарифам: без подписки (8 ₽/мин + 50 ₽ старт) и с подпиской Ultra (199 ₽/мес, 6 ₽/мин, старт бесплатно). По данным о пользователях и поездках нужно проверить гипотезы, которые помогут бизнесу расти: действительно ли подписчики ценнее, и что это значит для маркетинга.

📊 Данные

Три таблицы: пользователи (город, возраст, тип подписки), поездки (расстояние, длительность, дата) и подписки (тарифные условия). Выполнены предобработка, объединение таблиц, помесячная агрегация и расчёт выручки по каждому пользователю с учётом тарифа.

🧪 Проверка гипотез (α = 0.05)

Гипотеза Критерий p-value Вывод
Поездки подписчиков дольше t-тест, независимые выборки, односторонний < 0.001 H₀ отвергнута — дольше
Среднее расстояние подписчиков > 3130 м (порог износа) одновыборочный t-тест 0.92 H₀ не отвергнута — износ в норме
Месячная выручка с подписчика выше t-тест, независимые выборки, односторонний < 0.05 H₀ отвергнута — выше (363 ₽ vs 329 ₽)

Дополнительно: для оценки эффекта обновления сервиса (число обращений в поддержку до/после) обоснован выбор парного t-теста — наблюдения зависимы, это те же пользователи.

📐 Расчёты на распределениях

  • Промоакция: через биномиальное распределение рассчитано минимальное число промокодов — 1161, — обеспечивающее выполнение цели акции с вероятностью 95%;
  • Push-рассылка: вероятность получить менее 399.5 тыс. открытий при 1 млн отправлений — около 15% (нормальная аппроксимация), то есть такой результат — естественное колебание, а не сбой.

💼 Рекомендации для бизнеса

  • Продвигать подписку Ultra как выгодную модель для активных пользователей — она статистически подтверждённо повышает выручку;
  • Стимулировать оформление подписки в первые недели использования (акции, персональные предложения);
  • Использовать географию и возраст активных подписчиков для таргетирования рекламных кампаний.

🛠 Стек

Python · pandas · NumPy · SciPy · Matplotlib · Seaborn · Jupyter

🚀 Как запустить

git clone https://github.com/foxypandas/gofast-stat-analysis.git
cd gofast-stat-analysis
pip install -r requirements.txt
jupyter notebook notebooks/gofast_statistical_analysis.ipynb

Датасеты предоставлялись в рамках образовательной программы Яндекс Практикума и не распространяются публично, поэтому в репозиторий не включены. Все выводы ячеек сохранены в ноутбуке — анализ можно посмотреть целиком без запуска кода.

📁 Структура проекта

├── notebooks/     # основной ноутбук
├── images/        # графики
└── requirements.txt

About

GoFast user data analysis: subscription impact on rides and revenue, city-based behavior. Hypotheses and visuals included./Анализ данных пользователей GoFast: влияние подписки на поездки и выручку, поведение по городам. Гипотезы и графики.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors