Skip to content

Simulative: итоговый проект по модулю Python для анализа данных

Notifications You must be signed in to change notification settings

mkudim/Samokat_analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Аналитика онлайн-продаж (Самокат)

Описание проекта

Этот проект посвящён анализу данных онлайн-продаж продуктового ритейла. Цель — выполнить комплексный анализ товарных категорий, выявить драйверы продаж, оценить прибыльность и провести ABC-анализ подкатегорий.

Проект выполнен в формате Jupyter Notebook в рамках учебной аналитической задачи.

Структура проекта

Samokat_final_project/
├─ data/
│  ├─ products.xlsx     # Справочник товаров
│  └─ orders.xlsx       # Заказы
├─ notebooks/
│  └─ Samokat_analysis.ipynb  # Основной ноутбук проекта
├─ README.md             # Описание проекта
└─ requirements.txt      # Зависимости

Используемые данные

Таблица products.xlsx

Поле Описание
product_id ID товара
level1 Категория
level2 Подкатегория
name Наименование товара

Таблица orders.xlsx

Поле Описание
order_id Номер чека
accepted_at Дата и время покупки
product_id ID товара
quantity Кол-во в чеке
regular_price Базовая цена
price Цена продажи
cost_price Себестоимость

Использованные библиотеки

  • pandas
  • matplotlib
  • seaborn
  • openpyxl

Подготовка окружения

Установка зависимостей:

pip install -r requirements.txt

Ход работы

1. Загрузка и первичный анализ данных

  • Создание вспомогательных полей:
    • sales_qty — количество проданных единиц
    • sales_sum — выручка сделки
    • is_promo — продажа по промо

2. Подготовка аналитического датафрейма

  • Объединение orders + products по product_id
  • Исключение товаров, отсутствующих в справочнике (кроме задачи среднего чека)
  • Формирование итогового датафрейма df

3. Самая ходовая товарная категория

  • Вычислены продажи по категориям (level1)
  • Построен bar chart
  • Определена категория-лидер по продажам в штуках

4. Распределение продаж по подкатегориям

  • Подсчитаны продажи по level1 + level2
  • Выполнена сортировка по объёму продаж
  • Выделены подкатегории-лидеры

5. Средний чек на 13.01.2022

  • Рассчитаны суммы по каждому order_id
  • Средний чек для указанной даты определён на основе исходного orders

6. Доля промо в категории «Сыры»

  • Подсчитаны продажи по промо и без промо
  • Построен pie chart
  • Рассчитана доля промо в общем объёме продаж категории

7. Маржа по категориям

Рассчитаны:

  • маржа в рублях
  • маржа в процентах

Построены:

  • горизонтальный bar chart маржи в рублях
  • горизонтальный bar chart маржи в процентах

8. ABC-анализ по подкатегориям

Проведены два анализа:

  • ABC по количеству (sales_qty)
  • ABC по выручке (sales_sum)

Создана итоговая группа.

Итоговые выводы

  • Выявлена самая ходовая категория и ТОП-подкатегории
  • Получено распределение продаж по всем товарным группам
  • Средний чек 13.01.2022 рассчитан на основе всех заказов
  • Доля промо в категории «Сыры» характеризует чувствительность покупателей к скидкам
  • Определены наиболее маржинальные категории
  • ABC-анализ выделил подкатегории, формирующие основную часть продаж и выручки

About

Simulative: итоговый проект по модулю Python для анализа данных

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published