Этот проект посвящён анализу данных онлайн-продаж продуктового ритейла. Цель — выполнить комплексный анализ товарных категорий, выявить драйверы продаж, оценить прибыльность и провести ABC-анализ подкатегорий.
Проект выполнен в формате Jupyter Notebook в рамках учебной аналитической задачи.
Samokat_final_project/
├─ data/
│ ├─ products.xlsx # Справочник товаров
│ └─ orders.xlsx # Заказы
├─ notebooks/
│ └─ Samokat_analysis.ipynb # Основной ноутбук проекта
├─ README.md # Описание проекта
└─ requirements.txt # Зависимости
Таблица products.xlsx
| Поле | Описание |
|---|---|
| product_id | ID товара |
| level1 | Категория |
| level2 | Подкатегория |
| name | Наименование товара |
Таблица orders.xlsx
| Поле | Описание |
|---|---|
| order_id | Номер чека |
| accepted_at | Дата и время покупки |
| product_id | ID товара |
| quantity | Кол-во в чеке |
| regular_price | Базовая цена |
| price | Цена продажи |
| cost_price | Себестоимость |
- pandas
- matplotlib
- seaborn
- openpyxl
Установка зависимостей:
pip install -r requirements.txt
- Создание вспомогательных полей:
- sales_qty — количество проданных единиц
- sales_sum — выручка сделки
- is_promo — продажа по промо
- Объединение orders + products по product_id
- Исключение товаров, отсутствующих в справочнике (кроме задачи среднего чека)
- Формирование итогового датафрейма df
- Вычислены продажи по категориям (level1)
- Построен bar chart
- Определена категория-лидер по продажам в штуках
- Подсчитаны продажи по level1 + level2
- Выполнена сортировка по объёму продаж
- Выделены подкатегории-лидеры
- Рассчитаны суммы по каждому order_id
- Средний чек для указанной даты определён на основе исходного orders
- Подсчитаны продажи по промо и без промо
- Построен pie chart
- Рассчитана доля промо в общем объёме продаж категории
Рассчитаны:
- маржа в рублях
- маржа в процентах
Построены:
- горизонтальный bar chart маржи в рублях
- горизонтальный bar chart маржи в процентах
Проведены два анализа:
- ABC по количеству (sales_qty)
- ABC по выручке (sales_sum)
Создана итоговая группа.
- Выявлена самая ходовая категория и ТОП-подкатегории
- Получено распределение продаж по всем товарным группам
- Средний чек 13.01.2022 рассчитан на основе всех заказов
- Доля промо в категории «Сыры» характеризует чувствительность покупателей к скидкам
- Определены наиболее маржинальные категории
- ABC-анализ выделил подкатегории, формирующие основную часть продаж и выручки