В этом репозитории находится финальный проект специализации "Машинное обучение и анализ данных".
Ниже приведена общая информация о каждом этапе проекта и используемые инструменты в процессе выполнения проекта.
№ | Название ноутбука | Описание | Инструменты |
---|---|---|---|
1 | Разведочный анализ данных | Анализ данных и их визуализация. Поиск зависимостей. | Pandas, Seaborn, matplotlib. |
2 | Пострение BaseLine решения | Провожу эксперимент в выборе лучшей модели без подбора гиперпараметров, эксперементируя с помощью различных методов обработки исходного датасета | Pandas, Sklearn, Xgboost , Catboost, Lightgbm, Category_encoders. |
3 | Эксперименты с моделью, финальное решение | Иследование поведения модели в различных условиях: изменения объема выборки, изменения весов модели, числа признаков и т.д. Оценка качества модели. | Pandas, NumPy, Sklearn, Xgboost, Catboost, Seaborn, Matplotlib, Category_encoders, Optuna. |
4 | Оценка экономического эффекта | В качестве оценки эффективности проделанной работы, была реализована экономическая модель работы компании, с моделью и без. Построил граффики прибыли. | Pandas, Sklearn, Xgboost, Seaborn , Matplotlib |
5 | Итоги проделанной работы | Рассказал цель данного проекта, описал этапы реализации конечного алгоритма, показал результаты проделанной работы. Рассказал о важных моментах и киллер фичах, которые я узнал во время работы. | Текст и картинки |