Ноутбук для решения задачи регрессии: предсказание price по признакам датасета (в т.ч. bathrooms, bedrooms, interest_level).
Содержит полный цикл: EDA, очистка, генерация полиномиальных признаков, обучение нескольких моделей и сравнение по метрикам.
-
EDA: размер/столбцы,
info(),describe(), корреляции, тепловая карта, scatter-графики. -
Очистка: удаление выбросов по целевой
priceчерез 1-й и 99-й перцентили. -
Подготовка признаков: кодирование
interest_level, гистограммы дляbathrooms/bedrooms. -
Фичи:
PolynomialFeatures(degree=10)для пары базовых признаков (демо высокой степени). -
Модели:
LinearRegressionDecisionTreeRegressor(random_state=21)- Бейзлайны: naive_mean, naive_median
-
Метрики: MAE, RMSE (на train и test), финальные таблицы
result_MAEиresult_RMSE. -
Визуализации: гистограммы/boxplot целевой, тепловая карта корреляций, матплотлиб-графики.
- Таблицы MAE/RMSE по train/test для всех моделей.
- Вывод о том, какая модель лучшая (по
result_MAEиresult_RMSE). - Набор графиков (распределения
price, boxplot, корреляции, scatter).