Интерактивное веб-приложение на Streamlit для обучения, валидации и использования антифрод-моделей (Logistic Regression и XGBoost) на основе кредитных данных заемщиков.
- Загрузка пользовательского датасета (CSV, Excel)
- Обработка пропусков, кодирование и масштабирование признаков
- Обучение моделей: Logistic Regression и XGBoost
- Расчет метрик:
- Gini
- KS-индекс
- Accuracy, Precision, Recall
- Визуализация ROC-кривой и распределения вероятностей
- Сохранение модели и предсказаний
- Проверка новых данных через интерфейс
git clone https://github.com/your-username/anti-fraud-streamlit.git
cd anti-fraud-streamlit
pip install -r requirements.txtstreamlit run app.py- Перейдите во вкладку "🏋️♂️ Обучение XGBoost" или "📊 Обучение Logistic Regression"
- Загрузите датасет в формате
.csvили.xlsxс колонкойGB_flagкак таргет - Дождитесь завершения обучения модели и отображения метрик
- При желании скачайте файл с предсказаниями на тестовой выборке
- Перейдите во вкладку "🔍 Проверка XGBoost" или "📊 Проверка Logistic Regression"
- Загрузите новые данные для оценки — вы получите вероятности мошенничества
📁 anti-fraud-streamlit/
│
├── app.py # Основной файл Streamlit-приложения
├── model_xgb.json # Модель XGBoost
├── model_lr.json # Модель Logistic Regression
├── scaler.json # Масштабатор
├── label_encoders.json # Энкодеры категориальных признаков
├── features.json # Использованные признаки
├── test_predictions.csv # Предсказания
├── requirements.txt # Зависимости проекта
└── ...
Таблица с признаками заемщиков и целевым признаком GB_flag (1 — мошенник, 0 — нет).
- Gini: (2 imes AUC - 1)
- KS-индекс: максимум разности между распределениями плохих и хороших
- Accuracy, Precision, Recall — стандартные метрики классификации