Analyse Prédictive du Diabète & Dashboard Interactif

Projet Universitaire - Master 1 Big Data > Techniques d'Apprentissage Artificiel

Présentation du Projet

Ce projet vise à développer une solution complète de Machine Learning pour la détection précoce du diabète. Il s'appuie sur une analyse approfondie de données de santé, l'entraînement de modèles prédictifs robustes et le déploiement d'une interface utilisateur web.

L'objectif est de fournir un outil d'aide à la décision capable d'estimer le risque de diabète à partir d'indicateurs cliniques et comportementaux (IMC, tension, cholestérol, etc.).

Accès au Dashboard

Une interface interactive permettant de tester le modèle en temps réel est disponible. Cette application web contient un module de prédiction où vous pouvez saisir vos propres données de santé (IMC, âge, taux de cholestérol, etc.). Le modèle analysera ces informations en temps réel pour prédire si le profil présente un risque de diabète.

DÉMO EN LIGNE : Diabetes Prediction Dashboard

Architecture du Projet

├── data
│   └── raw            <- Données brutes (diabetes2015.csv)
├── diabetes-dashboard <- Code source de l'application Web (React.js)
├── models             <- Modèles sérialisés (.pkl) et historiques d'entraînement
├── reports            
│   └── figures        <- Visualisations générées (Matrices de confusion, ROC, etc.)
├── src                <- Cœur du projet (Pipeline ETL & ML)
│   └── pipeline_run.py    <- Script unique d'exécution (End-to-End)
│   └── config.py
│   └── dataset.py   
│   └── features.py
│   └── plots.py
│   └── __init__.py
│   └── modeling
│           └── predict.py
│           └── train.py
├── requirements.txt   <- Liste des dépendances Python
└── README.md          <- Documentation du projet

Installation et Exécution (Partie Data)

Prérequis

git clone https://github.com/czsoup/Projet-Diabete-IA.git

Lancer le Pipeline ML windows

py -m venv venv

powershell en administrateur : Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser

.\venv\Scripts\activate pip install -r requirements.txt

python -m src.pipeline_run

Méthodologie Data Science

Préparation des Données

Nettoyage : Traitement des valeurs manquantes et doublons.

Feature Engineering : Sélection des variables les plus corrélées (Top 15 features).

Normalisation : Mise à l'échelle via StandardScaler.

Rééquilibrage : Utilisation de ADASYN (Adaptive Synthetic Sampling) pour corriger le déséquilibre des classes (Diabétique vs Non-Diabétique).

Modélisation

Comparaison de plusieurs algorithmes supervisés :

Random Forest Classifier (Retenu pour sa robustesse).

XGBoost Classifier.

Évaluation & Optimisation

L'accent a été mis sur la minimisation des Faux Négatifs (cas critiques en médecine).

Optimisation du seuil de décision (Threshold Tuning).

Métriques clés : Recall (Sensibilité) et F1-Score.

Interface Utilisateur (React)

Le dossier diabetes-dashboard/ contient le code source de l'interface front-end. Elle permet à un utilisateur de saisir ses paramètres de santé et d'obtenir une prédiction instantanée via le modèle entraîné.

Framework : React.js

Hébergement : GitHub Pages

Auteures

Projet réalisé dans le cadre du Master 1 Informatique - Parcours Big Data.

Ibtissam ZAID

Caroline ZHENG

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Analyse Prédictive du Diabète & Dashboard Interactif

Présentation du Projet

Accès au Dashboard

Architecture du Projet

Installation et Exécution (Partie Data)

Prérequis

Lancer le Pipeline ML windows

Méthodologie Data Science

Préparation des Données

Modélisation

Évaluation & Optimisation

Interface Utilisateur (React)

Auteures

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
data/raw		data/raw
diabetes-dashboard		diabetes-dashboard
models		models
reports		reports
src		src
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Folders and files

Latest commit

History

Repository files navigation

Analyse Prédictive du Diabète & Dashboard Interactif

Présentation du Projet

Accès au Dashboard

Architecture du Projet

Installation et Exécution (Partie Data)

Prérequis

Lancer le Pipeline ML windows

Méthodologie Data Science

Préparation des Données

Modélisation

Évaluation & Optimisation

Interface Utilisateur (React)

Auteures

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages