Bienvenue dans le dépôt Humans_Vs_Robots. Ce dépôt contient les livrables pour un projet de Machine Learning axé sur la classification des données entre Robots et Humains. Vous y trouverez les modèles développés, un notebook pour la préparation des données et le feature engineering, ainsi qu'un rapport détaillant l'ensemble du projet.
Ce dépôt est organisé comme suit :
-
Dossier
Modèle
: Ce dossier contient les différents modèles utilisés pour résoudre le problème de classification entre Robots et Humains. Vous y trouverez principalement les quatre modèles implémentés dans le projet. -
Notebook
Feature_engineering_vf.ipynb
: Ce notebook détaille le prétraitement des données et le feature engineering. Il inclut :- Première Dataframe :
train.csv
- Dataframe d'entraînement avant l'application de SMOTE pour équilibrer les données entre Robots et Humains. - Deuxième Dataframe :
train_smote.csv
- Dataframe d'entraînement après l'application de SMOTE pour équilibrer les données entre Robots et Humains. - Troisième Dataframe :
test.csv
- Dataframe de test utilisé pour évaluer les modèles.
- Première Dataframe :
Pour commencer à utiliser ce dépôt :
-
Clonez le Dépôt
- Utilisez la commande
git clone
suivie de l'URL du dépôt pour cloner le projet sur votre machine locale. Ensuite, accédez au dossier du projet.
- Utilisez la commande
-
Installez les Dépendances
- Assurez-vous que Python est installé. Installez les dépendances nécessaires en utilisant le fichier
requirements.txt
(si disponible).
- Assurez-vous que Python est installé. Installez les dépendances nécessaires en utilisant le fichier
-
Lancez Jupyter Notebook
- Ouvrez Jupyter Notebook et chargez le fichier
Feature_engineering_vf.ipynb
pour explorer le prétraitement des données et le feature engineering.
- Ouvrez Jupyter Notebook et chargez le fichier
Le dépôt inclut également un rapport détaillé qui fournit une vue d'ensemble approfondie des méthodes utilisées, des résultats obtenus, et des conclusions tirées au cours du projet.
- Données Non Incluses : Les fichiers de données (
train.csv
,train_smote.csv
,test.csv
) ne sont pas inclus dans le dépôt en raison de leur taille. Vous devrez fournir ces fichiers séparément.