Projet PLDAC : DQN et mémoire

Description

Ce projet explore l'utilisation de Deep Q-Networks (DQN) pour prédire la prochaine action à prendre dans un environnement partiellement observable. L'objectif principal est d'implémenter un agent capable de maintenir une mémoire des actions passées afin de mieux prédire les actions futures, même en l'absence d'une observation complète de l'état actuel. Cette approche vise à améliorer la prise de décision dans des environnements où toutes les informations nécessaires ne sont pas immédiatement accessibles.

Ce projet est réalisé dans le cadre de l'UE de Projet du Master 1 DAC sous la supervision d'Olivier Sigaud.

Structure du projet

Dossier	Description
/src	Code source principal
├── /maps	Création d'environnements personnalisés
├── /envs	Environnements d'expérimentation
└── /utils	Fonctions utilitaires
/docs	Documentation du projet
├── /cr	Comptes rendus hebdomadaire
└── /notebooks	Notebooks liés au projet
└── /analyse DQN	Analyses sur des env gym différents
README.md	Présentation du projet
.gitignore	Fichiers à ignorer par Git
requirements.txt	Dépendances Python

Technologies utilisées

Python
BBRL
Gymnasium
NumPy
Matplotlib

Installation

Cloner le dépôt :

git clone https://github.com/ton-repo/projet-dqn-ddpg.git
cd projet-dqn-ddpg

Installer les dépendances :

pip install -r requirements.txt

Objectifs et expériences

Implémenter un agent DQN dans un environnement partiellement observable.
Utiliser une mémoire pour stocker et exploiter les actions passées afin de prédire les actions futures.
Tester et analyser les performances de l'agent sur différents environnements.
Comparer l'impact de l'intégration de la mémoire sur la prise de décision de l'agent.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Projet PLDAC : DQN et mémoire

Description

Structure du projet

Technologies utilisées

Installation

Objectifs et expériences

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
docs		docs
src		src
README.md		README.md

Marchma0/PLDAC-2024-2025

Folders and files

Latest commit

History

Repository files navigation

Projet PLDAC : DQN et mémoire

Description

Structure du projet

Technologies utilisées

Installation

Objectifs et expériences

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages