Ce dépôt contient le code, les données et les résultats associés à l'analyse bioinformatique du protéome de Rattus norvegicus. Ce projet a été réalisé dans le cadre du Master 1 Bioinformatique et Biologie des Systèmes à l'Université Paul Sabatier Toulouse III (Universités de Toulouse, FRANCE), année universitaire 2024-2025.
Ce répertoire contient des outils Python pour l'analyse et la manipulation des données de la Gene Ontology (GO), avec une application spécifique à l'organisme Rattus norvegicus. Il fournit des fonctionnalités pour charger, explorer et analyser les relations entre GeneProducts et GOTerms à partir de fichiers au format OBO et GAF/GOA.
- Chargement des données GO à partir des fichiers OBO et GAF/GOA.
- Représentation des graphes GO avec une structure en listes d’adjacence.
- Exploration des relations entre GeneProducts et GOTerms (directes et récursives).
- Calcul de la profondeur maximale d’un graphe (diamètre).
- Vérification de l’acyclicité et tri topologique des graphes.
- Tests unitaires pour garantir la robustesse des outils.
Algorithmes_de_Graphes_et_Annotation_Fonctionnelle-Etude_Proteomique_Rattus_norvegicus
README.md: Documentation du projetLICENSE: License appliquée à l'ensemble du projetrapport_projet_Graph_R.norvegicus_RODRIGUES.pdf: Rapport d'ingénierie sur les outils développés.- scripts/ : Dossier abritant l'ensemble des fichiers python
geneontology.py: Code pour les analyses spécifiques à la Gene Ontologygraphmaster.py: Bibliothèque générique de manipulation de graphestest_graphmaster.py: Tests unitaires pour la bibliothèquegraphmaster.py
- data/ : Dossier regroupant les données utilisées pour l'analyse de Rattus norgevicus et pour les tests effectués.
go-basic.obo: Exemple de fichier OBO pour la Gene Ontology122.R_norvegicus.txt: Fichier contenant un lien vers le fichier GOA pour les annotations de Rattus norvegicustest_protein_51145.txt: Fichier contenant les informations pour créer un graphe à partir des données de la protéine 51145.directed.graph.with.cycle.tsv: Fichier contenant les informations pour charger le graphe simple figurant sur la représentation graphiquedirected.graph.with.cycle.pnguniprot_sars-cov-2.gaf: Fichier au format GAF permettant de tester sur un jeu de données plus petit les programmes développés
- Python >= 3.8
- Bibliothèques Python standards (aucune dépendance externe requise)
- Clonez ce repository et placez-vous dans le répertoire du projet :
git clone https://github.com/CamilleAstrid/Algorithmes_de_Graphes_et_Annotation_Fonctionnelle-Etude_Proteomique_Rattus_norvegicus.git
cd Algorithmes_de_Graphes_et_Annotation_Fonctionnelle-Etude_Proteomique_Rattus_norvegicus- Assurez-vous d'avoir Python et les dépendances nécessaires installés.
- Exécutez les scripts pour reproduire les analyses :
python scripts/geneontology.py <input_file.GOA>/!\ Si le fichier en input n'est pas renseigné, le fichier 122.R_norvegicus.goa sera utilisé. S'il n'est pas présent dans le dossier data/, il y sera téléchargé depuis l'url figurant dans le fichier 122.R_norvegicus.txt.
Pour exécuter les tests unitaires et vérifier la robustesse des outils :
python test_graphmaster.pyCe projet et donc l'ensemble des éléments de ce répertoire est sous licence GPL-v3 (sauf cas précisé).
Copyright (c) 2023 BARRIOT Roland
Copyright (c) 2025 CamilleAstrid
Inspiré des travaux sur la Gene Ontology pour Rattus norvegicus.