Skip to content
View yasmina-bioinfo's full-sized avatar

Block or report yasmina-bioinfo

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
yasmina-bioinfo/README.md

Hi, I'm Yasmina Soumahoro

Biologist and biology educator applying computational approaches to explore biological data and complex living systems.
Biologiste et enseignante en biologie mobilisant des approches computationnelles pour explorer les données biologiques et la complexité du vivant.


About Me

I am a biology teacher and biologist, integrating bioinformatics approaches into my work to study biological systems through data. My projects span genomics, transcriptomics, epigenomics, and host–pathogen interactions, with a strong emphasis on reproducible analysis and biological interpretation.

Through applied projects, I explore how molecular data can inform questions in neuroscience, human health, and microbial biology, while developing strong computational and analytical skills to conduct rigorous biological data analysis and interpretation.

FR 🇫🇷 :
Je suis enseignante et biologiste, intégrant la bioinformatique comme outil d’analyse pour étudier les systèmes biologiques à partir de données. Mes projets couvrent la génomique, la transcriptomique, l’épigénomique et les interactions hôte–pathogène, avec une attention particulière portée à l’analyse reproductible et à l’interprétation biologique.

À travers des projets appliqués, j’explore comment les données moléculaires peuvent éclairer des questions en neurosciences, santé humaine et microbiologie, tout en développant des compétences computationnelles et analytiques pour mener des analyses biologiques rigoureuses et interprétables.


Research Interests / Domaines de recherche

Methods & Data Types / Méthodes et types de données

  • Genomics & Transcriptomics — RNA-seq analysis, differential expression, temporal and condition-dependent responses.
  • Epigenomics / Épigénomique — DNA methylation, chromatin regulation, gene expression control.

Biological Systems / Systèmes biologiques

  • Host–Pathogen Interactions / Interactions hôte–pathogène — dual RNA-seq, microbial adaptation, and host responses.
  • Neurobiology & Stress Biology / Neurobiologie et biologie du stress — molecular responses to environmental and physiological stressors.

Computational Framework / Cadre computationnel

  • Computational Biology / Biologie computationnelle — reproducible pipelines, algorithmic thinking, genomic data analysis.

Current Learning Path / Parcours d’apprentissage

Building solid foundations in:
Python R Genomics Transcriptomics

  • Algorithmic thinking in bioinformatics
  • Data visualization & reproducible research
  • Genomic data science & Biopython practice These skills are applied through progressively complex bioinformatics projects using real biological datasets.

FR 🇫🇷 :
Je développe des compétences solides en :

  • Raisonnement algorithmique appliqué à la bioinformatique
  • Visualisation et analyse reproductible des données biologiques
  • Sciences des données génomiques et apprentissage de Biopython Ces compétences sont mises en pratique au travers de projets de bioinformatique de plus en plus complexes, basés sur des jeux de données biologiques réels.

Foundations & Learning Bioinformatics Projects

Project / Projet Description Tools / Outils
PatternMatching DNA motif search algorithm / Recherche de motifs dans l’ADN Python, CSV
SkewArray GC skew visualization in genomes / Visualisation du déséquilibre GC dans les génomes Python, Matplotlib
GCContent GC content analysis in DNA sequences / Analyse du pourcentage de GC dans les séquences ADN Python, CSV, Matplotlib
ReverseComplement Compute the reverse complement of a DNA sequence with validation and file workflow Python
MotifFinding Identification of motif positions in DNA sequences (pattern matching) Python
FASTA-Essentials Multi-FASTA analysis: GC%, heatmaps, boxplots, CSV export Python, Biopython, Pandas, Matplotlib

Applied & Research-Oriented Bioinformatics Projects

Project / Projet Description Tools / Outils
Dual RNA-seq (Helicobacter pyloriHomo sapiens) Reproducible dual RNA-seq analysis of host–pathogen transcriptomic responses during H. pylori infection, including WT vs KO strains and temporal effects (12h vs 24h). R, DESeq2
Human Trauma Epigenetics (GSE72680) DNA methylation (Illumina 450K) analysis of trauma exposure in humans, including raw-to-processed pipeline, quality control, visualization, and PCA. Python, Pandas, Matplotlib

Next Steps / Prochaines étapes

  • Continue developing expertise in genomics, transcriptomics, and integrative biological data analysis.
  • Apply bioinformatics approaches to questions in human health, disease, and host–microbe interactions.
  • Collaborate on open research linking biology, computation, and education.

These next steps aim to further establish bioinformatics as a core tool for analyzing and interpreting complex biological systems.

FR 🇫🇷 :

  • Approfondir mon expertise en génomique, transcriptomique et analyse intégrative de données biologiques.
  • Appliquer la bioinformatique à des problématiques de santé humaine, de maladie et d’interactions hôte–microbe.
  • Collaborer à des projets ouverts reliant biologie, informatique et éducation.

Ces prochaines étapes visent à renforcer la bioinformatique en tant qu'outil central pour l’analyse et l’interprétation de systèmes biologiques complexes.


Connect with Me / Me contacter


“Understanding biology today means learning to listen to data.”
« Comprendre la biologie aujourd’hui, c’est apprendre à écouter les données.»
Yasmina Soumahoro

Pinned Loading

  1. FASTA-Essentials FASTA-Essentials Public

    Analysis of stress- and epigenetics-related genes using real multi-FASTA data (GC%, heatmap, boxplot, Biopython & Pandas).

    Python

  2. GSE147058_DNA_METHYLATION_ANALYSIS GSE147058_DNA_METHYLATION_ANALYSIS Public

    Exploratory DNA methylation analysis of GEO dataset GSE147058, with reproducibility testing based on a prior workflow (GSE72680).

    Jupyter Notebook

  3. Human_Trauma_Epigenetics_GSE72680 Human_Trauma_Epigenetics_GSE72680 Public

    DNA methylation analysis of trauma-related samples (GSE72680).

    Jupyter Notebook

  4. PatternMatching PatternMatching Public

    Python implementation of classical pattern-matching algorithms for DNA sequences, including exact motif search and basic genomic string processing.

    Python

  5. RNAseq_AIRWAY_MINI RNAseq_AIRWAY_MINI Public archive

    Mini RNA-seq project using Python (QC) and R/DESeq2 (differential expression). Full workflow with PCA, heatmap, volcano plot, DEG tables, and annotated results.

    Jupyter Notebook

  6. GSE83931_miniFASTQ GSE83931_miniFASTQ Public

    Reproducible RNA-seq analysis (Salmon, tximport, DESeq2) — mouse dataset from Johns Hopkins Coursera course

    HTML