Skip to content

Latest commit

 

History

History
14 lines (11 loc) · 718 Bytes

File metadata and controls

14 lines (11 loc) · 718 Bytes

Cardio-Data Pipeline

Objectif: Automatiser la transformation de données cliniques brutes en datasets exploitables pour la recherche et l'IA, en toute sécurité.

Stack Technique Data Warehouse : Snowflake Transformation : dbt (Data Build Tool) via SQL modulaire Versioning : GitHub (Workflow de Pull Requests)

Valeur Ajoutée

  1. Nettoyage Clinique :*Suppression des artéfacts de données et normalisation des unités médicales.
  2. Fiabilité : Implémentation de tests d'intégrité automatisés (unicité, non-vacuité).
  3. Traçabilité : Audit trail complet des transformations (historique Git).
  4. Prêt pour l'IA : Modélisation de tables "Analytics-Ready" pour la recherche (ex: arythmies, cohortes).