jaffle-shop-bigquery/README.md at main · Billiondon/jaffle-shop-bigquery

Pipeline Analytics : Jaffle Shop (Édition BigQuery)

Migration et fiabilisation d'un flux décisionnel sur Google Cloud Platform.
Explorer la documentation »

Voir Démo · Signaler un Bug

Table des matières

À propos du projet
- Équipement utilisé
Problématique
Protocole suivi
Résultat du test d'effort
Usage & Lineage
Roadmap

À propos du projet

Ce projet détaille la mise en place d'une infrastructure de données robuste sur Google BigQuery. L'objectif central était de migrer et de stabiliser le pipeline de données "Jaffle Shop" en assurant une intégrité totale entre l'extraction des graines (seeds) et la modélisation SQL finale.

Built With

[![BigQuery][BigQuery-shield]][BigQuery-url]
[![dbt][dbt-shield]][dbt-url]
[![GCP][GCP-shield]][GCP-url]
[![GitHub][GitHub-shield]][GitHub-url]

(back to top)

Problématique

"Comment garantir une transition fluide entre des sources de données hétérogènes et un entrepôt BigQuery, tout en assurant l'intégrité et la documentation automatique des transformations ?"

Le défi consistait à neutraliser les risques de régression lors de la migration depuis Snowflake et à transformer des sources brutes en actifs informationnels fiables pour le business.

(back to top)

Protocole suivi

L'intervention a été menée selon un protocole strict pour garantir la stabilité du système :

Configuration des accès : Initialisation via Service Account Google Cloud avec gestion sécurisée des clés JSON.
Architecture du projet : Création d'un dépôt GitHub dédié afin d'isoler l'environnement BigQuery et d'éviter toute contamination inter-plateformes.
Injection de données : Chargement et typage des sources brutes (raw_customers, raw_orders, raw_payments) via la fonction dbt seed.
Assurance Qualité : Révision chirurgicale des modèles SQL et correction des anomalies de schéma pour garantir un succès des tests d'intégrité à 100%.

(back to top)

Résultat du test d'effort

Le pipeline est désormais opérationnel et stable.

Flux : Circulation des données sans perte de paquets ni latence critique.
Intégrité : Validation systématique via dbt test (contraintes unique et not_null).
Observabilité : Documentation technique et Lineage Graph à jour, offrant une visibilité souveraine sur la généalogie de la donnée.

(back to top)

Usage

Pour auditer la santé du pipeline :

dbt seed
dbt run
dbt test

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Pipeline Analytics : Jaffle Shop (Édition BigQuery)

À propos du projet

Built With

Problématique

Protocole suivi

Résultat du test d'effort

Usage

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

Pipeline Analytics : Jaffle Shop (Édition BigQuery)

À propos du projet

Built With

Problématique

Protocole suivi

Résultat du test d'effort

Usage