Data Engineering
Engenheiro de dados com foco em pipelines escaláveis, arquitetura de dados moderna e boas práticas de engenharia de software. Atualmente na Motorista PX, construindo soluções de dados que impactam operações em escala nacional.
| Projeto | Descrição | Stack |
|---|---|---|
| brazillian-ecommerce-lakehouse | Pipeline batch end-to-end com arquitetura Medallion usando dados reais do Olist | Airflow · PySpark · dbt · Delta Lake · MinIO |
| realtime-fraud-detection-pipeline | Detecção de fraudes em tempo real em transações financeiras simuladas | Kafka · Spark Streaming · PostgreSQL |
| dbt-nyc-taxi-analytics | Projeto dbt com DuckDB analisando dados de táxi de Nova York — sem cloud | dbt · DuckDB · GitHub Actions |
| data-ingestion-cli | CLI Python para ingestão de APIs públicas com arquitetura limpa e testes | Python · Typer · SQLAlchemy · pytest |
| airflow-best-practices | 5 DAGs demonstrando padrões modernos do Airflow 2.x | Airflow · TaskFlow · Sensors · SQL Checks |