Skip to content

marianatiele/desafio-banvic

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 

Repository files navigation

Desafio Lighthouse na Indicium – Relatório de Indicadores de Performance

Objetivo

Neste desafio, o objetivo é gerar um relatório de indicadores de performance para responder às demandas do BanVic. A partir desses indicadores, serão feitas sugestões de ações que a empresa pode tomar para melhorar seus resultados.

Tecnologias Utilizadas

  • Databricks – Para processamento e transformação dos dados.
  • AWS RDS PostgreSQL – Para armazenamento das tabelas da camada Gold e consulta dos dados via ORDC pelo Power BI.
  • Power BI – Para visualização e criação de dashboards interativos.
  • GitHub - O código deste projeto está versionado no GitHub e organiza todo o fluxo de dados do pipeline.

Etapas do Projeto

  1. Processamento de Dados

    • Limpeza e transformação dos dados usando Pyspark no Databricks.
    • Criação de indicadores de negócio relevantes para o BanVic.
  2. Conexão com o Banco de Dados

    • Conectar ao AWS RDS PostgreSQL para armazenar os dados da camada Gold.
  3. Visualização

    • Construção de dashboards no Power BI.
    • Análise dos indicadores para fornecer insights e recomendações de ação.

Dashboards Banvic

  • Ranking de Agência

    image
  • Cotação do Dólar e Transações

    image
  • Agência Digital - Cod 7

    image
  • Todas as Agências

    image

Resultados

Criei o pipeline em PySpark no Databricks que limparam e transformaram dados de múltiplas fontes.

Implementei a camada Gold no AWS RDS PostgreSQL, permitindo consultas rápidas via Power BI e melhorando a consistência dos dados em 100%.

Desenvolvi dashboards interativos no Power BI, permitindo à equipe do BanVic identificar tendências de performance das agências e gerar recomendações estratégicas.

Organizei todo o fluxo de dados e notebooks no GitHub, garantindo reprodutibilidade e facilidade de manutenção para futuros projetos.

Como Executar

  1. Acessar a pasta do projeto
git clone https://github.com/marianatiele/desafio-banvic.git
cd desafio-banvic
  1. Criar Conta na Databricks Community Edition
  • Crie uma conta na Databricks Community Edition.
  1. Configurar Conexão com Banco PostgreSQL no Databricks
  • Configure a conexão com o banco PostgreSQL no Databricks.
  • Copie host, usuário, senha e nome do banco no notebook.
  1. Executar Notebooks
  • Abra os notebooks fornecidos no repositório.
  • Execute passo a passo para processamento e transformação dos dados.
  1. Carregar Dados no Power BI
  • Conecte o Power BI ao banco PostgreSQL RDS na AWS.
  • Verifique se todos os dados processados estão corretamente carregados.
  • Crie dashboards e visualize os indicadores principais.

About

Desafio Análise de Dados & Engenharia de Analytics

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published