Skip to content

Análise dos Dados do ENEM 2023 para Cursos Selecionados — Spark & Power BI. Projeto homologado pela CGU no Concurso de Reuso de Dados.

Notifications You must be signed in to change notification settings

marianatiele/rdata_Enem2023

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 

Repository files navigation

🎓 Análise de Dados do ENEM 2023 com PySpark e Power BI

Este projeto tem como objetivo explorar e visualizar os dados do Exame Nacional do Ensino Médio (ENEM) 2023 com foco em seis cursos de alto interesse, utilizando PySpark para e Power BI para criar dashboards interativos. A análise permite verificar quantos aprovados foram por cotas, a distribuição por estado, médias de notas, perfil dos candidatos e outras informações relevantes para apoiar estudantes e pesquisadores.


Homologado pela CGU

🏅 Reconhecimento

Este projeto foi homologado pela Controladoria-Geral da União (CGU) no Concurso de Reúso de Dados Abertos, destacando-se como proposta inovadora de análise de dados educacionais.

🔗 Confira também na Plataforma de Reuso de Dados.

  • Colocação Final: 33° colocado no Concurso Nacional de Reúso de Dados.
  • Disponível em: Resultado Final

📌 Objetivo

  • Extrair, transformar e analisar os dados do ENEM 2023.
  • Realizar tratamento e filtragem dos dados com PySpark no Google Colab.
  • Focar nos cursos: Direito, Medicina, Arquitetura e Urbanismo, Psicologia, Ciência da Computação e Engenharia Elétrica.
  • Visualizar insights em um dashboard interativo no Power BI Desktop.

🛠️ Tecnologias Utilizadas

  • Google Colab
  • Apache Spark (PySpark)
  • Power BI Desktop
  • Pandas (para exportação dos dados finais)
  • Google Drive

Base de Dados Tratada

📊 Análises Realizadas

  • Distribuição de notas por curso.
  • Desempenho por região e estado.
  • Comparativo entre gêneros.
  • Correlação entre nota da redação e desempenho geral.
  • Perfil dos candidatos interessados em cada curso.

🖼️ Visualização do Dashboard

image

image

image

🏆 Resultados

  • Reconhecimento oficial: Projeto homologado pela CGU no Concurso Nacional de Reúso de Dados, alcançando a 33ª colocação entre projetos de todo o país.

  • Processamento eficiente de dados: Tratamento e análise de grandes volumes de dados do ENEM 2023 usando PySpark no Google Colab, garantindo rapidez e eficiência no processamento de milhares de registros.

  • Insights estratégicos: Desenvolvimento de dashboards interativos no Power BI que permitem visualizar distribuição de notas, desempenho por estado, perfil dos candidatos e resultados por cotas, auxiliando estudantes e pesquisadores em decisões baseadas em dados.

  • Análise detalhada de cursos estratégicos: Foco em seis cursos de alto interesse, gerando informações acionáveis para cada perfil de candidato.

  • Organização e reprodutibilidade: Estrutura do projeto organizada no GitHub e Google Drive, garantindo reprodutibilidade e facilidade de manutenção para futuras análises.

About

Análise dos Dados do ENEM 2023 para Cursos Selecionados — Spark & Power BI. Projeto homologado pela CGU no Concurso de Reuso de Dados.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published