Este projeto tem como objetivo explorar e visualizar os dados do Exame Nacional do Ensino Médio (ENEM) 2023 com foco em seis cursos de alto interesse, utilizando PySpark para e Power BI para criar dashboards interativos. A análise permite verificar quantos aprovados foram por cotas, a distribuição por estado, médias de notas, perfil dos candidatos e outras informações relevantes para apoiar estudantes e pesquisadores.
✅ Este projeto foi homologado pela Controladoria-Geral da União (CGU) no Concurso de Reúso de Dados Abertos, destacando-se como proposta inovadora de análise de dados educacionais.
🔗 Confira também na Plataforma de Reuso de Dados.
- Colocação Final: 33° colocado no Concurso Nacional de Reúso de Dados.
- Disponível em: Resultado Final
- Extrair, transformar e analisar os dados do ENEM 2023.
- Realizar tratamento e filtragem dos dados com PySpark no Google Colab.
- Focar nos cursos: Direito, Medicina, Arquitetura e Urbanismo, Psicologia, Ciência da Computação e Engenharia Elétrica.
- Visualizar insights em um dashboard interativo no Power BI Desktop.
- Google Colab
- Apache Spark (PySpark)
- Power BI Desktop
- Pandas (para exportação dos dados finais)
- Google Drive
- Distribuição de notas por curso.
- Desempenho por região e estado.
- Comparativo entre gêneros.
- Correlação entre nota da redação e desempenho geral.
- Perfil dos candidatos interessados em cada curso.
-
Reconhecimento oficial: Projeto homologado pela CGU no Concurso Nacional de Reúso de Dados, alcançando a 33ª colocação entre projetos de todo o país.
-
Processamento eficiente de dados: Tratamento e análise de grandes volumes de dados do ENEM 2023 usando PySpark no Google Colab, garantindo rapidez e eficiência no processamento de milhares de registros.
-
Insights estratégicos: Desenvolvimento de dashboards interativos no Power BI que permitem visualizar distribuição de notas, desempenho por estado, perfil dos candidatos e resultados por cotas, auxiliando estudantes e pesquisadores em decisões baseadas em dados.
-
Análise detalhada de cursos estratégicos: Foco em seis cursos de alto interesse, gerando informações acionáveis para cada perfil de candidato.
-
Organização e reprodutibilidade: Estrutura do projeto organizada no GitHub e Google Drive, garantindo reprodutibilidade e facilidade de manutenção para futuras análises.