Skip to content

Fake News ETL – v1.0.0

Latest

Choose a tag to compare

@vhbitu vhbitu released this 04 Jul 19:31
· 3 commits to main since this release

Primeiro release oficial do projeto Fake News ETL

Este projeto executa um pipeline completo para coleta, limpeza, categorização e análise de notícias verificadas por sites de fact-checking, com foco em classificação das notícias por temas.

🔍 Principais componentes:

  • Scripts de web scraping com Selenium e Playwright
  • Classificação temática e de vereditos usando API do ChatGPT
  • Análise exploratória com Python, Pandas, BERTopic e Plotly
  • Dashboard final criado no Power BI
  • Organização modular com uso de Makefile, requirements.txt e pastas padrão para dados

📁 Dados públicos:

Um arquivo CSV com as notícias classificadas está disponível em data/public/.

Este release marca a versão 1.0.0 com todas as etapas funcionais do pipeline implementadas.