Primeiro release oficial do projeto Fake News ETL
Este projeto executa um pipeline completo para coleta, limpeza, categorização e análise de notícias verificadas por sites de fact-checking, com foco em classificação das notícias por temas.
🔍 Principais componentes:
- Scripts de web scraping com Selenium e Playwright
- Classificação temática e de vereditos usando API do ChatGPT
- Análise exploratória com Python, Pandas, BERTopic e Plotly
- Dashboard final criado no Power BI
- Organização modular com uso de Makefile,
requirements.txte pastas padrão para dados
📁 Dados públicos:
Um arquivo CSV com as notícias classificadas está disponível em data/public/.
Este release marca a versão 1.0.0 com todas as etapas funcionais do pipeline implementadas.