Skip to content

🚀 Infra Doc Classifier – InteligĂȘncia Artificial para Infraestrutura Transforme pilhas de documentos tĂ©cnicos em conhecimento organizado com um classificador inteligente baseado em NLP e Transformers. Este projeto automatiza a leitura e categorização de documentos de infraestrutura (como energia, transporte, saneamento e mais) 🔧📄💡

Notifications You must be signed in to change notification settings

JaimeMartinsOliveira/infra-doc-classifier

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🚧 Infra Doc Classifier

Classificador de Documentos TĂ©cnicos de Infraestrutura utilizando NLP com Transformers 🚀

Este projeto tem como objetivo classificar automaticamente documentos tĂ©cnicos de infraestrutura, segmentando-os por setores como energia, transporte, saneamento, entre outros. Ideal para organizaçÔes que lidam com grandes volumes de textos tĂ©cnicos e desejam automação inteligente na triagem de conteĂșdos.


🧠 Tecnologias Utilizadas

  • 🐍 Python 3.10+
  • đŸ€— Transformers (Hugging Face)
  • 📊 Scikit-learn
  • 🧼 Pandas & NumPy
  • 📚 NLP e Tokenização
  • đŸ’» Interface CLI para classificação

📁 Estrutura do Projeto

# ├── data/                  # Pasta para armazenar os dados
# │   ├── raw/               # Dados brutos
# │   └── processed/         # Dados limpos e preparados
# ├── notebooks/             # Análises e testes exploratórios (Jupyter Notebooks)
# ├── models/                # Modelos treinados salvos
# ├── src/                   # Código-fonte do projeto
# │   ├── __init__.py
# │   ├── data_preprocessing.py
# │   ├── train_model.py
# │   ├── evaluate_model.py
# │   └── inference.py
# ├── app/                   # Interface interativa (Streamlit)
# │   └── app.py
# ├── requirements.txt       # DependĂȘncias do projeto
# ├── README.md              # Descrição do projeto
# └── .gitignore

Exemplo de bloco

đŸ–Œïž DemonstraçÔes Visuais

Interface Upload Exemplo de bloco Interface de Classificação
CLI Output Output

✹ Funcionalidades

  • đŸ“„ Upload e leitura de documentos .txt
  • 🧠 Classificação por setor com base no conteĂșdo
  • 📈 RelatĂłrio de performance do modelo
  • 💬 Feedback com mĂ©tricas de acurĂĄcia, precisĂŁo, recall, F1

⚙ Como Rodar Localmente

# Clone o repositĂłrio
git clone https://github.com/JaimeMartinsOliveira/infra-doc-classifier.git
cd infra-doc-classifier

# Crie um ambiente virtual
python -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# Instale as dependĂȘncias
pip install -r requirements.txt

# Execute o projeto
python init_project.py

đŸ§Ș Avaliação e Testes

ApĂłs o treinamento, vocĂȘ receberĂĄ mĂ©tricas detalhadas como:

  • ✅ AcurĂĄcia
  • 🎯 PrecisĂŁo
  • 🔄 Recall
  • 🧼 F1-score

đŸ€ ContribuiçÔes

Sinta-se à vontade para contribuir! Envie um Pull Request com melhorias, ou abra uma issue para discutir ideias. ✹


📄 Licença

Distribuído sob a licença MIT. Veja LICENSE para mais informaçÔes.


Desenvolvido com 💙 por Jaime Martins Oliveira

About

🚀 Infra Doc Classifier – InteligĂȘncia Artificial para Infraestrutura Transforme pilhas de documentos tĂ©cnicos em conhecimento organizado com um classificador inteligente baseado em NLP e Transformers. Este projeto automatiza a leitura e categorização de documentos de infraestrutura (como energia, transporte, saneamento e mais) 🔧📄💡

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages