Perfilador

Reconstrução de identidades brasileiras a partir de dados públicos.

Sobre

Este repositório contém os experimentos e implementações desenvolvidos para o Projeto Final intitulado:

"Uma Abordagem para Elaboração de Identidades de Brasileiros baseada em Dados Públicos"
João Gabriel Hartmann – Curso Superior de Tecnologia em Segurança da Informação – UNISINOS
Orientador: Dr. Luciano Ignaczak

O projeto investiga como dados pessoais expostos em fontes públicas (registros governamentais, redes sociais, etc.) podem ser processados e estruturados para reconstrução de identidades, utilizando técnicas como OSINT e Processamento de Linguagem Natural (PLN).

Objetivos

Utilizar Open Source Intelligence (OSINT) e Extração de Informações (Information Extraction - IE) para identificação de pessoas a partir de dados públicos.
Demonstrar como entidades nomeadas e relações podem ser extraídas automaticamente com NER e Relation Extraction.
Avaliar a capacidade de um sistema automatizado de reconstruir perfis reais com alta precisão.
Conscientizar sobre riscos relacionados à privacidade e uso indevido de dados públicos.

Tecnologias e Ferramentas

Python 3.10.12

Pipeline do Projeto

1. Coleta de dados      → Identificação de fontes confiáveis e coleta de informações
2. Pré-processamento    → Limpeza, normalização e quebra em páginas de textos
3. Extração de dados    → Named Entity Recognition and Classification (NERC) e Relation Extraction
4. Avaliações           → Avaliação do Modelo e Avaliação de Remontagem de Identidade

Instalação

Recomenda-se o uso de um ambiente virtual. Para instalar as dependências:

pip install -r requirements.txt

Importante: o projeto utiliza a biblioteca nltk. Na primeira execução, será necessário baixar o pacote punkt:

import nltk
nltk.download('punkt')

Criação do banco de dados

O projeto utiliza SQLite como base de dados.

Para inicializar o banco:

sqlite3 database/perfilador.sqlite < database/schema.sql

Altere o caminho conforme o local desejado.
O script schema.sql está localizado em database/schema.sql.
O arquivo .db será criado automaticamente com as tabelas corretas.

Execução

Para executar o pipeline principal:

python main.py

Aviso Legal

Este projeto é exclusivamente acadêmico e educativo. Nenhum dado pessoal real é exposto ou utilizado com finalidades indevidas. Uso inadequado do código é de inteira responsabilidade do usuário.

Name		Name	Last commit message	Last commit date
Latest commit History 96 Commits
app		app
database		database
resources		resources
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Perfilador

Sobre

Objetivos

Tecnologias e Ferramentas

Pipeline do Projeto

Instalação

Criação do banco de dados

Execução

Aviso Legal

About

Uh oh!

Releases 1

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Perfilador

Sobre

Objetivos

Tecnologias e Ferramentas

Pipeline do Projeto

Instalação

Criação do banco de dados

Execução

Aviso Legal

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages