Skip to content

igorfalcao/Projeto_Hanseniase

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 

Repository files navigation

🩺 Projeto: Análise e Diagnóstico Clínico - Hanseníase

Este projeto integra a tese de doutorado intitulada:
"Ciência de Dados e Aprendizado de Máquina Aplicados ao Estudo de Variáveis Epidemiológicas da Hanseníase na Amazônia".

O estudo visa aplicar técnicas avançadas de Ciência de Dados e Aprendizado de Máquina para investigar o perfil clínico e epidemiológico de pacientes com hanseníase na região amazônica. Além disso, o modelo desenvolvido é genérico o suficiente para ser adaptado a outras doenças negligenciadas. 🌟


🎯 Objetivos do Projeto

  • Analisar variáveis clínicas e epidemiológicas para identificar padrões relacionados à hanseníase.
  • Desenvolver um modelo genérico de aprendizado de máquina para identificação de perfis clínicos que possam ser aplicados a outras doenças negligenciadas.
  • Oferecer suporte preventivo no diagnóstico e tratamento de pacientes com hanseníase.

📊 Pipeline do Projeto

img

Etapas do Pipeline:

  1. Coleta de Dados: Integração com fontes como Hansys, anamneses e buscas ativas.
  2. Processamento de Dados: Utilização de ferramentas como Python, SQL e Data Warehouse para organização e transformação dos dados.
  3. Modelo Dimensional: Estruturação de consultas e mineração de dados em PostgreSQL.
  4. Modelos Preditivos: Aplicação de clusterização e regressão para gerar insights clínicos.

🧠 Metodologia Utilizada

img

A metodologia foi organizada em quatro etapas principais:

  • Etapa 1 - Ideação: Definição da problemática e escopo do projeto.
  • Etapa 2 - Investigação: Levantamento bibliográfico e definição do cenário de avaliação.
  • Etapa 3 - Implementação: Tratamento e modelagem dos dados, incluindo a construção do modelo dimensional.
  • Etapa 4 - Análise: Validação dos resultados preliminares e refinamento do modelo.

🔍 Clusterização e Método Elbow

Identificação do Número Ideal de Clusters

img

O Método Elbow foi utilizado para determinar o número ideal de clusters, indicando o ponto de inflexão no gráfico (Elbow Point). Isso ajudou a definir os agrupamentos mais adequados para as análises clínicas e epidemiológicas.


📈 Fluxo de Processamento

img

Este diagrama descreve o fluxo completo do projeto:

  1. Dataset: Integração com o Data Warehouse.
  2. Clusterização: Criação de agrupamentos baseados em variáveis clínicas.
  3. Modelos Preditivos: Utilização de regressão e CATREG para previsão e categorização.

🚀 Resultados

  • Diagnóstico Preventivo: Identificação de pacientes em potencial para ações preventivas.
  • Publicações Científicas: Estudos publicados em PLOS Neglected Tropical Diseases e International Journal of Management and Decision Making.
  • Modelo Genérico: Ferramenta adaptável a outras doenças negligenciadas.

"Combinando Ciência de Dados e Inteligência Artificial para transformar a saúde pública e salvar vidas." 🌍🩺

About

Ciência de Dados e Aprendizado de Máquina Aplicados ao Estudo de Variáveis Epidemiológicas da Hanseníase na Amazônia

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors