Este projeto integra a tese de doutorado intitulada:
"Ciência de Dados e Aprendizado de Máquina Aplicados ao Estudo de Variáveis Epidemiológicas da Hanseníase na Amazônia".
O estudo visa aplicar técnicas avançadas de Ciência de Dados e Aprendizado de Máquina para investigar o perfil clínico e epidemiológico de pacientes com hanseníase na região amazônica. Além disso, o modelo desenvolvido é genérico o suficiente para ser adaptado a outras doenças negligenciadas. 🌟
- Analisar variáveis clínicas e epidemiológicas para identificar padrões relacionados à hanseníase.
- Desenvolver um modelo genérico de aprendizado de máquina para identificação de perfis clínicos que possam ser aplicados a outras doenças negligenciadas.
- Oferecer suporte preventivo no diagnóstico e tratamento de pacientes com hanseníase.
- Coleta de Dados: Integração com fontes como Hansys, anamneses e buscas ativas.
- Processamento de Dados: Utilização de ferramentas como Python, SQL e Data Warehouse para organização e transformação dos dados.
- Modelo Dimensional: Estruturação de consultas e mineração de dados em PostgreSQL.
- Modelos Preditivos: Aplicação de clusterização e regressão para gerar insights clínicos.
A metodologia foi organizada em quatro etapas principais:
- Etapa 1 - Ideação: Definição da problemática e escopo do projeto.
- Etapa 2 - Investigação: Levantamento bibliográfico e definição do cenário de avaliação.
- Etapa 3 - Implementação: Tratamento e modelagem dos dados, incluindo a construção do modelo dimensional.
- Etapa 4 - Análise: Validação dos resultados preliminares e refinamento do modelo.
O Método Elbow foi utilizado para determinar o número ideal de clusters, indicando o ponto de inflexão no gráfico (Elbow Point). Isso ajudou a definir os agrupamentos mais adequados para as análises clínicas e epidemiológicas.
Este diagrama descreve o fluxo completo do projeto:
- Dataset: Integração com o Data Warehouse.
- Clusterização: Criação de agrupamentos baseados em variáveis clínicas.
- Modelos Preditivos: Utilização de regressão e CATREG para previsão e categorização.
- Diagnóstico Preventivo: Identificação de pacientes em potencial para ações preventivas.
- Publicações Científicas: Estudos publicados em PLOS Neglected Tropical Diseases e International Journal of Management and Decision Making.
- Modelo Genérico: Ferramenta adaptável a outras doenças negligenciadas.
"Combinando Ciência de Dados e Inteligência Artificial para transformar a saúde pública e salvar vidas." 🌍🩺



