Este repositório é dedicado aos meus projetos acadêmicos e pessoais, participação em Hackathons e artigos científicos que envolvem a área de Ciência de Dados.
Você pode acessar todos os meu projeto nesse arquivo ou acessar diretamente pelo link dos títulos dos projetos descritos abaixo.
Classificação NPS: Implementação do Algoritmo K-Nearest Neighbors (KNN) sem Bibliotecas Python
O objetivo foi desenvolver um código que replica o algoritmo K-Nearest Neighbors sem depender de bibliotecas Python. Os dados utilizados representam o histórico de compras de clientes em uma empresa de logística de entrega de alimentos, incluindo o valor gasto nas últimas 4 compras e a classificação NPS (Promotor, Neutro, Detrator). A ideia foi utilizar as últimas compras de clientes já classificados para estimar a classificação NPS daqueles que ainda não foram avaliados. Essa abordagem proporcionou uma previsão de satisfação com base nos padrões de gastos anteriores, sem recorrer a bibliotecas de machine learning.
Manipulação de JSON e Análise de Bounding Boxes com Python
Este projeto propõe uma solução para a análise e compreensão da comunicação por gestos. Ao examinar os gestos através de vetores e áreas de bounding box, a solução calcula de forma rápida a área média, mínima e máxima das bounding boxes, identificando gestos de maneira eficaz. O fato de processar matrizes em arquivos JSON, sem depender de bibliotecas complexas, destaca-se, proporcionando o reconhecimento de gestos. A solução gerencia dados de entrada, realiza cálculos usando funções nativas do Python (map, filter, reduce) e salva estatísticas em um arquivo CSV, tornando o projeto acessível.
Desenvolvimento e Análise de um Sistema de Banco de Dados
O objetivo do projeto foi a concepção do banco de dados, implementação através de SQL e análise dos dados da plataforma de streaming Foodie-Fi. Desenvolvemos o DER, criamos as tabelas e utilizamos os dados digitais no estilo de assinatura para responder a questões importantes do negócio. Analisamos a jornada de integração de clientes, destacando padrões de assinatura, preferências e comportamentos. Além disso, enfatizamos a importância de monitorar o churn e coletar feedback contínuo dos clientes para melhorar a satisfação e a receita.
Em abril de 2023, tive a oportunidade de participar do IV MIT Critical Data HIAE Datathon in Healthcare no Hospital Israelista Albert Einsten.
As equipes foram compostas por profissionais de ciência de dados, saúde e engenharia, sob orientação de mentores nacionais e internacionais. Nos dedicamos em um trabalho prático de análise de bancos de dados reais sobre genômica clínica para responder perguntas desafiadoras de forma colaborativa.
Você pode conferir a publicação no Linkedin sobre o evento aqui.
Os artigos mais relevantes estão listados abaixo. Se desejar conferir a lista completa de todos os meus artigos publicados, visite meu perfil no Google Scholar ou Research Gate.
Computer-aided autism diagnosis approach based on visual attention models using eye tracking: a replication study and improvement proposal
O artigo pode ser acessado aqui.
Assessment of vulnerability dimensions considering Family History and Environmental Interplay in Autism Spectrum Disorder
O artigo pode ser acessado aqui.
O artigo pode ser acessado aqui.
Classification of autism spectrum disorder severity using eye tracking data based on visual attention model
O projeto foi apresentado no 34th International Symposium on Computer-Based Medical Systems (CBMS) que aconteceu em Aveiro, Portugal. O artigo pode ser acessado aqui.
O projeto foi apresentado no 34th International Symposium on Computer-Based Medical Systems (CBMS) que aconteceu em Aveiro, Portugal. O artigo pode ser acessado aqui.