Análise comparativa das quatro lojas do e-commerce Alura Store para identificar qual loja possui o pior desempenho e deve ser recomendada para venda.
🌐 Ver Projeto Online (GitHub Pages)
- Sobre o Projeto
- Minha Jornada
- Principais Resultados
- Visualizações
- Recomendação Final
- Estrutura do Repositório
- Tecnologias Utilizadas
- Como Executar
- Dataset
- Metodologia
- Declaração de Uso de IA
- Autor
- Licença
Este projeto foi desenvolvido como parte do Challenge Data Science do programa Oracle Next Education (ONE) em parceria com a Alura.
O Sr. João possui uma rede de 4 lojas de e-commerce (Alura Store) e deseja vender uma delas para investir em um novo negócio. Como analista de dados, fui contratado para analisar o desempenho das lojas e recomendar qual deve ser vendida.
Analisar as seguintes métricas para cada loja e identificar a de pior desempenho:
- 💰 Faturamento total
- 📦 Categorias mais vendidas
- ⭐ Avaliação média dos clientes
- 🏆 Produtos mais e menos vendidos
- 🚚 Custo médio do frete
Sou gestor financeiro com 20 anos de experiência em gestão empresarial, atualmente em transição de carreira para Data Science e Cloud Computing. Este projeto faz parte da minha formação no programa Oracle Next Education (ONE) e do MBA em IA & Análise de Dados (SENAC).
Neste desafio, apliquei análise exploratória de dados para resolver um problema real de negócio: identificar qual loja de uma rede deveria ser vendida. Minha experiência em gestão me permitiu ir além dos números, contextualizando a recomendação com visão estratégica.
Como iniciante em programação, busco aprender continuamente e trocar conhecimento com a comunidade. Este repositório representa um passo concreto na construção do meu portfólio técnico — com transparência sobre meu nível atual e compromisso com a evolução constante.
| Loja | Faturamento Total | Participação | Ranking |
|---|---|---|---|
| Loja 1 | R$ 1.616.347 | 26,1% | 1º |
| Loja 2 | R$ 1.567.773 | 25,4% | 2º |
| Loja 3 | R$ 1.542.048 | 24,9% | 3º |
| Loja 4 | R$ 1.458.253 | 23,6% | 4º |
Métrica utilizada: Faturamento Total = Preço + Frete
| Loja | Média | Mediana |
|---|---|---|
| Loja 3 | 4,05 | 5,0 |
| Loja 2 | 4,04 | 5,0 |
| Loja 4 | 4,00 | 5,0 |
| Loja 1 | 3,98 | 5,0 |
A mediana 5,0 em todas as lojas indica alta concentração de avaliações máximas, sem diferencial competitivo claro.
| Categoria | Participação |
|---|---|
| Móveis | 20% |
| Eletrônicos | 19% |
| Brinquedos | 14% |
| Eletrodomésticos | 12% |
Mix pulverizado, sem categoria dominante.
A Loja 4 apresenta o menor faturamento, com R$ 1.458.253 (23,6% do total).
Mercado diversificado, com móveis (20%) e eletrônicos (19%) liderando.
Diferença entre a melhor e pior média é de apenas 0,07 ponto (~1,8%).
Liderança pulverizada: "Cômoda" lidera com apenas 2% do volume.
Frete médio varia de R$ 31 (Loja 4) a R$ 35 (Loja 1). Mediana global: R$ 16.
| Critério | Análise |
|---|---|
| Faturamento | Menor contribuição: R$ 1,46M (23,6% do total) |
| Avaliação | Média 4,00 — sem vantagem competitiva |
| Frete | Menor custo (R$ 31), mas não compensa o gap de receita |
| Mix de produtos | Pulverizado, sem alavancas claras para reversão |
Análise de sensibilidade: Mesmo considerando apenas preço (sem frete), a Loja 4 permanece na última posição.
Com base na minha experiência em gestão financeira, a decisão de vender a Loja 4 considera não apenas o menor faturamento, mas o custo de oportunidade: manter uma operação de baixo desempenho consome recursos (gestão, marketing, logística) que poderiam ser direcionados às lojas mais rentáveis.
A diferença de R$ 158 mil entre a Loja 4 e a Loja 1 representa capital que, reinvestido nas operações de melhor performance, pode gerar retorno composto superior à tentativa de recuperação da loja deficitária.
alura-store-latam-ds-challenge/
├── README.md # Documentação do projeto
├── LICENSE # Licença MIT
├── requirements.txt # Dependências Python
├── alura_store_latam_ds_challenge.ipynb # Notebook principal
└── images/ # Visualizações exportadas
├── 01_faturamento_por_loja.png
├── 02_vendas_por_categoria.png
├── 03_avaliacao_lojas.png
├── 04_top10_produtos_volume.png
└── 05_frete_medio_por_loja.png
| Tecnologia | Versão | Uso |
|---|---|---|
| Python | 3.10+ | Linguagem principal |
| Pandas | 2.0+ | Manipulação e análise de dados |
| Matplotlib | 3.5+ | Visualização de dados |
| Google Colab | - | Ambiente de desenvolvimento |
| unicodedata | stdlib | Normalização de texto |
- Python 3.10 ou superior
- pip (gerenciador de pacotes)
-
Clone o repositório
git clone https://github.com/thedrads/alura-store-latam-ds-challenge.git cd alura-store-latam-ds-challenge -
Crie um ambiente virtual (recomendado)
python -m venv venv source venv/bin/activate # Linux/Mac venv\Scripts\activate # Windows
-
Instale as dependências
pip install -r requirements.txt
-
Execute o notebook
jupyter notebook alura_store_latam_ds_challenge.ipynb
Os dados são carregados diretamente das URLs oficiais do desafio (repositório Alura):
| Loja | Registros | URL |
|---|---|---|
| Loja 1 | 2.359 | CSV |
| Loja 2 | 2.359 | CSV |
| Loja 3 | 2.359 | CSV |
| Loja 4 | 2.358 | CSV |
Total: 9.435 registros | 12 variáveis originais
| Coluna | Descrição | Tipo |
|---|---|---|
Produto |
Nome do produto | string |
Categoria do Produto |
Categoria (móveis, eletrônicos, etc.) | string |
Preço |
Preço do produto (R$) | float |
Frete |
Valor do frete (R$) | float |
Data da Compra |
Data da transação | date |
Vendedor |
Nome do vendedor | string |
Local da compra |
UF do comprador | string |
Avaliação da compra |
Nota de 1 a 5 | int |
Tipo de pagamento |
Forma de pagamento | string |
Quantidade de parcelas |
Número de parcelas | int |
lat |
Latitude | float |
lon |
Longitude | float |
O projeto segue o processo ETL + EDA:
┌─────────────────────┐ ┌─────────────────────┐ ┌─────────────────────┐
│ EXTRAÇÃO │ → │ TRANSFORMAÇÃO │ → │ ANÁLISE │
│ (4 CSVs) │ │ (Limpeza) │ │ (EDA) │
└─────────────────────┘ └─────────────────────┘ └─────────────────────┘
↓ ↓ ↓
• URLs oficiais • Normalização • Faturamento
• pd.read_csv() • Tipos corretos • Categorias
• Colunas padrão • Avaliações
• total_pago • Produtos
• Frete
- Extração: Carregamento dos 4 CSVs via URLs do repositório oficial
- Padronização: Normalização de nomes de colunas (acentos, snake_case)
- Transformação: Conversão de tipos (datas, numéricos)
- Cálculo: Métrica
total_pago = preço + frete - Análise: EDA com foco nas 5 métricas do desafio
- Visualização: 5 gráficos com Matplotlib
- Recomendação: Relatório final com indicação de venda
Este projeto foi desenvolvido com assistência de Inteligência Artificial Generativa.
| Aspecto | Descrição |
|---|---|
| Ferramenta | ChatGPT / Claude |
| Uso | Revisão de código, boas práticas, documentação |
| Responsabilidade | Toda análise e interpretação são do autor |
| Validação | Código compreendido e testado antes do uso |
- ✅ Revisão e melhoria de código (PEP 8)
- ✅ Sugestões de documentação (docstrings)
- ✅ Estruturação do README
- ✅ Boas práticas de visualização
- ✅ Análise e interpretação dos dados
- ✅ Decisões sobre métricas e metodologia
- ✅ Criação da recomendação final
- ✅ Validação de todos os resultados
- Princeton University - Disclosing the Use of AI
- Arizona State University - Acknowledging AI Usage
- AID Framework - AI Disclosure
Este projeto está alinhado à minha formação contínua em IA aplicada aos negócios, incluindo cursos como IA Aplicada aos Negócios – FGV e Generative AI for Productivity – Cornell.
![]() Fábio Andrade |
Programa: Oracle Next Education (ONE) + Alura
Trilha: Data Science
Este projeto está sob a licença MIT — consulte LICENSE para detalhes.
Desenvolvido por Fábio Andrade | Aberto a feedbacks e contribuições





