Plataforma cloud totalmente automatizada projetada para simular cenários reais de DevOps e SRE utilizando Terraform, Amazon EKS e GitOps.
Ambientes cloud modernos raramente falham por falta de ferramentas —
os principais problemas estão em:
- Deploys manuais e inconsistentes
- Configuration drift
- Falta de isolamento de rede
- Baixa observabilidade
- Infraestrutura difícil de manter
Este projeto foi construído para resolver esses pontos através de uma abordagem automatizada, previsível e resiliente.
Uma plataforma cloud-native baseada em:
- Infrastructure as Code (Terraform) → ambientes reproduzíveis
- Kubernetes (Amazon EKS) → orquestração escalável
- GitOps (ArgoCD) → deploy declarativo e automatizado
- Observabilidade (Prometheus + Grafana) → visibilidade operacional
O sistema foi projetado para operar com mínima intervenção manual e comportamento previsível mesmo sob falhas.
- Workloads executando em subnets privadas (sem exposição direta à internet)
- Saída controlada via NAT Gateway
- Deploy distribuído em múltiplas AZs (alta disponibilidade)
- Git como fonte única da verdade
- Uso de serviços gerenciados para reduzir overhead operacional
- AWS VPC (CIDR customizado)
- Subnets públicas e privadas
- NAT Gateway e tabelas de rota
- IAM com princípio de menor privilégio
- Amazon EKS (v1.30)
- Managed Node Groups (Amazon Linux 2023)
- ArgoCD (controle GitOps)
- Helm (gerenciamento de aplicações)
- Prometheus (coleta de métricas)
- Grafana (visualização)
- Node Exporter (métricas de infraestrutura)
- Git Commit → ArgoCD detecta → Sync do cluster → Deploy automático
- Eliminação de deploy manual (
kubectl apply) - Correção automática de desvios (self-healing)
- Detecção de drift
- Versionamento completo de infra + aplicações
Este projeto inclui problemas reais encontrados em ambientes cloud:
- Problema: depreciação do
aws-auth ConfigMap - Solução: migração para Access Entries (API_AND_CONFIG_MAP)
- Resultado: controle de acesso nativo via IAM
- Problema: divergência entre estado e infraestrutura real
- Solução:
terraform state rmterraform import
- Resultado: reconciliação sem downtime
- Problema:
DependencyViolation - Causa raiz: dependência entre NAT Gateway e Elastic IP
- Resultado: entendimento do ciclo de vida dos recursos AWS
- Problema: subnets sem auto-assign public IP
- Resultado: correção do design entre subnets públicas e privadas
- Alta disponibilidade (multi-AZ)
- Segurança por isolamento de rede
- Deploy determinístico
- Observabilidade completa
- Redução de intervenção manual
terraform init -upgrade
terraform apply --auto-approve
aws eks update-kubeconfig --region us-east-1 --name devops-cluster
kubectl get nodes- Karpenter (autoscaling inteligente)
- Estratégias de FinOps (otimização de custos)
- Criptografia com KMS
- Pipeline CI/CD com GitHub Actions
- Policy as Code (OPA / Kyverno)
Gustavo Gomes Cloud & DevOps Engineer
Este projeto foi desenvolvido para fins educacionais e demonstração arquitetural.
Para uso em produção, recomenda-se:
- Hardening de segurança
- Controle de custos
- Validação de compliance
