EDA + Regresión Lineal | Proyecto de Análisis Predictivo
Este proyecto analiza si las características morfométricas de pingüinos permiten estimar la masa corporal mediante un modelo simple, interpretable y reproducible.
El análisis sigue un enfoque profesional orientado a decisiones, permitiendo identificar rápidamente el predictor más importante dentro del dataset.
Incluye:
- Exploración del dataset Palmer Penguins
- Análisis de correlaciones y patrones
- Modelo de regresión lineal OLS
- Validación de supuestos estadísticos
- Documentación ejecutiva (PACE + One Pager)
El modelo explica 76.9% de la variabilidad de la masa corporal usando una sola variable.
La longitud del pico es el predictor más fuerte de masa corporal, con una relación lineal positiva y altamente consistente.
- Cada 1 mm adicional en longitud del pico incrementa en promedio ≈141 g la masa corporal.
- R² = 0.769, confirmando buen ajuste y poder explicativo.
- Los supuestos del modelo (linealidad, normalidad, independencia, homocedasticidad) se cumplen satisfactoriamente.
- La longitud de la aleta también muestra correlación útil para futuros modelos multivariables.
Modelo Predictivo de Masa Corporal/
│
├── data/
│ └── penguins.csv
│
├── notebooks/
│ └── Modelo Predictivo de Masa Corporal.ipynb
│
├── reports/
│ ├── Modelo Predictivo de Masa Corporal.pdf
│ ├── PACE - Modelo Predictivo de Masa Corporal.pdf
│ ├── Resume Ejecutivo.pdf
│
├── images/
│ ├── dispersion_por_pares.png
│ ├── grafico_q-q.png
│ ├── histograma_de_residuos.png
│ ├── linea_de_regresion.png
│ └── valores_ajustados_vs_residuos.png
│
├── requirements.txt
│
└── EXECUTIVE_SUMMARY.md
| Tipo | Archivo |
|---|---|
| 📘 Notebook interactivo | Modelo Predictivo de Masa Corporal.ipynb |
| 📄 PACE (Metodología) | PACE - Modelo Predictivo de Masa Corporal.pdf |
| 📊 Resumen Ejecutivo | Resume Ejecutivo.pdf |
| 🗂 Dataset | penguins.csv |
- Clonar el repositorio
git clone https://github.com/fcamasca/modelo-predictivo-masa-corporal.git
- Crear entorno virtual (opcional)
python -m venv venv source venv/bin/activate # Linux/Mac venv\Scripts\activate # Windows
- Instalar dependencias
pip install -r requirements.txt
- Abrir el notebook
jupyter notebook notebooks/Modelo Predictivo de Masa Corporal.ipynb
- Python 3
- Pandas
- NumPy
- Seaborn
- Matplotlib
- Statsmodels
- Jupyter Notebook
Requisitos completos en
📦 requirements.txt
- Construir modelo multivariable.
- Evaluar diferencias predictivas por especie.
- Probar modelos no lineales para comparación.
- Crear dashboard interactivo.
Frankz Camasca
Analista de Datos | Data Analytics & Predictive Modeling
Proyecto de uso educativo y demostración profesional.

