Este proyecto incluye varios notebooks y archivos para realizar análisis exploratorio de datos, modelado de regresión y análisis de clusterización. También contiene carpetas organizadas para la persistencia de modelos y datos relevantes.
├── EDA
│ ├── datos_clasificacion.csv
│ ├── df_standardized.csv
│ └── proy_escuela_dev.csv
├── Persistencia
│ ├── Regresion
│ ├── Clasificacion
│ └── Clusterizacion
├── N01_EDA.ipynb
├── N02_MODELO_NORMALIZED.ipynb
├── N02_MODELO_STANDARIZED.ipynb
├── N04_CLUSTERIZACION.ipynb
├── N04_2_CLUSTERIZACION_TEST.ipynb
├── requirements.txt
└── README.md
- Crea un entorno virtual utilizando Python:
python -m venv env
- Activa el entorno virtual:
source env/bin/activate
- Instala las dependencias necesarias:
pip install -r requirements.txt
El notebook N01_EDA.ipynb
contiene el análisis exploratorio de datos. Pasos para ejecutarlo:
- Abre el notebook en Jupyter:
jupyter notebook N01_EDA.ipynb
- Ejecuta las celdas para cargar y analizar los datos.
El notebook N02_MODELO_NORMALIZED.ipynb
realiza el modelado de regresión utilizando datos normalizados. Pasos para ejecutarlo:
- Abre el notebook en Jupyter:
jupyter notebook N02_MODELO_NORMALIZED.ipynb
El notebook N04_CLUSTERIZACION.ipynb
contiene el análisis de clusterización. Pasos para ejecutarlo:
- Abre el notebook en Jupyter:
jupyter notebook N04_CLUSTERIZACION.ipynb
El notebook N04_2_CLUSTERIZACION_TEST.ipynb
también realiza un análisis de clusterización de prueba para ver la relación entre aspectos sociales y académicos. Pasos para ejecutarlo:
- Abre el notebook en Jupyter:
jupyter notebook N04_2_CLUSTERIZACION_TEST.ipynb
Los modelos entrenados y otros objetos importantes se guardan en la carpeta Persistencia
.