Fashion AI - Deep Learning para Clasificación de Moda

Un sistema de clasificación de imágenes de moda utilizando deep learning con ResNet18 que clasifica productos en tres categorías: Ropa (Apparel), Accesorios (Accessories) y Calzado (Footwear).

Tabla de Contenidos

Visión General
Dataset
Estructura del Proyecto
Características Principales
Tecnologías Utilizadas
Arquitectura del Modelo
Preprocesamiento de Datos
Entrenamiento del Modelo
Evaluación de Resultados
API y Interfaz de Usuario
Pruebas Unitarias
Instalación y Uso
Resultados y Métricas
Futuras Mejoras
Contribuciones

Visión General

Este proyecto implementa un clasificador de imágenes de moda utilizando transfer learning con ResNet18. El sistema está diseñado para analizar imágenes de productos y clasificarlas en tres categorías principales:

Apparel (Ropa)
Accessories (Accesorios)
Footwear (Calzado)

La solución incluye una API RESTful construida con FastAPI y una interfaz gráfica moderna implementada con Gradio, permitiendo a los usuarios interactuar fácilmente con el modelo.

Dataset

Para este proyecto se utilizó el dataset Fashion Product Images (Small) de Kaggle:

Título: Fashion Product Images (Small)
URL: https://www.kaggle.com/datasets/paramaggarwal/fashion-product-images-small
Contenido: El dataset contiene imágenes de productos de moda con sus respectivos metadatos. Cada producto está identificado por un ID único (por ejemplo, 42431). La información detallada de cada producto se encuentra en el archivo styles.csv, que mapea los IDs a categorías de productos y otros atributos. Las imágenes correspondientes se almacenan en el formato images/42431.jpg.

El dataset proporciona una amplia variedad de productos de moda que incluyen prendas de vestir, accesorios y calzado, lo que lo hace ideal para entrenar nuestro clasificador de categorías principales.

Estructura del Proyecto

Fashion-AI/
├── config/
│   └── model_config.py       # Configuración global del modelo
├── data/
│   └── raw/
│       ├── images/           # Imágenes de entrenamiento
│       └── styles.csv        # Metadata de productos
├── models/
│   └── saved_models/
│       └── best_model.pth    # Modelo entrenado guardado
├── notebooks/                # Jupyter notebooks de análisis
├── reports/
│   ├── figures/              # Gráficos y visualizaciones
│   ├── metrics/              # Reportes de evaluación
│   └── visualizations/       # Visualizaciones de predicciones
├── src/
│   ├── api/
│   │   ├── app_gradio.py     # Interfaz Gradio
│   │   ├── main.py           # API FastAPI
│   │   └── model_service.py  # Servicio del modelo
│   ├── evaluation/
│   │   └── model_evaluation.py  # Evaluación del modelo
│   ├── models/
│   │   └── classifier.py     # Definición del modelo
│   ├── preprocessing/
│   │   └── image_preprocessing.py  # Preprocesamiento de datos
│   └── visualization/
│       └── prediction_analysis.py  # Análisis de predicciones
├── tests/                    # Tests unitarios
├── requirements.txt          # Dependencias
└── README.md

Características Principales

Clasificación precisa (99% de precisión) en tres categorías de productos de moda
Transfer Learning utilizando ResNet18 preentrenado
API RESTful para integración con otros sistemas
Interfaz gráfica con Gradio
Pipeline completo de preprocesamiento de imágenes
Pruebas unitarias exhaustivas para garantizar calidad del código
Evaluación extensiva del rendimiento del modelo

Tecnologías Utilizadas

PyTorch: Framework de deep learning para implementación y entrenamiento del modelo
FastAPI: Para la creación de la API RESTful
Gradio: Para la interfaz gráfica interactiva
Pandas: Para manipulación de datos y análisis
Pillow: Para procesamiento de imágenes
scikit-learn: Para métricas de evaluación
matplotlib/seaborn: Para visualizaciones
pytest: Para pruebas unitarias

Arquitectura del Modelo

El clasificador se basa en una arquitectura ResNet18 modificada:

class FashionClassifier(nn.Module):
    def __init__(self, num_classes=3):
        super(FashionClassifier, self).__init__()
        # Usar ResNet18 con pesos preentrenados
        self.model = models.resnet18(weights=models.ResNet18_Weights.DEFAULT)
        
        # Modificar la última capa para nuestras 3 clases
        num_features = self.model.fc.in_features
        self.model.fc = nn.Linear(num_features, num_classes)
    
    def forward(self, x):
        return self.model(x)

La arquitectura utiliza transfer learning, aprovechando el poder de representación de características aprendidas en ImageNet y adaptándolas específicamente para la clasificación de productos de moda.

Preprocesamiento de Datos

El pipeline de preprocesamiento incluye:

Carga de datos desde CSV y verificación de imágenes existentes
Redimensionamiento de imágenes a 224x224 píxeles
Normalización usando los parámetros estándar de ImageNet
Data augmentation para el conjunto de entrenamiento:
- Volteo horizontal aleatorio
- Rotación aleatoria
- Ajustes de brillo y contraste

def get_transforms(train=True):
    """Obtener transformaciones para las imágenes"""
    if train:
        return transforms.Compose([
            transforms.Resize((IMAGE_SIZE, IMAGE_SIZE)),
            transforms.RandomHorizontalFlip(),
            transforms.RandomRotation(20),
            transforms.ColorJitter(brightness=0.2, contrast=0.2),
            transforms.ToTensor(),
            transforms.Normalize(mean=[0.485, 0.456, 0.406],
                              std=[0.229, 0.224, 0.225])
        ])
    else:
        return transforms.Compose([
            transforms.Resize((IMAGE_SIZE, IMAGE_SIZE)),
            transforms.ToTensor(),
            transforms.Normalize(mean=[0.485, 0.456, 0.406],
                              std=[0.229, 0.224, 0.225])
        ])

Entrenamiento del Modelo

El proceso de entrenamiento utiliza:

Optimizador Adam con tasa de aprendizaje de 0.001
Función de pérdida CrossEntropyLoss
Early stopping guardando el mejor modelo según la precisión de validación
Monitoreo de métricas de entrenamiento y validación
Dropout para prevenir el sobreajuste

Evaluación de Resultados

El modelo alcanza métricas impresionantes:

Precisión global: 99%
Recall: 99%
F1-Score: 99%

Resultados de la Evaluación del Modelo
=====================================

              precision    recall  f1-score   support

     Apparel       0.99      1.00      0.99      4325
 Accessories       0.99      0.99      0.99      2165
    Footwear       1.00      1.00      1.00      1894

    accuracy                           0.99      8384
   macro avg       0.99      0.99      0.99      8384
weighted avg       0.99      0.99      0.99      8384

Número total de errores: 53

API e Interfaz de Usuario

API FastAPI

El sistema expone un endpoint para clasificación de imágenes:

POST /predict

Ejemplo de respuesta:

{
  "class": "Apparel",
  "confidence": 0.92,
  "probabilities": {
    "Apparel": 0.92,
    "Accessories": 0.05,
    "Footwear": 0.03
  }
}

Interfaz Gradio

La interfaz de usuario proporciona una experiencia interactiva para la clasificación de imágenes:

Subida intuitiva de imágenes
Visualización de resultados con barras de confianza
Ejemplos pre-cargados para demostración rápida

Pruebas Unitarias

El proyecto incluye pruebas unitarias exhaustivas para todos los componentes:

Tests del modelo y clasificador
Tests del servicio de predicción
Tests de preprocesamiento de imágenes
Tests de API y endpoints
Tests de la interfaz Gradio
Tests de integración

Para ejecutar las pruebas:

pip install pytest pytest-cov httpx
pytest

Instalación y Uso

Requisitos

Python 3.8+
PyTorch 2.0+
FastAPI 0.99+
Gradio 3.35+

Instalación

# Clonar el repositorio
git clone https://github.com/GreciaLH/Fashion-AI.git
cd Fashion-AI

# Instalar dependencias
pip install -r requirements.txt

Ejecución

python src/api/app_gradio.py

Resultados y Métricas

El modelo fue evaluado en un conjunto de datos de 8,384 imágenes y mostró un buen rendimiento:

Categoría	Precisión	Recall	F1-Score	Soporte
Apparel	0.99	1.00	0.99	4,325
Accessories	0.99	0.99	0.99	2,165
Footwear	1.00	1.00	1.00	1,894
Promedio	0.99	0.99	0.99	8,384

Futuras Mejoras

Implementar clasificación de subcategorías más específicas
Añadir detección de atributos (color, estilo, temporada)
Integrar recomendaciones de productos similares
Mejorar la interfaz con más opciones de análisis visual

Contribuciones

Las contribuciones son bienvenidas. Por favor, siga estos pasos:

Fork el repositorio
Cree una rama para su característica (git checkout -b feature/amazing-feature)
Commit sus cambios (git commit -m 'Add some amazing feature')
Push a la rama (git push origin feature/amazing-feature)
Abra un Pull Request

Nota: Este proyecto fue creado con fines educativos y de demostración. Las imágenes utilizadas pertenecen a sus respectivos propietarios.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Fashion AI - Deep Learning para Clasificación de Moda

Tabla de Contenidos

Visión General

Dataset

Estructura del Proyecto

Características Principales

Tecnologías Utilizadas

Arquitectura del Modelo

Preprocesamiento de Datos

Entrenamiento del Modelo

Evaluación de Resultados

API e Interfaz de Usuario

API FastAPI

Interfaz Gradio

Pruebas Unitarias

Instalación y Uso

Requisitos

Instalación

Ejecución

Resultados y Métricas

Futuras Mejoras

Contribuciones

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
config		config
notebooks		notebooks
reports		reports
src		src
tests		tests
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt
script.py		script.py

GreciaLH/Fashion-AI

Folders and files

Latest commit

History

Repository files navigation

Fashion AI - Deep Learning para Clasificación de Moda

Tabla de Contenidos

Visión General

Dataset

Estructura del Proyecto

Características Principales

Tecnologías Utilizadas

Arquitectura del Modelo

Preprocesamiento de Datos

Entrenamiento del Modelo

Evaluación de Resultados

API e Interfaz de Usuario

API FastAPI

Interfaz Gradio

Pruebas Unitarias

Instalación y Uso

Requisitos

Instalación

Ejecución

Resultados y Métricas

Futuras Mejoras

Contribuciones

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages