Crear un script `preprocesar_datos.py` que - Compruebe si la base de datos ya se ha descargado y en caso negativo la descargue - Preprocese y tokenice los datos para poder utilizarlos en el modelo