Este proyecto llevado a cabo para la materia Web Mining de la Maestría en Ciencia de Datos de la Universidad Austral.
scrap_pagina12_multiseccion.py: Scrapping sobre sitio web para extracción de noticias de 4 temáticas puntuales.de_html_a_tabla.py: Convierte páginas HTML de noticias en vectores de texto y guarda las fechas y categorías asociadas.entrenar_y_validar_v2.py``entrenar_y_validar_v2_con_fecha.py: Entrena un modelo Random Forest con y sin validación temporal, optimiza hiperparámetros y guarda los resultados (matriz de confusión y reporte de clasificación).
Scrapypandasscikit-learnmatplotlibseabornjoblib