-
Notifications
You must be signed in to change notification settings - Fork 0
Resultados y Análisis de Palabras Clave
Ilustre Daniel edited this page Feb 23, 2025
·
4 revisions
Se evaluaron tres modelos de aprendizaje supervisado para la detección de noticias falsas, obteniendo los siguientes resultados principales:
- SVM con TF-IDF:
- Precisión: 0.58
- Recall: 1.00
- F1-Score: 0.74
- Comentario: Logró identificar todas las noticias falsas, pero su precisión se vio afectada debido a algunos falsos positivos.
- LightGBM:
- Precisión: 0.94 (Clase 0) y 0.76 (Clase 1)
- Recall: 0.58 (Clase 0) y 0.97 (Clase 1)
- F1-Score: 0.72 (Clase 0) y 0.85 (Clase 1)
- Accuracy: 0.81
- AUC-ROC: 0.87
- Comentario: Logró un buen balance entre precisión y recall, destacándose por su eficiencia y rápida ejecución.
- Multinomial Naive Bayes:
- Precisión: 0.91 (Clase 0) y 0.74 (Clase 1)
- Recall: 0.54 (Clase 0) y 0.96 (Clase 1)
- F1-Score: 0.68 (Clase 0) y 0.84 (Clase 1)
- Accuracy: 0.78
- Comentario: Ofreció buenos resultados considerando su simplicidad y rapidez, aunque su recall para la clase 0 fue menor.
El modelo seleccionado para las predicciones finales fue LightGBM, debido a su mejor equilibrio entre precisión y recall, así como su alto AUC-ROC de 0.87, lo que indica una capacidad sólida para diferenciar entre noticias falsas y verdaderas.
Para identificar las palabras más relevantes en la detección de noticias falsas, se realizó un análisis utilizando TF-IDF y N-grams, obteniendo los siguientes resultados:
- Palabras Clave en Noticias Falsas:
- Términos comunes: “revelan”, “exclusivo”, “alerta”, “impactante”, “última hora”.
- Características: Uso frecuente de lenguaje sensacionalista y afirmaciones exageradas.
- Palabras Clave en Noticias Verdaderas:
- Términos comunes: “oficial”, “confirmado”, “autoridades”, “informe”, “declaración”.
- Características: Lenguaje más objetivo y descriptivo, con menor uso de términos emocionales.
- Patrones Detectados:
- El uso de adjetivos y verbos en forma imperativa es más común en las noticias falsas.
- Las combinaciones de palabras (bigrams y trigrams) como “gobierno revela”, “última hora impacto” y “confirmado por autoridades” mostraron diferencias significativas entre clases.