Этот репозиторий содержит исследование и сравнение двух основных подходов к анализу тональности текста: лексиконных методов и методов машинного обучения.
Проект реализуется в рамках семинара по обработке естественного языка (NLP)
Проект посвящен сравнению эффективности разных подходов к определению тональности текста:
-
Лексиконные методы:
- Использование готовых словарных баз (SentiWordNet, VADER)
- Оценка тональности на основе предопределенных списков слов с эмоциональной окраской
- Простота реализации и интерпретации результатов
-
Методы машинного обучения:
- Традиционные алгоритмы классификации (Naive Bayes, SVM, Random Forest)
- Нейросетевые подходы (LSTM, трансформеры)
- Требуют размеченных данных для обучения, но могут учитывать контекст