В рамках данного кейса предлагается с помощью ИИ и машинного обучения поизучать отзывы людей на железнодорожные вокзалы Москвы. В рамках кейса предоставляются отзывы пользователей с Яндекс-карт, но возможно дополнительно использовать доступные в Интернет данные.
Что ожидается в качестве результата:
- Инфографика, наглядно демонстрирующая полученные командой результаты
- Доклад, представляющий эти результаты
- Код в Jupyter Notebook с анализом данных
В стартовом ноутбуке показывается, как получить доступ к датасету, первые шаги по его обработке с помощью доступных открытых моделей с HuggingFace и с помощью YandexGPT. Можно использовать данный ноутбук как оправную точку для выполнения задания, расширив его дополнительными идеями, например:
- Кластеризация отзывов
- Обучение своих моделей для классификации тематики отзывов
- Использование предобученных NER-моделей
- Подробный анализ отзывов с помощью LLM
Выполнять работу следует в Yandex DataSphere, клонировав туда этот репозиторий.