Заказчик: KPMI - платформа по определению типа личности и подбору профессии с помощью искусственного интеллекта.
KPMI проводит опрос респондента для построения психотипа (аналог методики MBTI) и оценки удовлетворенности профессией.
Вопрос "Кем вы работаете?" в анкете открытый.
Для построения модели, прогнозирующей сферы деятельности, в которых респонтент сможет себя реализовать, необходимо привести значения открытого вопроса к ограниченному множеству значений -- справочнику профессий.
Описание этапов и результатов проекта в Wiki.
Файлы проекта:
datasets-- данныеexternal-- данные из внешних источниковabbreviation.csv- аббревиатурыextrastopwords.csv- дополнительные стоп-слова
processed-- обработанные данныеanswer-profession-match.csv-- результат классификации открытых вопросов
notebooks-- исследования проекта в формате Jupyter Notebook:eda.ipynb-- исследовательский анализ данныхcreate_dictionary.ipynb-- создание словарей для symspell и создание справочника профессийanswers_analysis.ipynb-- анализ признаков, выделенных из ответовanswers_classification.ipynb-- классифиакация ответов
reports-- отчетыsrc-- модули и утилитыdataanalyse_answers.py-- утилита выделения признаков из ответаextract_verbs.py-- утилита выделения глаголов из ответовpreprocess.py-- модуль с функциями препроцессинга текстов
environment.yml— параметры окружения (conda).
Данные являются собственностью заказчика и не включены в проект.