В рамках хакатона Changellenge IT Cup 2026 реализован проект для сбора и подготовки данных из Yandex:
yandex_classic_search.pyклассический парсер выдачи;yandex_neuro_selenium.pyнейросетевой парсер через Selenium;class_map.jsonкарта парсинга;requirements.txtзависимости;.env.exampleшаблон конфигурации среды;
- Создайте виртуальное окружение:
python -m venv .venv .venv\Scripts\activate - Установите зависимости:
pip install -r requirements.txt - Запустите нужный скрипт:
python yandex_classic_search.py # или python yandex_neuro_selenium.py
yandex_classic_search.pyyandex_neuro_selenium.pyclass_map.jsonrequirements.txtREADME.md.env.example
По умолчанию результаты сбора сохраняются в папку exports/.
exports/query_coverage.csv,exports/domain_summary.csv,exports/sources.csvи т.п. (формат файлов зависит от сценария запуска).
Вам достаточно настроить .env локально по .env.example и запускать парсеры по шагам выше.