Данный парсер поможет собрать статусы документов PEP, а также получить информацию, сколько из них в каждом статусе.
- Python 3.7
- Scrapy (фреймворк для парсинга)
- Клонируйте репозиторий
git clone https://github.com/lmashik/scrapy_parser_pep.git
- Создайте и активируйте виртуальное окружение
python3.7 -m venv venv
-
Если у вас Linux/macOS
source venv/bin/activate
-
Если у вас windows
source venv/scripts/activate
- Обновите pip до последней версии
python3 -m pip install --upgrade pip
- Установите зависимости из файла requirements.txt
pip install -r requirements.txt
Для запуска сбора информации о документах PEP, отправьте "паука" pep:
scrapy crawl pep
После завершения сбора информации в папке results появится два файла:
- pep_yyyy-mm-ddThh-mm-ss.csv - все документы PEP с их статусами
- status_summary_yyyy-mm-dd_hh-mm-ss.csv - количество документов PEP в каждом статусе
Лапикова Мария Дмитриевна [email protected]