Skip to content

lmashik/scrapy_parser_pep

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Парсинг документов PEP


Описание

Данный парсер поможет собрать статусы документов PEP, а также получить информацию, сколько из них в каждом статусе.


Используемые технологии

  • Python 3.7
  • Scrapy (фреймворк для парсинга)

Установка

  1. Клонируйте репозиторий
git clone https://github.com/lmashik/scrapy_parser_pep.git
  1. Создайте и активируйте виртуальное окружение
python3.7 -m venv venv
  • Если у вас Linux/macOS

    source venv/bin/activate
  • Если у вас windows

    source venv/scripts/activate
  1. Обновите pip до последней версии
python3 -m pip install --upgrade pip
  1. Установите зависимости из файла requirements.txt
pip install -r requirements.txt

Запуск

Для запуска сбора информации о документах PEP, отправьте "паука" pep:

scrapy crawl pep

После завершения сбора информации в папке results появится два файла:

  • pep_yyyy-mm-ddThh-mm-ss.csv - все документы PEP с их статусами
  • status_summary_yyyy-mm-dd_hh-mm-ss.csv - количество документов PEP в каждом статусе

Автор проекта

Лапикова Мария Дмитриевна [email protected]

About

Парсер документов PEP8 (scrapy)

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages