Парсинг документов PEP

Описание

Данный парсер поможет собрать статусы документов PEP, а также получить информацию, сколько из них в каждом статусе.

Используемые технологии

Python 3.7
Scrapy (фреймворк для парсинга)

Установка

Клонируйте репозиторий

git clone https://github.com/lmashik/scrapy_parser_pep.git

Создайте и активируйте виртуальное окружение

python3.7 -m venv venv

Если у вас Linux/macOS
```
source venv/bin/activate
```
Если у вас windows
```
source venv/scripts/activate
```

Обновите pip до последней версии

python3 -m pip install --upgrade pip

Установите зависимости из файла requirements.txt

pip install -r requirements.txt

Запуск

Для запуска сбора информации о документах PEP, отправьте "паука" pep:

scrapy crawl pep

После завершения сбора информации в папке results появится два файла:

pep_yyyy-mm-ddThh-mm-ss.csv - все документы PEP с их статусами
status_summary_yyyy-mm-dd_hh-mm-ss.csv - количество документов PEP в каждом статусе

Автор проекта

Лапикова Мария Дмитриевна [email protected]

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
pep_parse		pep_parse
tests		tests
.flake8		.flake8
.gitignore		.gitignore
README.md		README.md
pytest.ini		pytest.ini
requirements.txt		requirements.txt
scrapy.cfg		scrapy.cfg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Парсинг документов PEP

Описание

Используемые технологии

Установка

Запуск

Автор проекта

About

Releases

Packages

Languages

lmashik/scrapy_parser_pep

Folders and files

Latest commit

History

Repository files navigation

Парсинг документов PEP

Описание

Используемые технологии

Установка

Запуск

Автор проекта

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages