bmm parlament scraper

A Figyuszhoz készült scraper, ami a parlament.hu-n megjelenő irományok közt keres kulcsszavakat vagy adatfrissítést.

Szöveges keresést az "Irományszöveg"-ben végez a scraper. Ha egyéb dokumentumok vannak feltöltve, azokban nem keres. Illetve csak "folyamatba lévő" állapotú irományokat figyel.

Dropdown menüből kiválasztható szűrőket használ.

A szűrők beállításainak sémáját az options_schema.json fájlban találod, amit a db-ben options_schema-nak kell beállítani az eventgenerators táblában. (a konkrét json fájlt nem használja semmit, csak azért van itt, hogy ne csak az adatbázisban legyen meg)

A scraper a parlament XML API-ját használja.

A forráskód a Kormány scraper-en alapszik, ami meg a Közlöny scraper-re alapszik.

Ha külföldi ip-jű szerverről szeretnénk futtatni a scriptet, amit a parlament.hu nem szeret, ezért szükség van proxyra. Socks proxy hostját a config Download.proxy_host értékének megadásával állíthatunk be.

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
templates		templates
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
add_eventgenerator.py		add_eventgenerator.py
bmm_parlamentscraper.py		bmm_parlamentscraper.py
bmmbackend.py		bmmbackend.py
bmmtools.py		bmmtools.py
config.ini.example		config.ini.example
install.py		install.py
options_schema.json		options_schema.json
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

bmm parlament scraper

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

bmm parlament scraper

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages