Skip to content

Melhoria do Markdown em README.md #5

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Open
wants to merge 1 commit into
base: master
Choose a base branch
from
Open
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
38 changes: 16 additions & 22 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -22,7 +22,7 @@ Para construir o app delineamos algumas analíses possíveis em cima dos dados d
* MP da Grilagem
* Lei da Anistia de Dívida
* Lei Complementar 140
* Resultados das votações
* Resultados das votações
* Relatores dos projetos de lei
* Processos (Várias fontes)
* Muitas fontes diferentes, estão sendo levantados na mão para os ~80 candidatos com cartão vermelho (2x votaram a favor do código florestal)
Expand All @@ -31,28 +31,22 @@ Para construir o app delineamos algumas analíses possíveis em cima dos dados d

## Desafios
* Criar identificar único entre as bases do TSE e os dados da Câmara e do Senado
** Criei um script que usa fuzzy match para procurar os nomes, mas ainda existem ~200 deputados federais que vão precisar ser pareados e os outros precisam de revisão. A mesma coisa com o Senado.
* _Criei um script que usa fuzzy match para procurar os nomes, mas ainda existem ~200 deputados federais que vão precisar ser pareados e os outros precisam de revisão. A mesma coisa com o Senado._
* Criar um parser para extrair dados estruturados da declaração de bens de campanha
** Criei um script que usa expressões regulares, ainda não testei a eficácia dele e nem olhei para falsos posítivos... mas esta no caminho
* _Criei um script que usa expressões regulares, ainda não testei a eficácia dele e nem olhei para falsos posítivos... mas esta no caminho_
* Criar um sistema de georeferenciamento para as terras localizadas na declaração de bens
** O ideal, creio, é bater essa lista com uma lista de nomes de munícipios - vamos perder coisas, mas vai pegar bastante coisa. Da pra usar o compare.py para isso também.
* Localizar o CNPJ e/ou Razão Social das empresas levantadas. A lista montada só possui o nome 'fantasia' - aquele conhecido pelas pessoas. Rodei o compare .py ainda assim e não consegui achar bons matches.
* Aglutinar as bases do TSE em um único banco de dados. A sugestão é usar um banco de dados orientado a objetos, como Mongo ou CouchDB - não da muito trabalho, mas também não é muito rápido - então já é hora de por a mão na massa.

* _O ideal, creio, é bater essa lista com uma lista de nomes de munícipios - vamos perder coisas, mas vai pegar bastante coisa. Da pra usar o compare.py para isso também._
* Localizar o CNPJ e/ou Razão Social das empresas levantadas. A lista montada só possui o nome 'fantasia' - aquele conhecido pelas pessoas.
* _Rodei o compare .py ainda assim e não consegui achar bons matches._
* Aglutinar as bases do TSE em um único banco de dados.
* _A sugestão é usar um banco de dados orientado a objetos, como Mongo ou CouchDB - não da muito trabalho, mas também não é muito rápido - então já é hora de por a mão na massa._

## Links e outros
(XML da Câmara)[http://www.camara.gov.br/SitCamaraWS/Proposicoes.asmx/ObterVotacaoProposicao?tipo=PL&numero=1876&ano=1999]

(XML do Senado)[http://legis.senado.gov.br/dadosabertos/materia/100475]

(Scraper da Senado)[https://scraperwiki.com/scrapers/senado-votacoes/] - by Dani

(Scraper da Câmara)[https://github.com/barraponto/brazilian-camara-voting] - by Capi

(Scripts váriados)[https://github.com/pmarkun/bancadaruralista] - by Pedro

(Estrutura JSON)[https://gist.github.com/3730317] - by Daniel

(Planilha de organização)[https://docs.google.com/spreadsheet/ccc?key=0At9GzGQkNUDndEgyWGhGb2wxSXBlSnQ2V2d6VnVtZ1E] - by um monte de gente

(Dados no TSE)[http://www.tse.jus.br/eleicoes/repositorio-de-dados-eleitorais] - by TSE
- [XML da Câmara](http://www.camara.gov.br/SitCamaraWS/Proposicoes.asmx/ObterVotacaoProposicao?tipo=PL&numero=1876&ano=1999)
- [XML do Senado](http://legis.senado.gov.br/dadosabertos/materia/100475)
- [Scraper da Senado](https://scraperwiki.com/scrapers/senado-votacoes/) - by Dani
- [Scraper da Câmara](https://github.com/barraponto/brazilian-camara-voting) - by Capi
- [Scripts váriados](https://github.com/pmarkun/bancadaruralista) - by Pedro
- [Estrutura JSON](https://gist.github.com/3730317) - by Daniel
- [Planilha de organização](https://docs.google.com/spreadsheet/ccc?key=0At9GzGQkNUDndEgyWGhGb2wxSXBlSnQ2V2d6VnVtZ1E) - by um monte de gente
- [Dados no TSE](http://www.tse.jus.br/eleicoes/repositorio-de-dados-eleitorais) - by TSE