Skip to content
This repository has been archived by the owner on Feb 26, 2020. It is now read-only.

Latest commit

 

History

History
91 lines (55 loc) · 2.37 KB

README.md

File metadata and controls

91 lines (55 loc) · 2.37 KB

Este repositorio contiene utilidades para descargar y parsear las actas de votaciones nominales del Congreso de la Nación.

Parsear acta de votación (votaciones-parser)

Parser de actas de votaciones legislativas.

Requisitos

Python (>= 2.7)
pdftotext

Uso

Ejemplo:

$ ./parse_votaciones.py 130OP19_01_R22.pdf 130OP19_01_R22.json

Para ver las opciones de uso:

$ ./parse_votaciones.py -h

parse_votaciones.py [-h] [--outformat {csv,json}] [--keep-textfile]
                       infile [outfile]

positional arguments:
  infile                archivo PDF a procesar
  outfile               archivo de salida con la informacion procesada

optional arguments:
  -h, --help            show this help message and exit
  --outformat {json}
                        formato de salida
  --pretty-print        imprime una version legible de la información
  --keep-textfile       mantiene el archivo generado por pdftotext

parse_all_votaciones.sh

Es un shell script que invoca a parse_votaciones.py para todos los PDFs de un directorio

Uso

Ejemplo

$ ./parse_all_votaciones actas_2001-may2013 json

Descargar actas de votaciones

Descargar PDFs de votaciones nominales.

Requisitos

Python (>= 2.7)
BeautifulSoup (4.1.3)

Como usar

Ejemplo:

$ python get_votaciones.py --url http://www.diputados.gov.ar/secadmin/ds_electronicos/periodo/2013/index.html --folder votaciones_2013

Otras URL de ejemplo:
http://www.diputados.gov.ar/secadmin/ds_electronicos/periodo/2012/index.html
http://www.diputados.gov.ar/secadmin/ds_electronicos/periodo/2009/index.html
etc.

Para ver las opciones de uso:

$ python  get_votaciones.py --help

Descargar PDFs de votaciones nominales

optional arguments:
  -h, --help       show this help message and exit
  --folder FOLDER  Carpeta destino para PDF descargados
  --keep-links     Conservar links de PDF en un archivo llamado links.txt
  --url URL        URL del período de votaciones nominales Ej.: http://www.di
                   putados.gov.ar/secadmin/ds_electronicos/periodo/2013/index.
                   html

License

Junto con este proyecto, deberías recibir un archivo denominado LICENSE con los términos de la licencia.