2. Resumen Hackathon OpenGov
GarageLab - UdeSA!
Durante Septiembre de 2010 participamos de la hackathon
OpenGov, organizada por GarageLab y la Universidad de San
Andrés, quien convocaba a Hackers(*) y a Cientistas Sociales a
elaborar herramientas para promover la transparencia en los
datos públicos. !
De ese encuentro de dos días de trabajo surgieron 4 proyectos,
vinculados a gasto público, registro de audiencias, información
georeferenciada sobre la cuenca matanza-riachuelo y análisis
de grupos de afinidad de legisladores según votaciones
nominales, éste último integrado por 7P.!
(*): Léase “informáticos con iniciativa”!
7puentes.com! Data Analytics sobre Votaciones Nominales!
3. Resumen Hackathon OpenGov
GarageLab - UdeSA!
http://garagelab.tumblr.com/post/1985840685/votosdiputados!
7puentes.com! Data Analytics sobre Votaciones Nominales!
4. Análisis de Legislaturas!
Objetivo: !
Construir una herramienta para el "
Análisis de Legislaturas.!
Análisis de votaciones nominales, descripción y predicción
de comportamiento, inducción de grupos de afinidad. !
Audiencia: !
- Investigadores en Ciencia Política!
- Periodistas especializados!
7puentes.com! Data Analytics sobre Votaciones Nominales!
5. Análisis de Grupos de Afinidad de
Legisladores!
¿Qué son 2 legisladores afines?!
Modelar y caracterizar a los actores y !
luego encontrar grupos de actores similares!
Según su forma/contenido:!
- Bloque, edad, sexo, provincia, comisión…!
- Según su comportamiento:!
- Co-firma en presentaciones de proyectos de ley!
- Votaciones Nominales "!
7puentes.com! Data Analytics sobre Votaciones Nominales!
6. Pipeline de análisis!
Recuperar y extraer la información de las fuentes!
Completar el modelo de datos !
Preparar los datos para el análisis!
Aplicar las técnicas y algoritmos!
Presentar los resultados!
7puentes.com! Data Analytics sobre Votaciones Nominales!
7. Grupos de actores
con características
similares.
En este caso, secuencia
de votos similares.
Matriz vis, similitud=votos
8. Inducción de metabloques,
grupo de legisladores con
patrones de votos similares
Heat map color=tipo_voto, filas=legislador,
columnas=votación, filas reordenadas
9. 2
1
Casos outliers, que quiebran el patrón común
1. la modificación al Código Civil incorporando el
matrimonio entre personas del mismo sexo;
2. Fondo del Bicentenario para el Desendeudamiento y
la Estabilidad (la utilización de reservas del tesoro
nacional para el pago de deuda externa, cuya discusión
llevó a la destitución/renuncia de Martín Redrado del
Banco Central);
http://bit.ly/9VPqCg !
10. Insights - eurekas!!
Votaciones outliers, fuera del patrón común.!
El meta-bloque de oposición.!
El comportamiento de bloques pequeños como Proyecto Sur.!
Membresía partidaria como principal descriptor.!
Caso Matrimonio Igualitario, donde se quiebra el patrón. !
Otras variables descriptivas y predictoras.!
Dimensionalidad del espacio de votaciones.!
Trabajo Futuro!
Desarrollar una herramienta de análisis interactiva.!
Sumar componente temporal al análisis.!
Especificar similitud de actores a partir de otras fórmulas.!
7puentes.com! Data Analytics sobre Votaciones Nominales!
11. Dimensionalidad y !
poder descriptivo de variables !
!
7puentes.com! Data Analytics sobre Votaciones Nominales!
12. Herramientas utilizadas!
Recuperación de datos: Se construyeron robots para la recuperación de las
planillas de votaciones nominales publicadas en el sitio del HCDN. Las planillas
están en formato PDF. Los robots fueron programados en Ruby utilizando librerías
de scrapping (open-uri, Hpricot)!
Preparación de datos: Se armaron pequeños programas de procesamiento de
textos para la traducción de formatos también en Ruby. Para trabajar con los
formatos PDF, se utilizó la librería pdfreader. !
Análisis: Se aplicaron técnicas de clustering, métodos de agrupamiento de
individuos según su similitud. En este proyecto se utilizaron las suites de Data
Mining Weka y CLUTO.!
Presentación y Visualización de Datos: Se aplicaron las metáforas visuales de
visualización de matrices, heatmaps y treemaps. Se utilizaron las herramientas
Protovis y ManyEyes. !
7puentes.com! Data Analytics sobre Votaciones Nominales!
14. Nuestra empresa – 7Puentes!
7Puentes está conformada por un equipo de jóvenes
profesionales de computación egresados de la
Universidad de Buenos Aires (UBA) con amplia
experiencia en el campo laboral y académico. !
Fundada en el año 2007 el objetivo de la empresa está
focalizado en soluciones de sofware y análisis de datos
de alto valor e investigación científica para el
tratamiento eficaz de información compleja.!
Contamos con experiencias exitosas de constucción de software y consultoría en el mercado
local e internacional; en la actualidad poseemos proyectos activos y propuestas en desarrollo. !
Nuestro grupo posee una organización horizontal y flexible lo que permite adaptarnos a la
magnitud y particularidad de cada proyecto de manera efectiva, valiéndonos de profesionales
en cada área específica. En nuestra historia hemos contado con la colaboración de expertos
de diferentes disciplinas como ciencias políticas, económicas y de la comunicación.!
7Puentes de Königsberg Gerli La empresa posee sus oficinas en Banfield, situadas al sur del
gran Buenos Aires, a 15 km. del obelisco porteño de la Ciudad Autónoma de Buenos Aires.!
7puentes.com! Data Analytics sobre Votaciones Nominales!
15. Nuestro Equipo!
Lic. Ernesto Mislej Responsable del área 7PLabs. Su área de experiencia profesional y académica
es en Inteligencia Artificial, Aprendizaje Automático y Visualización de Datos. Actualmente está
liderando proyectos en Opinion Mining. Es Lic. en Cs. de la Computación graduado de la Facultad
de Ciencias Exactas y Naturales de la UBA, donde se desempeña como docente en la maestría de
Data Mining & Knowledge Discovery y JTP del área Inteligencia Artificial en la licenciatura.!
Lic. Gabriela Perez Licenciada en Ciencia Política de la Universidad Nacional de Rosario (1999), se
especializó en Administración y Políticas Públicas en la Universidad de San Andrés (2001-2003). Fue
asesora parlamentaria en el H. Senado de la Nación (2002-2006). Desde entonces es consultora en
proyectos de cooperación internacional (Proyecto de Modernización del Estado (BIRF), 2006-2007 y
Proyecto de Fortalecimiento del Sistema de Protección de los Derechos Humanos (UE) desde 2008 y
continua), desarrollando tareas de investigación, análisis, planificación y coordinación de actividades. !
En conjunto trabajan en el Proyecto Ventura,
una herramienta de monitoreo de opinión pública
sobre temas políticos en la websocial; utilizando
tecnología de Text Analytics, recuperación y
procesamiento de textos, Procesamiento del
Lenguaje, Sentiment Analysis y Visualización de
Datos.
7puentes.com! Data Analytics sobre Votaciones Nominales!