Congreso limita uso de datos oficiales para la creación de nuevas herramientas ciudadanas

TEDIC
Blog Datos Abiertos Democracia Software libre

Los portales oficiales del Congreso paraguayo tienen serios problemas de accesibilidad y usabilidad de sus datos, una suerte de “techo de vidrio” que limita los esfuerzos por la transparencia y la rendición de cuentas que lleva adelante este poder del Estado. Como resultado, frenan la creación de herramientas ciudadanas para apropiación y visualización de dichos datos. Si bien cualquier persona con acceso a Internet obtiene información de los sitios web del Legislativo, queda mucho por hacer para que esta información se pueda reutilizar y se adecue a estándares y principios discutidos en comunidades como las de la Alianza de Gobierno Abierto, Abrelatam y Open Data Research Network.

El caso de Parlamento Abierto, una iniciativa de TEDIC, es paradigmático. Desde el año 2013, nuestra organización trabaja con información del Congreso para que la gente acceda fácilmente a proyectos de leyes y datos de los representantes, así como sistemas de envío de mensajes a los legisladores, registro de votaciones de los diputados, entre otros. Esta herramienta Web es un ejemplo de cómo el acceso a información no sólo sirve para monitorear la labor de los representantes o investigar, sino también para crear tecnologías derivativas.

Pero nuestro equipo de desarrollo se ha encontrado con varios obstáculos para el desarrollo de Parlamento Abierto: desde problemas técnicos y de implementación, hasta dificultades de índole política. A continuación citamos algunos desafíos latentes.

Votaciones del Legislativo

Una de las necesidades que tiene la ciudadanía para poder ejercer su derecho a la información y más adelante realizar una elección de forma autónoma e informada es conocer cómo se comportan los legisladores a los que eligió y sus respectivos partidos: qué se decide y desde dónde, cuáles son las alianzas que mantiene. Dentro del Congreso paraguayo, tenemos dos situaciones que son pésimas.

Por un lado, la Cámara de Senadores no registra el voto nominal, lo que imposibilita saber qué votó cada senador electo por la ciudadanía. El voto nominal es el que deja registro del nombre y posición de cada legislador sobre los temas que se discuten y votan. Esto supone una enorme barrera a la transparencia, el análisis y la investigación y genera graves situaciones como el reciente recuento “erróneo” de las votaciones sobre una licitación a la empresa Tape Porã.

02 TEDIC Votos Senadores
Fuente: El Surtidor

Por otro lado, en el caso de la Cámara de Diputados, donde sí se registra el voto de forma nominal, los mismos se publican de una forma totalmente inaccesible. Esto es en listados HTML que incluyen unos archivos en un viejo formato de Microsoft llamado RTF. De esta forma se vuelve muy difícil procesarlos y obtener visualizaciones de cómo y qué se vota conforme pasa el tiempo.                                                                                                                     

Además del formato poco adecuado para la distribución de los datos, éstos no cuentan con referencias a otros datos proporcionados en el API del Sistema de Información Legislativa (SilPy). Por ejemplo, no se encuentran datos de los diputados, de las sesiones ni de los proyectos de ley que se votan en las sesiones.

A todo lo anterior, se agrega el hecho que los documentos RTF no tienen la misma estructura a lo largo del tiempo. Es decir, si se hace un programa informático que de alguna manera busque ciertos patrones o estructuras dentro del documento, el proceso arroja demasiadas fallas ya que quienes publican van cambiando su estructura, incluso a veces publicando en otros formatos como ser XLS o PDF.

Para que la transparencia, tan necesaria en el sistema político nacional, se vuelva una realidad, tanto la votación de senadores como la de diputados, deberían publicarse periódicamente y en un formato adecuado para poder ser procesados por terceros, como por ejemplo csv, o en forma de “servicio web” (web service).

Servicio de información legislativa (SilPy)

Cuando se diseña una interfaz de comunicación como por ejemplo una API se debe tener en cuenta quiénes van a utilizar dicha interfaz o quiénes son los usuarios, ya que el objetivo principal es servir datos de manera sencilla y ordenada para que las personas puedan construir otros sistemas, como programadores que crean aplicaciones y visualizaciones que sacan un mayor provecho a esos datos. Sin embargo, la forma de publicación del Congreso Nacional es problemática.

Demoraron años en generar una API y nuestros programadores tuvieron que recurrir a técnicas complicadas de navegación automática, cosecha y limpieza de información que ha dificultado enormemente el trabajo de desarrollo de Parlamento Abierto. Muy recientemente, se ha creado una API, pero con varios problemas que pasamos a describir en los siguientes apartados.

Ausencia de versionado de API

Sobre el primer punto, una de las precauciones que se debe tomar para los sistemas funcionando a lo largo del tiempo es el versionado de las APIs. Esto implica que cuando se introducen cambios que podrían interferir con el funcionamiento de algún sistema que habitualmente se comunica con la interfaz como es el caso de la plataforma Parlamento Abierto se procede a hacer el lanzamiento (‘release’) de una nueva versión, manteniendo así la “compatibilidad hacia atrás”. De lo contrario, todos los sistemas que se comunican con la API deberán rediseñar sus métodos de comunicación debido a esta falta de consideración.

A continuación presentamos un ejemplo para nuestro caso que ilustra el problema: a comienzos de 2016, el campo de donde se obtenían los detalles de tramitaciones se construía de la siguiente forma:

«appURL»:»http://sil2py.senado.gov.py/formulario/VerDetalleTramitacion.pmf?q=VerDetalleTramitacion/102398″                                                                                                                               

Actualmente, a mediados de 2016 es:                                                                             

«appURL»:»http://sil2py.senado.gov.py/formulario/FichaTecnicaExpediente.pmf?q=FichaTecnicaExpediente/102398″                                                                                                  

Como puede observarse, esta pequeña pero significativa discrepancia hace que la herramienta de extracción de datos de Parlamento Abierto deje de funcionar y los datos en la base de datos extraída anteriormente dejen de ser útiles.

Ausencia de filtros para búsquedas

Al no tener filtros para búsquedas, las mismas no pueden realizarse con el nivel de especificidad requerido, lo que resulta muy importante  la hora de procesar grandes volúmenes de datos. Sin filtros, uno está destinado a bajar todo el set de datos cada vez que quiera actualizar algo, y en última instancia aplicar los filtros localmente.

Información relevante fuera de la API

Mucha información relevante no se encuentra en la API, sino que se obtiene un enlace que lleva al sitio Web donde realmente se encuentra dicha información. Esto dificulta mucho la posibilidad de trabajar y procesar esos datos.

Por otra parte, todos los “documentos” se publican en formato PDF rasterizados o DOC escaneados sin texto que pueda procesarse de forma sencilla y esto prácticamente imposibilita la extracción de datos.

Información confusa y errónea en la Web oficial del Congreso

Algunos datos sobre actuaciones y/o actividades del Congreso en muchos casos no coinciden en diferentes partes de la Web oficial del Poder Legislativo. Esto genera serios problemas a la hora de analizar los hechos, lo que lleva a la confusión y desinformación.

Un ejemplo de esto es el proyecto de “Protección de la niños, niñas y adolescentes de contenidos nocivos en Internet”. El SilPy publica que el mismo se encuentra actualmente en trámite y que se prorroga 8 días para su tratamiento. Cabe destacar que este hecho nunca ocurrió.*

Captura de pantalla de 2016-08-10 16:04:04

Mientras tanto, en las publicaciones del orden del día y en prensa oficial de la Cámara de Diputados aparece como sancionada como ley en fecha 3 de agosto de 2016:

Captura de pantalla de 2016-08-10 15:56:12

Estos errores son graves a la hora de seguir el estado de los proyectos de ley en los sistemas oficiales, tanto para el usuario como cualquier herramienta que utiliza los  datos del SILPy. La falta de actualización, coordinación, integración entre sistemas de la web oficial pone en duda la veracidad de la información y confunde al usuario, teniendo como resultado la desinformación.

Para poder existir, el proyecto Parlamento Abierto como cualquier tecnología hecha por ciudadanos con información legislativa, depende de los datos que publica el Congreso a través de sus portales oficiales. Las limitaciones que citamos más arriba deben ser reconocidas y superadas para que la transparencia sea más efectiva, y no se conviertan además en un obstáculo a la creación y la innovación.

*Fue subsanado una semana mas tarde luego de acercar nuestras consultas a un funcionario del Congreso.