Páginas

lunes, 20 de octubre de 2014

Datos abiertos como si fueran páginas HTML

La semana pasada asistí a una sesión informal de charlas divulgativas ofrecidas por personal científico del JRC. Los temas eran variados,  como open data, big data, social media, e incluso sobre la filosofía de la tecnología. 

La breve charla introductoria sobre Open Data fue eso, introductoria. Pero me llamo la atención que el ponente daba énfasis en a los catálogos centralizados de datos abiertos como elementos necesarios para que el movimiento de datos abiertos prospere. Por ejemplo, existe un catálogo a nivel europeo, a niveles nacionales, e incluso el JRC está creando su propio catálogo centralizado de datos abiertos.

A mi me da que la historia se repite otra vez.  Tenemos tantos ejemplos que demuestran que una estrategia de arriba a abajo no acaba de despejar. Lo que realmente funciona es cuando los usuarios toman el mando, de forma descentralizada y siguiendo una estrategia de abajo a arriba. 

Pongamos el ejemplo de la Web.  A principios de los 90, había un puñado de servidores que servían páginas html producidas por los propias proveedores, como el CERN y algunas universidades. Entonces no había problemas con tener un catálogo centralizado a modo de directorio para tener un índice de toda la Web. Pero el verdadero tipping point que propició la explosión de la web fue el momento en que las páginas html no las creaban y mantenían de forma centraliza unas pocas instituciones, sino que cualquiera podía crear y hacer publica su página html. Después vino el problema de encontrar el mecanismo de búsqueda adecuado, ya que un directorio centralizado de índices no escala adecuadamente cuando la Web alcance niveles grandes, ya no digo enormes como en la actualidad. 

Ahora con el Open Data parece que se repite los mismo fallos. Hay unos cuantos catálogos centralizados encargados de recopilar conjuntos de datos abiertos. Exceptuado algunos casos que de momento funcionan bastante bien (data.gov, data.gov.uk),  los datos recopilados son pocos y de poco interés para los ciudadanos. Provienen de las propias instituciones, que por diversas razones legales, costumbre, o lo que sea, no se sienten cómodos con el trabajo "extra" de subir hojas excel a un catálogo. Estas instituciones se vanaglorian de que son trasparentes y abiertas porque suben una veintena de ficheros excel indescifrables al año a un catálogo. ¿Por qué no dejar que los propios ciudadanos decidan que datos publicar como "open data"? ¿Por qué no permitimos que la publicación de datos abiertos sea universal y tan fácil como es la publicación de páginas html? ¿Por qué no dejar que los propios usuarios mantengan sus datos abiertos tal como hacen con sus propias paginas html? ¿Por qué seguimos empecinados en crear catálogos centralizados que son costosos de mantener actualizados y que no sirven de nada cuando se pasa de cientos a miles de millones de conjuntos de datos abiertos? 

Si queremos que el movimiento de datos abiertos se identifique con la idea de directorios de ficheros excel proporcionados por las administraciones de forma casi obligatoria y sin ningún incentivo, sigamos como hasta ahora. 

Si queremos que el movimiento de datos abiertos se convierta en algo tan grande como la web, tenemos que dejar que el agente de cambio sean los propios ciudadanos, que sean ellos los que hagan públicos los conjuntos de datos que les interesan. Si son interesantes, seguro que el propio ciudadano se preocupará de mantenerlos actualizados para que sean útiles para otros. 



No hay comentarios:

Publicar un comentario