Comentarios al Borrador del Manual Práctico de Reutilización de Información

Intro

Gracias al equipo del Proyecto Aporta por darnos la oportunidad de comentar y al trabajo realizado. Intentaré no extenderme demasiado ya que he visto muchas cosas publicadas y no merece la pena repetirse.

De todo lo que he visto hasta el momento quiero destacar los comentarios de Álberto Ortiz de Zárate III en los que hace una importante distinción entre documento y dato, los de Ángel Maldonado y su resumen del twitter-debate y finalmente los de Carlos Guadián sobre Open Government Data (OGD) en los que referencia varias iniciativas, más prominentemente en la que estoy más involucrado, la de eGovernment en W3C, y donde prácticamente me ha quitado la palabra de la boca, aunque recomiendo la lectura del borrador que W3C está desarrollando al respecto en el que se recopilan los problemas más habituales y se dan ejemplos y razones por las que fomentar el máximo y más sencillo uso de la información pública sin restricciones es beneficioso.

Sobre la transformación de información

Creo que ya se ha hablado suficientemente sobre la extensión y orientación del manual en el sentido de que cubre mucho más que la propia reutilización de la información y entra a un nivel de detalle propio de la gestión de los contenidos y sobre la necesidad de simplificar mucho algunas de las partes y los procesos para que los interesados puedan acceder a la información. En esta línea apoyo la idea de disociar las recomendaciones relacionadas con generar valor añadido sobre los documentos públicos de las recomendaciones para con la 37/2007.

Sobre el desarrollo del esquema de metadatos y la interoperabilidad

En la sección 3.3.2 sobre metadatos veo que se reutilizan algunos elementos de Inspire y Dublin Core, pero que se renombran. Creo que no es una buena idea por razones de interoperabilidad ya que constituye una bifurcación del estándar. Si no es evitable se debería estudiar, si no se ha hecho ya, otros esquemas para la reutilización de metadatos públicos que pudieran existir y contengan a éstos o en un último caso proporcionar mecanismos de mapeo y conversión bidireccionales entre el esquema Aporta y los esquemas estándar.

Un dato más sobre interoperabilidad, no encuentro referencias al Esquema Nacional de Interoperabilidad, mencionado en la 11/2007 y actualmente en desarrollo y con cuyas especificaciones el esquema Aporta y la información a reutilizar deberán concurrir. En todo caso se debería tener siempre en mente la publicación de datos puros y reutilizables automáticamente, en formatos libres y abiertos.

Sobre la distinción de documento y dato que mencioné al principio, una observación: en las ocasiones en que sea absolutamente imposible disponer del dato por separado (por ejemplo, un antiguo documento histórico) o en aquellas en las que se encuentre en un formato propietario, esto no debe ser excusa para la publicación de la información; es decir, idealmente datos pero si no es posible, lo que haya disponible.

Sobre la explotación del modelo de metadatos

Si bien me alegra que en la sección 3.3.3 sobre la explotación del modelo de metadatos referencie varios estándares abiertos de W3C, está desactualizada, contiene errores graves y necesita una importante revisión.

La manera de codificar datos en HTML expuesta está superada por los microformatos y sobre todo por RDFa. Recomiendo la consideración de SKOS como inminente estándar que podría facilitar la codificación del esquema Aporta. También hay claros errores de concepto como en p.138: «XML es mucho más flexible como forma de codificación que RDF/XML». RDF/XML es una expresión de RDF en XML, es decir, es XML, por lo que no es ni más ni menos flexible, es igual. En todo caso, si fuera errata, sería al revés. RDF es más flexible que XML en el sentido que XML modela árboles de información, mientras que RDF modela grafos. En todo caso GRDDL permite la transformación de otros formatos, como microformatos o XML, en RDF.

También me preocupa la falta de mención de SPARQL, si se quiere, el SQL para el RDF. Si RDF va a ser el principal modo de codificar los metadatos Aporta, no puede faltar mención de su utilidad para la recuperación de datos y su integración en la Linked Data, así como recomendaciones a las administraciones para hacer disponibles esos metadatos mediante un SPARQL endpoint, definido formalmente como un HTTP Binding en SPARQL Protocol.

Finalmente se hecha en falta la promoción del desarrollo de un esquema de URI/URLs amigables que funcionen como un primer paso hacia el descubrimiento y consulta de la información a reutilizar (ejemplo simple sobre esquema legislativo en UK).

Colofón

La reutilización de la información del sector público puede ofrecer muchos beneficios y promover la innovación, como muchos otros ya han escrito. Para ello hay que minimizar las barreras de entrada. Como ejemplo, se estima que el retorno de la inversión del conocido concurso Apps for Democracy del Ayuntamiento del Distrito de Columbia (EE.UU.) en el que se promovía la idea de reutilización gratuita de datos públicos ofrecidos en formatos abiertos, pudo llegar a tener un retorno de 40 a 50 veces superior a la inversión realizada.

En mi opinión la receta tecnológica pasa por:

  1. esquema de URI/URLs amigables y fácilmente deducibles
  2. publicación del esquema de metadatos Aporta en RDF (SKOS)
  3. publicación de datos utilizando RDFa
  4. facilitación de SPARQL endpoints para el crawling de los datos

Quizás no se pueda llegar hasta el punto 4 de mano, pero se pueden ir sentando las bases. Los tres primeros puntos no son especialmente complicados aunque existe la necesidad de considerar los escenarios de aplicación, generar una metodología y buenas prácticas y seguirlas, ademá de la necesidad de capacitar al personal que tendrá que ponerlas en práctica. En este sentido muchas de las recomendaciones del reciente informe de la Power of Information Task Force (UK) no son específicas a su contexto, son de aplicación en otros países y deberían ser consideradas ya que ofrecen información muy valiosa.

Para acabar con algo menos técnológico quisiera decir que, aunque en España aún no existe una ley específica de acceso a la información (al estilo de la FOIA en el ámbito anglosajón), espero que la promesa del Presidente Zapatero se lleve pronto a cabo y que la Coalición Pro Acceso pueda conseguir su objetivo en lo que creo que es una pieza del puzzle que aún falta en este país.

Anuncio publicitario

El porqué de este blog

La explicación corta: el twitter se me quedó corto.

La explicación larga: realmente el twitter se me quedó corto.

A lo largo de estos 16 años de uso de la Web, mi presencia en ella ha sido prácticamente siempre corporativa. Con la llegada de la ola 2.0 y tal he ido probando cosas nuevas, en varios casos empujado por amigos y colegas del trabajo, que si el LinkedIn, que si el Flickr, que si el del.icio.us, que si el Twitter… aunque lo intenté, evitar alguna que otra cosa va calando y le voy encontrando la utilidad; de hecho de algunos sitios soy usuario asiduo. Varias de estas herramientas facilitan el entrar en un mayor número de conversaciones, aunque a veces intentar estar a todo es completamente imposible y me veo desbordado. En algunos casos he ido notando la necesidad de un algo más, que la herramienta se me quedaba corta y que necesitaba expresarme con un poco más de extensión y luego poder encontrar fácilmente aquello que había escrito, y llegué hasta aquí. Los que me conocen saben que me he resistido fuertemente.

Como con la edad me voy conociendo mejor, y se que no tengo mucho tiempo, interés, ni constancia para postear aquí a menudo, ya aviso que las actualizaciones llevarán una periodicidad errática y seguramente serán muy pocas.

Este rincón en la Web es un espacio personal en el que daré cierta rienda suelta a la imaginación y al estado de ánimo del momento y ocasionalmente en inglés. Como dice un amigo mío, es posible que ni siquiera yo mismo esté de acuerdo con las ideas aquí reflejadas al día siguiente de publicarlas. En todo caso, espero que alguna que otra cosa pueda ser de utilidad.

Para mejores fuentes de información sobre la Administración y Tecnología, puedes escoger de entre los de la blogosfera pública. Sobre el resto de temas, véte tú a saber, demasiado variados como para recomendar un único recurso…

Ah, se me olvidaba. Quien me conoce sabe que tiendo a ser muy franco en mis expresiones y en un blog personal no va a ser menos. Nunca es con mala intención y me disculpo por anticipado si por cualquier razón pudiera ofender a alguien.