Comentarios al Borrador del Manual Práctico de Reutilización de Información

Intro

Gracias al equipo del Proyecto Aporta por darnos la oportunidad de comentar y al trabajo realizado. Intentaré no extenderme demasiado ya que he visto muchas cosas publicadas y no merece la pena repetirse.

De todo lo que he visto hasta el momento quiero destacar los comentarios de Álberto Ortiz de Zárate III en los que hace una importante distinción entre documento y dato, los de Ángel Maldonado y su resumen del twitter-debate y finalmente los de Carlos Guadián sobre Open Government Data (OGD) en los que referencia varias iniciativas, más prominentemente en la que estoy más involucrado, la de eGovernment en W3C, y donde prácticamente me ha quitado la palabra de la boca, aunque recomiendo la lectura del borrador que W3C está desarrollando al respecto en el que se recopilan los problemas más habituales y se dan ejemplos y razones por las que fomentar el máximo y más sencillo uso de la información pública sin restricciones es beneficioso.

Sobre la transformación de información

Creo que ya se ha hablado suficientemente sobre la extensión y orientación del manual en el sentido de que cubre mucho más que la propia reutilización de la información y entra a un nivel de detalle propio de la gestión de los contenidos y sobre la necesidad de simplificar mucho algunas de las partes y los procesos para que los interesados puedan acceder a la información. En esta línea apoyo la idea de disociar las recomendaciones relacionadas con generar valor añadido sobre los documentos públicos de las recomendaciones para con la 37/2007.

Sobre el desarrollo del esquema de metadatos y la interoperabilidad

En la sección 3.3.2 sobre metadatos veo que se reutilizan algunos elementos de Inspire y Dublin Core, pero que se renombran. Creo que no es una buena idea por razones de interoperabilidad ya que constituye una bifurcación del estándar. Si no es evitable se debería estudiar, si no se ha hecho ya, otros esquemas para la reutilización de metadatos públicos que pudieran existir y contengan a éstos o en un último caso proporcionar mecanismos de mapeo y conversión bidireccionales entre el esquema Aporta y los esquemas estándar.

Un dato más sobre interoperabilidad, no encuentro referencias al Esquema Nacional de Interoperabilidad, mencionado en la 11/2007 y actualmente en desarrollo y con cuyas especificaciones el esquema Aporta y la información a reutilizar deberán concurrir. En todo caso se debería tener siempre en mente la publicación de datos puros y reutilizables automáticamente, en formatos libres y abiertos.

Sobre la distinción de documento y dato que mencioné al principio, una observación: en las ocasiones en que sea absolutamente imposible disponer del dato por separado (por ejemplo, un antiguo documento histórico) o en aquellas en las que se encuentre en un formato propietario, esto no debe ser excusa para la publicación de la información; es decir, idealmente datos pero si no es posible, lo que haya disponible.

Sobre la explotación del modelo de metadatos

Si bien me alegra que en la sección 3.3.3 sobre la explotación del modelo de metadatos referencie varios estándares abiertos de W3C, está desactualizada, contiene errores graves y necesita una importante revisión.

La manera de codificar datos en HTML expuesta está superada por los microformatos y sobre todo por RDFa. Recomiendo la consideración de SKOS como inminente estándar que podría facilitar la codificación del esquema Aporta. También hay claros errores de concepto como en p.138: “XML es mucho más flexible como forma de codificación que RDF/XML”. RDF/XML es una expresión de RDF en XML, es decir, es XML, por lo que no es ni más ni menos flexible, es igual. En todo caso, si fuera errata, sería al revés. RDF es más flexible que XML en el sentido que XML modela árboles de información, mientras que RDF modela grafos. En todo caso GRDDL permite la transformación de otros formatos, como microformatos o XML, en RDF.

También me preocupa la falta de mención de SPARQL, si se quiere, el SQL para el RDF. Si RDF va a ser el principal modo de codificar los metadatos Aporta, no puede faltar mención de su utilidad para la recuperación de datos y su integración en la Linked Data, así como recomendaciones a las administraciones para hacer disponibles esos metadatos mediante un SPARQL endpoint, definido formalmente como un HTTP Binding en SPARQL Protocol.

Finalmente se hecha en falta la promoción del desarrollo de un esquema de URI/URLs amigables que funcionen como un primer paso hacia el descubrimiento y consulta de la información a reutilizar (ejemplo simple sobre esquema legislativo en UK).

Colofón

La reutilización de la información del sector público puede ofrecer muchos beneficios y promover la innovación, como muchos otros ya han escrito. Para ello hay que minimizar las barreras de entrada. Como ejemplo, se estima que el retorno de la inversión del conocido concurso Apps for Democracy del Ayuntamiento del Distrito de Columbia (EE.UU.) en el que se promovía la idea de reutilización gratuita de datos públicos ofrecidos en formatos abiertos, pudo llegar a tener un retorno de 40 a 50 veces superior a la inversión realizada.

En mi opinión la receta tecnológica pasa por:

  1. esquema de URI/URLs amigables y fácilmente deducibles
  2. publicación del esquema de metadatos Aporta en RDF (SKOS)
  3. publicación de datos utilizando RDFa
  4. facilitación de SPARQL endpoints para el crawling de los datos

Quizás no se pueda llegar hasta el punto 4 de mano, pero se pueden ir sentando las bases. Los tres primeros puntos no son especialmente complicados aunque existe la necesidad de considerar los escenarios de aplicación, generar una metodología y buenas prácticas y seguirlas, ademá de la necesidad de capacitar al personal que tendrá que ponerlas en práctica. En este sentido muchas de las recomendaciones del reciente informe de la Power of Information Task Force (UK) no son específicas a su contexto, son de aplicación en otros países y deberían ser consideradas ya que ofrecen información muy valiosa.

Para acabar con algo menos técnológico quisiera decir que, aunque en España aún no existe una ley específica de acceso a la información (al estilo de la FOIA en el ámbito anglosajón), espero que la promesa del Presidente Zapatero se lleve pronto a cabo y que la Coalición Pro Acceso pueda conseguir su objetivo en lo que creo que es una pieza del puzzle que aún falta en este país.

4 Comments

  1. Gran analisis Josema! Importante que los puntos técnicos que argumentas (SPARQL, sintxis URI, etc..) queden reflejados en la guia de Aporta y en la del CENDOJ.

    En la jornada de ayer como verás en los comentarios de nuestro blog (http://blog.legalsolo.com/2009/04/conclusiones-preliminares-del-evento-reutilizacion-de-jurisprudencia-cendoj/) no llegamos al detalle que elaboras, pero en segundas jornadas esos datos serán de gran aportación.

    Estamos en contacto!

    Responder

    1. Gracias a todos. Borja, avísame con tiempo si mi presencia puede ayudar.

      Aún me pregunto como con las referencias que hay a CC nadie había puesto nada de RDFa…

      Responder

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s