jueves, 25 de noviembre de 2010

OpenData en Catalunya

Hace poco la Generalitat se sumó a las iniciativas de otros gobiernos para la apertura de datos y abrió un nuevo portal: http://opendata.gencat.cat

Como me interesa mucho el tema decidí hacer una buena ojeada al portal y explicar aquí mis opiniones al respecto. Y aquí están (más vale tarde que nunca).

Asi que vamos a ver las secciones del portal, luego los datos y finalmente algunas conclusiones que se me ocurren:

Secciones:
El portal está dividido en tres secciones: El catálogo, el proyecto en sí y además otra sección que habla del Open Data.

Vamos a ver la sección de catálogo:
Está muy bien organizada, los datos están en subsecciones bien clasificadas y con datos destacados. De momento 12 conjuntos de datos. Lógicamente son pocos, pero también estamos hablando de un portal nuevo que tiene poco tiempo de vida, sin duda vamos a ver como se van añadiendo más.

El siguiente punto es una lista de aplicaciones ya hechas. Esto es muy importante de cada al ciudadano ya que permite demostrar que la apertura de datos es útil y que realmente aporta valor. Todas las aplicaciones (al menos eso me parece) están hechas por la Generalitat. Realmente me ha gustado que incorporaran esta sección ya que si no se corre el riesgo de que se haga la pregunta: "Y esto, para qué sirve?", aquí tienes la respuesta en forma de 8 aplicaciones prácticas. Espero que pronto pueda participar yo también!

Por si esta subsección no fuera suficiente para demostrar la utilidad del opendata para el ciudadano de a pie tenemos otra subsección con enlaces a proyectos en curso, unas quince aplicaciones más que utilizan los datos (todas impulsadas por la Generalitat parece).

El proyecto:
La siguiente sección es bastante sencilla, se explica qué es el proyecto y también una explicación del acuerdo de gobierno que ha hecho posible la creación del porta. Bueno muy bien, supongo que tenía que salir a algún lado, pero vamos a la sección interesante importante, la licencia.

No soy ningún experto, pero creo que son las que deben ser. Agradecería si algún experto en el tema me lo pudiera confirmar, pero lo más importante es para mi:
Reconeixement (by): Es permet qualsevol explotació de l'obra, incloent-hi una finalitat comercial, així com la creació d'obres derivades, la distribució de les quals també està permesa sense cap restricció.
y
Reconeixement - SenseObraDerivada (by-nd): Es permet l'ús comercial de l'obra però no la generació d'obres derivades.
Las dos Creative Commons.

Qué es Open Data
La última sección es un poco más de información sobre que es el Open Data, los diferentes formatos que existen y experiencias en otros paises, temas de los que ya he ido hablando en este blog, por lo que no me voy a enrollar mucho más. Vamos a otro tema más interesante, los datos que el portal ofrece:

Los Datos
Tenemos ocho secciones:

Trámites y procedimientos administrativos: 
  • Tenemos 2 datasets, uno para trámites ciudadanos y otro para trámites de empresas, los dos en RDF. Después de echarle una ojeada al fichero veo que utilizan un redireccionador para las ontologías de términos (http://purl.org, yo no lo conocía pero está bien la idea). El fichero RDF está muy bien hecho, como dijo alguien en Twitter (ahora no me lo hagáis buscar por favor) el fichero está tan bien que se puede leer. Esto es mucho, recordad que hablamos de ficheros RDF. 

Datos estadísticos: Esta sección nos ofrece unos links a la API REST de Idescat. Hice un wrapper de esta API en Java, la podéis encontrar en Github y la intento mantener al día con los cambios de la API (y lógicamente doy la bienvenida a cualquier tipo de colaboraciones).
  • Indicadores económicos: Diferentes datos económicos.
  • Poblaciones y muncipios de Catalunya: Lista de las poblaciones de Catalunya.
  • Rectificaciones de Idescat: Y rectificaciones de datos.

Datos geográficos y cartográficos:
  • Equipamientos de Catalunya: Otro fichero RDF (cuidadín que es grande, si lo intentais abrir con el navegador a lo mejor os fríe la máquina). Este fichero contiene los datos sobre 26000 equipamientos (escuelas, hospitales, bibliotecas...) como son teléfonos, horarios, direcciones. Un lujo vaya.
  • Cartografía de Catalunya: Mapas, muchos mapas, en formatos que yo desconozco.
  • Servicios de posicionamiento geodésico: También formatos muy raros :P

Datos visuales:
  • Imágenes y videos de Catalunya: Links a una API y una página web dónde puedes decargarte fotos y videos sobre Catalunya.

Datos lingüsticos:
  • Terminologia Abierta: Aquí podemos encontrar muchos XML's clasificados en areas temáticas con su traducción al catalán, español, francés e inglés. 

Datos Metereologicos:
  • Predicciones: Ficheros XML con las predicciones metereológicas en diferentes zonas de Catalunya.

Datos de actualidad:
  • Noticias: RSS's con las noticias de las diferentes areas de la Generalitat. 

Tránsito y mobilidad:
  • Transporte público: RSS's con las noticias de diferentes linias de Regionales (de la Generalitat) 

Mis conclusiones: 
Estoy muy contento que la Generalitat haya realizado este esfuerzo, lógicamente aún está muy lejos de monstruos com data.gov.uk (del Reino Unido) o data.gov (de U.S.A.) es un primer paso.

Los datos, aunque pocos aún, están muy bien estructurados y los formatos son los que tocan, de momento no me he encontrado ninguna sorpresa ni ninguna macro.

Sin duda ahora lo que toca es crear una buena comunidad que aporte ideas y lo más importante, aplicaciones reales para mejorar la situación ciutadana.

A raiz de esto estoy pensando en ampliar mi proyecto en github para hacerlo un poco más general y aportar mi granito de arena al #opendata Catalán. Si alguien se anima ya sabe a dónde encontrarme!

lunes, 22 de noviembre de 2010

Presentación en el HUGUK #7

La semana pasada hice una presentación en una de las reuniones de usuarios de Hadoop UK.

Se trató de utilizar el formato HFile fuera de su entorno, que es HBase. Os dejo la presentación en slideshare:



Espero que en poco tiempo pueda poner un link al video.