Taxonomías en el Open Data: SKOS ¿Y eso qué es?????

Caja de cerveza SKOL Modificada. Para propósito educativo

Últimamente estoy escribiendo bastante sobre Open Data. Si no sabéis lo que es o no estáis familiarizados sobre los catálogos, os recomiendo empezar por la introducción al Open Data y posteriormente sobre la descripción de la arquitectura del Open Data.

También puede resultar interesante una reflexión sobre el gobierno abierto y el open data.

Dentro de la arquitectura del Open Data encontramos un elemento llamado SKOS Concept y ConceptScheme:

Modelo DCAT - Derechos reservados W3C reproducido para propósito divulgativo — Modelo DCAT – Derechos reservados W3C reproducido para propósito divulgativo

Dado que hay muchas preguntas al respecto, intento introducir SKOS y el Concept y Concept-Scheme.

SKOS son las siglas de Simple Knowledge Organization System o sistema simple de organización del conocimiento. Es un estándar para la definición de la estructura básica y el contenido de esquemas de conceptos como tesauros, esquemas de clasificación, taxonomías, etc. Está construido mediante RDF, que es un framework para definir recursos (‘cosas’ en internet).

Para entender qué es SKOS definamos primero la diferencia entre Vocabulario controlado y Tesauro:

Un vocabulario controlado es una lista de términos que una comunidad u organización ha acordado. Podrían ser por ejemplo los términos referentes a los principios activos de un medicamento: Paracetamol, Amoxicilina, etc.

Una taxonomía es un vocabulario controlado organizado en una jerarquía. Por ejemplo, podemos tener los términos fruta, vegetal y plátano en el cual plátano sería una subclase de fruta, que sería una subclase de vegetal.

Por último, un Tesauro es una taxonomía con más información acerca de cada concepto que incluye términos preferidos y alternativos («Banana» en Inglés, «Plátano» o «Banana» en español). Además un tesauro puede contener relaciones con conceptos relacionados, como las relaciones existentes entre fruta y banana. Básicamente un Tesauro es un diccionario de sinónimos, incluyendo las acepciones en otros idiomas.

Volvamos ahora a SKOS:Concept.

Los conceptos son las unidades de pensamiento las ideas, significados, o los objetos y eventos que subyacen en muchos sistemas de organización del conocimiento. Como tal, existen conceptos como entidades abstractas que son independientes de los términos utilizados para etiquetarlos. En SKOS, un Concept se utiliza para representar los elementos de un sistema de organización del conocimiento (términos, ideas, significados, etc.) o de estructura conceptual o la organización de un sistema de este tipo.

Vamos a aprenderlo con el ejemplo anterior. Creemos el primer concepto SKOS:

ex:Fruta  rdf:type  skos:Concept.

Hemos creado el Concepto Fruta. Vamos a añadirle información:

ex:Fruta rdf:type skos:Concept;
 skos:prefLabel "Fruit"@en;
 skos:prefLabel "Fruta"@es;
 skos:altLabel "Fruto"@es
 skos:narrower ex:Vegetal
 skos:narrower ex:Comida

Aquí estamos definiendo que ‘Fruta’ es un concepto con dos Términos, Fruit (que corresponde al inglés) y Fruta (que corresponde al español). Además, indicamos que es una especialización de dos conceptos: Vegetal y Comida. Por último también le comentamos que «Fruto» es un sinónimo en Castellano

ex:Plátano rdf:type skos:Concept;
 skos:prefLabel "Banana"@en;
 skos:prefLabel "Plátano"@es;
 skos:related ex:Potasio 
 skos:exactMatch ex:Banana

Aquí informamos que Plátano es exactamente igual que el concepto Banana, que podría ser otro concepto . Además, consideramos que el concepto ‘Plátano’ está relacionado con banana.

Un ConceptScheme es, por último, una agrupación de conceptos con sus relaciones.

Espero haber aclarado este complejo ‘concepto’ de SKOS.

27 octubre, 2015 0

¿Puede el Open Data hacer un mundo mejor?

El vídeo que presento hoy en el blog (subtitulado en español) es un video de allá por el 2006, en el que las palabras o el concepto ‘Open Data’ no eran de uso común, pero creo que es una gran demostración de lo que podemos descubrir gracias a los datos abiertos.

Para los no iniciados en el concepto de Open Data les recomiendo mi entrada del blog con una Introducción al Open Data y House of Data.

El video es motivados. Desmonta los conceptos que tenemos de países en vías de desarrollo y países del ‘primer mundo’. Explica, mediante los datos, cómo no se puede tratar igual a todos los países y establece una relación directa entre la salud y educación y el desarrollo económico.

Son videos como estos los que demuestran que el Open Data no es una moda, es una necesidad para hacer un mundo mejor.

19 junio, 2014 0

DCAT o la arquitectura de la información en el Open Data

Una de los puntos que más confunden cuando uno se aproxima al Open Data o Datos Abiertos es su arquitectura de información. Al principio, esta forma de componer la información es, para el no iniciado en el tema, algo confusa. En esta entrada espero aclarar cuál es la arquitectura habitual de los datos abiertos y veremos que es muy sencilla, el único problema que tenía por el momento es que toda esta arquitectura se definía fundamentalmente en las recomendaciones del W3C, que pueden ser algo tediosas de leer.