Descargue como PDF, TXT o lea en línea desde Scribd
Descargar como pdf o txt
Está en la página 1de 3
Linked Data para la creación de aplicaciones Web
Pedro Andrés Guerrero Pozo
Maestría en Gestión Estratégica de TI Universidad de Cuenca Cuenca, Ecuador [email protected]
La inclusión de estructuras semánticas en la Web
Abstract— dicha estructuración y finalmente se presentan algunas ha favorecido la formación de repositorios de datos conclusiones de este análisis. vinculados conocido como Linked Data. Esta tecnología, permite que los datos publicados en diferentes sitios sean II. REVISIÓN BIBLIOGRÁFICA comprensibles no sólo por las personas, sino también para A. Web semántica otros sistemas; y sobre todo, tengan la capacidad de ser La Word Wide Web en sus inicios era básicamente un reutilizados y enriquecidos. El presente trabajo profundiza conjunto grande de información estática, cuyo objetivo era los conocimientos sobre Linked Data, y analiza el potencial netamente informativo. Los contenidos se podían relacionar que representa la explotación de esta tecnología para la mediante la inclusión de hipervínculos, que simplemente creación de aplicaciones Web. redirigían a otra página estática con más información “suelta”. Palabras Clave: Linked Data; aplicaciones web; Web Posteriormente, la Web se tornó dinámica, permitiendo al Semántica; usuario interactuar con el sitio y “escoger” el contenido que deseaba obtener. Pero al final, la interpretación de dicho I. INTRODUCCIÓN contenido continuaba siendo una tarea netamente humana, La posibilidad de expandir la información que se publica siendo imposible automatizar esta tarea. en un sitio web, mediante su vinculación con uno o varios Debido a esta limitación, se buscó la forma de estructurar conjuntos de datos complementarios, establece una capacidad la información y es entonces cuando nace el concepto de Web casi infinita de crecimiento. A través de este mecanismo, un Semántica. Con esta tecnología, se pretende que la sitio que trata sobre un tema en concreto, podría aprovechar la información publicada en los diferentes sitios web sea información que se encuentra disponible en otro sitio web para comprensible tanto para las personas como para otros enriquecer su propio contenido. Sin embargo, para ello es sistemas, es decir, que las máquinas sean capaces de entender necesario estructurar la información, de manera tal, que pueda y utilizar la información disponible en la Web (Bravo y ser consultada y tenga un significado concreto dentro de un Redondo, 2004). contexto definido Con la capacidad de automatizar el reconocimiento de la Con esta idea en mente, hace su aparición un conjunto de información disponible en la web se abrieron nuevas mejores prácticas para la publicación y vinculación de posibilidades. Entre ellas, la utilización de sistemas contenidos estructurados denominado como Linked Data cognitivos, que permitan la generación de nuevo conocimiento (Bizer et al, 2009). Con Linked Data, se busca “socializar” la a partir de los datos estructurados semánticamente. Sin red, promoviendo la generación de nueva información a partir embargo, este conocimiento puede estar incompleto, pues los de datos existentes, convirtiendo a los usuarios no solo en datos anotados pueden no abarcar todos los aspectos del tema consumidores sino también en productores de información al que hacen referencia. Es entonces cuando se introduce el (Pedrinaci y Domingue, 2010). concepto de Linked Data, el cual añade un factor importante Este artículo se centra en describir la tecnología conocida en el crecimiento de la Web como un repositorio de como Linked Data y las ventajas de estructurar el contenido información: la vinculación y expansión del conocimiento. producido por las aplicaciones web mediante anotaciones B. Linked Data semánticas. Primero se presenta una breve descripción de la Web Semántica y Linked Data como entorno tecnológico. Al principio, la manera de acceder a información que se Posteriormente se presentan algunas herramientas que facilitan encontraba en otros sitios era mediante interfaces que los propietarios de dicha información hacían accesibles a los programadores de aplicaciones web. Dichas interfaces, nuevas fuentes de datos que sean de su interés sin mayor denominadas API, tienen un determinado formato mediante el esfuerzo y en tiempo de ejecución, únicamente siguiendo los cual se puede consultar y extraer información. Esto funciona enlaces, lo que es imposible en sistemas que no utilicen bien si únicamente se desea interactuar con un sitio en Linked Open Data ya que el acceso a sus bases de datos es particular, pero ¿qué sucede cuando se desea acceder a restrictivo. múltiples orígenes de información simultáneamente? Las En la figura 1 se puede apreciar una representación de la diferentes APIs Web dependen de mecanismos de red de Open Linked Data, donde cada nodo representa un identificación distintos, diferentes mecanismos de acceso y los conjunto de datos y cada flecha la existencia de una relación datos recuperados se representan en diferentes formatos entre dos conjuntos de datos. (Bizer, 2009). Para superar esta fragmentación, Tim Berners-Lee esbozó un conjunto de mejores prácticas para la publicación y vinculación de datos estructurados en la Web: los principios de Linked Data (Bizer, 2009). Estos principios básicamente dictaminan que a cada recurso de información se le debe asignar un identificador universal único (URI) y que debe ser accesible mediante HTTP. Además que sea posible seguir estas URI para obtener información adicional sobre dicho recurso. (Pedrinaci y Domingue, 2010). La red de datos de Linked Data puede ser vista como una capa adicional que está estrechamente relacionada con un documento web clásico y comparte las mismas propiedades (Bizer, 2009): Figure 1. Figura 1. Representación de la red de Open Linked Data en el 2007 ● Cualquiera puede publicar datos en la red de Linked Data. III. CLASIFICACIÓN DE LAS APLICACIONES DE LINKED DATA ● Las entidades se conectan por enlaces, creando un Las aplicaciones de Linked Data se pueden clasificar en grafo de datos global que se extiende por las dos categorías: fuentes de datos y permite el descubrimiento de ● Aplicaciones genéricas. nuevas fuentes de datos. ● Aplicaciones con dominio específico. ● Los datos son auto-descriptivos. Si una aplicación encuentra datos representados utilizando un C. Aplicaciones genéricas vocabulario desconocido, la aplicación puede Las aplicaciones de Linked Data que se encuentran dentro resolver las URI que identifica los términos del de la categoría de aplicaciones genéricas pueden procesar vocabulario con el fin de encontrar su definición. datos de cualquier dominio tópico. A su vez, las aplicaciones ● La red de datos es abierta, lo que significa que las genéricas se dividen en dos sub-clases (Bizer, 2009): aplicaciones pueden descubrir nuevas fuentes de ● Navegadores de Linked Data: Tal como los datos siguiendo los enlaces. navegadores web permiten navegar a través de páginas HTML, los navegadores de Linked Data permiten navegar entre repositorios de datos Debido a la adopción de los principios de Linked Data de siguiendo enlaces RDF. un gran número de proveedores de información, se forma un repositorio global multidisciplinario denominado como Linked ● Motores de búsqueda de Linked Data: Varios Open Data. Este proyecto contiene miles de millones de motores de búsqueda han sido diseñados para afirmaciones sobre lugares geográficos, personas, empresas, rastrear Linked Data siguiendo enlaces RDF, y libros, publicaciones científicas, películas, música, programas proveer de capacidades de consulta sobre la de televisión y de radio, genes, proteínas, fármacos y ensayos información resultante. clínicos, comunidades online, datos estadísticos, resultados de D. Aplicaciones con dominio específico censos, etc. (Bizer, 2009). Las aplicaciones de Linked Data que se encuentran dentro El crecimiento de la web de Linked Open Data se debe a de la categoría de aplicaciones con dominio específico cubren su naturaleza de red abierta. Las aplicaciones pueden descubrir las necesidades de comunidades de usuarios puntuales que requieren información sobre un tópico en particular (Bizer, obtiene información de una base de datos relacional a través 2009). Por ejemplo, una aplicación que obtiene la información de SQL. De esta manera, la aplicación puede enriquecer su del clima de sitios especializados para una determinada contenido, añadiendo datos traídos desde diferentes conjuntos ciudad; o una aplicación que recoge datos de tráfico a una de datos. determinada hora. El World Wide Web Consortium establece ciertas IV. EXPLOTANDO LINKED DATA PARA LA CREACIÓN DE recomendaciones para la publicación de contenidos en la web. APLICACIONES WEB Básicamente se trata de algunas políticas de acceso a la Para llevar a la práctica la explotación de los repositorios información, lo cual es necesario ya que al tratarse Linked de Linked Data para el enriquecimiento de una aplicación Data de una red abierta, la información va a estar disponible web, existen varias herramientas que permiten consultar, para cualquier persona. Dichas recomendaciones hablan de las extraer, o guardar datos estructurados semánticamente. Entre limitaciones que se tiene sobre la información a hacerse dichas herramientas se destacan dos que son ampliamente pública, el tipo de información que se debería publicar, los utilizadas entre quienes desarrollan aplicaciones web créditos que se deberían publicar a los propietarios de la enfocadas a Linked Data: información, los usos previstos para la misma y las responsabilidades de quien va a reutilizar la información ● LDSpider definiendo para que fines puede hacerlo. También recomienda ● JenaTDB el uso de la licencia Creative Commons, la cual es una licencia de copyright o derechos de autor. E. JDSpider Esta herramienta puede procesar una gran variedad de formatos incluyendo RDF/XML, Turtle, Notation3, RDFa y varios microformatos. Soporta varios métodos de rastreo y VI. CONCLUSIONES permite el almacenamiento de la información obtenida ya sea en archivos o en un almacén de datos RDF con Habiendo concluido la revisión de la tecnología Linked SPARQL/Update. Data para la creación de aplicaciones web se puede concluir que es una tecnología con un potencial de aprovechamiento F. JenaTDB superlativo, al dotar a nuestros sitios web con la capacidad de expandir la información que se presenta mediante la Esta herramienta es un almacén RDF que permite vinculación con repositorios de información complementaria. almacenar datos a través de SPARQL/Update y los hace visibles para consultas a través de SPARQL. REFERENCES [1] Bizer, C. (2009). The Emerging Web of Linked Data. Intelligent Systems, IEEE, 87-92. V. PUBLICACIÓN Y REUTILIZACIÓN DE LA INFORMACIÓN [2] Bizer, C., Heath, T., & Berners-Lee, T. (2009). Linked data-the story so far. International journal on semantic web and information systems, Una vez que los datos se encuentran disponibles para ser 1-22. consultados, es necesario manipularlos para obtener la [3] Bravo, C., & Redondo, M. (2004). Sistemas interactivos y colaborativos en la web. Universidad de Castilla La Mancha. información requerida por la aplicación web. Para ello existen [4] Pedrinaci, C., & Domingue, J. (2010). Toward the Next Wave of varios lenguajes con los cuales es posible realizar esta tarea, Services: Linked Services for the Web of Data. Journal of Universal sin embargo, SPARQL el cual es el lenguaje de facto usado Computer Science, 1694-1719. para ejecutar consultas sobre datos publicados en la Web.
Utilizando SPARQL se puede obtener información desde
un almacén de datos RDF de una manera similar a como se