Universidad Carlos III de Madrid
Computer Science
In this paper, we present an ontology-based system for managing emergency alert notifications. Our purpose is to generate emergency alerts that are accessible to different kinds of people, paying special attention to more vulnerable... more
In this paper, we present an ontology-based system for managing emergency alert notifications. Our purpose is to generate emergency alerts that are accessible to different kinds of people, paying special attention to more vulnerable collectives like impaired people. By adapting alerts to different devices and users, we can allow Emergency Management Systems (EMSs) to communicate with collectives like blind or deaf people who otherwise are unreachable by usual channels.
- by Pablo Acuña
- •
ABSTRACT The design of Emergency Management Systems is an activity that requires knowledge from various related domains for providing a more complete and usable solution. In this context, design patterns including knowledge from previous... more
ABSTRACT The design of Emergency Management Systems is an activity that requires knowledge from various related domains for providing a more complete and usable solution. In this context, design patterns including knowledge from previous experiences can be a useful source of information to support the development of this type of applications.
- by Pablo Acuña
- •
Se propone una metodología para la representación y generación automática de dominios e identificar de forma automática las estructuras de información . La técnica se centran en la identificación de relaciones de jerarquía principalmente,... more
Se propone una metodología para la representación y generación automática de dominios e identificar de forma automática las estructuras de información . La técnica se centran en la identificación de relaciones de jerarquía principalmente, pero también asociaciones y equivalencias entre los términos procedentes del lenguaje natural a partir de un corpus documental de un dominio concreto. Finalmente se ha desarrollado un experimento que emplea la metodología descrita para representar de forma automática el dominio de un corpus a partir de reutilización de software.
This notebook paper describes our participation in both tasks of the TREC 2011 Crowdsourcing Track. For the first one we submitted three runs that used Amazon Mechanical Turk: one where workers made relevance judgments based on a 3-point... more
This notebook paper describes our participation in both tasks of the TREC 2011 Crowdsourcing Track. For the first one we submitted three runs that used Amazon Mechanical Turk: one where workers made relevance judgments based on a 3-point scale, and two similar runs where workers provided an explicit ranking of documents. All three runs implemented a quality control mechanism at the task level, which was based on a simple reading comprehension test. For the second task we submitted another three runs: one with a stepwise execution of the GetAnotherLabel algorithm by Ipeirotis et al., and two others with a rule-based and a SVM-based model. We also comment on several topics regarding the Track design and evaluation methods.
- by Jorge Morato and +1
- •
- Crowdsourcing, TREC
We describe a pilot experiment to update the program of an Information Retrieval course for Computer Science undergraduates. We have engaged the students in the development of a search engine from scratch, and they have been involved in... more
We describe a pilot experiment to update the program of an Information Retrieval course for Computer Science undergraduates. We have engaged the students in the development of a search engine from scratch, and they have been involved in the elaboration, also from scratch, of a complete test collection to evaluate their systems. With this methodology they get a whole vision of the Information Retrieval process as they would find it in a real-world setting, and their direct involvement in the evaluation makes them realize the importance of these laboratory experiments in Computer Science. We show that this methodology is indeed reliable and feasible, and so we plan on improving and keep using it in the next years, leading to a public repository of resources for Information Retrieval courses.
This short paper describes four submissions to the Symbolic Melodic Similarity task of the MIREX 2010 edition. All four submissions rely on a local-alignment approach between sequences of n-grams, and they differ mainly on the... more
This short paper describes four submissions to the Symbolic Melodic Similarity task of the MIREX 2010 edition. All four submissions rely on a local-alignment approach between sequences of n-grams, and they differ mainly on the substitution score between two n-grams. This score is based on a geometric representation that shapes musical pieces as curves in the pitch-time plane. One of the systems described ranked first for all ten effectiveness measures used and the other three ranked from second to fifth, depending on the measure.
Music similarity tasks, where musical pieces similar to a query should be retrieved, are quite troublesome to evaluate. Ground truths based on partially ordered lists were developed to cope with problems regarding relevance judgment, but... more
Music similarity tasks, where musical pieces similar to a query
should be retrieved, are quite troublesome to evaluate. Ground
truths based on partially ordered lists were developed to cope with problems regarding relevance judgment, but they require such man-power to generate that the official MIREX evaluations had to turn over more affordable alternatives. However, in house
evaluations keep using these partially ordered lists because they
are still more suitable for similarity tasks. In this paper we
propose a cheaper alternative to generate these lists by using
crowdsourcing to gather music preference judgments. We show
that our method produces lists very similar to the original ones,
while dealing with some defects of the original methodology.
With this study, we show that crowdsourcing is a perfectly viable
alternative to evaluate music systems without the need for experts.
should be retrieved, are quite troublesome to evaluate. Ground
truths based on partially ordered lists were developed to cope with problems regarding relevance judgment, but they require such man-power to generate that the official MIREX evaluations had to turn over more affordable alternatives. However, in house
evaluations keep using these partially ordered lists because they
are still more suitable for similarity tasks. In this paper we
propose a cheaper alternative to generate these lists by using
crowdsourcing to gather music preference judgments. We show
that our method produces lists very similar to the original ones,
while dealing with some defects of the original methodology.
With this study, we show that crowdsourcing is a perfectly viable
alternative to evaluate music systems without the need for experts.
The development of the Semantic Web depends on agreed and unambiguous knowledge representations, on the availability and accessibility of knowledge, as well as on retrieval capabilities. The scarce agreement on knowledge representation... more
The development of the Semantic Web depends on agreed and unambiguous knowledge representations, on the availability and accessibility of knowledge, as well as on retrieval capabilities. The scarce agreement on knowledge representation and the lack of techniques to process semantic structures in web search engines makes it impossible a contextualized conceptual retrieval. These limitations imply that users must previously know the existence and location of this knowledge to be able to retrieve it. In consequence, different ad-hoc knowledge representations and metadata vocabularies, scarcely formalized and agreed on, have been published, which makes it difficult reuse and interoperability. The proposal has as its main goal the elaboration of web system to manage and retrieve heterogeneous semantic schemas by means of a multilevel ontological structure and the alignment with a reference ontology that makes it possible the conceptual retrieval and reuse of knowledge.
- by Juan Llorens and +1
- •
- Metadata, Concept Mapping, Semantic Web, Interoperability
La Web, durante muchos años, se ha perfilado como una solución para eliminar fronteras en la brecha digital. Algunas de las propuestas han sido aplicaciones como el acceso a la información por buscadores, traductores automáticos online... more
La Web, durante muchos años, se ha perfilado como una solución para eliminar fronteras en la brecha digital. Algunas de las propuestas han sido aplicaciones como el acceso a la información por buscadores, traductores automáticos online gratuitos; ordenadores para el Tercer Mundo como el proyecto promovido por Negroponte desde el MIT1; el acceso abierto a materiales docentes como el OCW2 y a contenido como la Wikipedia3 o el desarrollo de software libre4. En paralelo, se observa la aparición de factores no previstos en la propuesta inicial y que tienden a ampliar la brecha digital. A través de la Unión Europea se crea Quaero en 2006. Quaero se presenta como el buscador europeo que compita contra Google para eliminar el sesgo idiomático del buscador estadounidense. Otro aspecto es la falta de usabilidad de la futura Web Semántica que parece también crear una nueva frontera. Dentro de las más inquietantes, y menos referenciadas, se encuentra la manipulación económica y política de los recursos. En esta ponencia se hablará sobre su naturaleza y alguna de sus causas.
Indexing languages have traditionally been an essential tool for organizing and retrieving documental information. The inclusion of indexing languages into the digital environment leads to new frontiers, but also new opportunities. This... more
Indexing languages have traditionally been an essential tool for organizing and retrieving documental information. The inclusion of indexing languages into the digital environment leads to new frontiers, but also new opportunities. This study shows the historical evolution of the indexing languages and its application in document management field. We analyze diverse trends for their digital use from two perspectives: their integration with other digital and linguistic resources, and the adjustment of them into the Web environment. Finally, there is an analysis of how these languages are used in the Web 2.0 and the incorporation of ontologies in the Semantic Web.
- by Anabel Fraga and +3
- •
- Indexing Languages
The suitability of the algorithms for recognition and classification of entities (NERC) is evaluated through competitions such as MUC, CONLL or ACE. In general, these competitions are limited to the recognition of predefined entity types... more
The suitability of the algorithms for recognition and classification of entities (NERC) is evaluated through competitions such as MUC, CONLL or ACE. In general, these competitions are limited to the recognition of predefined entity types in certain languages. In addition, the evaluation of free applications and commercial systems that do not attend the competitions has been lightly studied. Shallowly studied have also been the causes of erroneous results. In this study a set of NERC tools are assessed. The assessment of the tools has consisted of: 1) the elaboration of a test corpus with typical and marginal types
of entities; 2) the elaboration of a brief technical specification for the tools evaluated; 3) the assessment of the quality of the tools for the developed corpus by means of precision-recall ratios; 4) the analysis of the most frequent errors.
The sufficiency of the technical characteristics of the tools and their evaluation ratios, presents an objective perspective of the quality and the effectiveness of the recognition and classification techniques of each tool. Thus, the study complements the information provided by other competitions and aids the choice or the design of more suitable NER tools for a specific project.
of entities; 2) the elaboration of a brief technical specification for the tools evaluated; 3) the assessment of the quality of the tools for the developed corpus by means of precision-recall ratios; 4) the analysis of the most frequent errors.
The sufficiency of the technical characteristics of the tools and their evaluation ratios, presents an objective perspective of the quality and the effectiveness of the recognition and classification techniques of each tool. Thus, the study complements the information provided by other competitions and aids the choice or the design of more suitable NER tools for a specific project.
Los artículos sobre ontologías llevan casi veinte años de gran actualidad en la literatura profesional, como se puede comprobar haciendo búsquedas en bases de datos. A pesar de esto, sigue sin haber consenso sobre el significado de este... more
Los artículos sobre ontologías llevan casi veinte años de gran actualidad en la literatura profesional, como se puede comprobar haciendo búsquedas en bases de datos. A pesar de esto, sigue sin haber consenso sobre el significado de este concepto. Probablemente la representación gráfica conocida como el espectro de las ontologías ha generado cierta confusión en algunos lectores. Por ello tratamos de argumentar aquí el origen de esta confusión, que puede deberse a la mezcla de varios tipos de sistemas de organización del conocimiento, cuya distinta finalidad llevó a definirlos de diferente forma. De hecho, construir una ontología formal para un sistema no siempre supone una mejora y en muchas ocasiones es suficiente con una representación menos compleja.
The number of papers written on ontologies has increased considerably over the last twenty years. This trend can be easily observed by searching words like “ontology” or “thesaurus” in databases. Despite this fact, there hasn’t been a consensus about the significance of this concept. The graphical representation known as ontology spectrum must have generated
a lot of confusion amongst readers. In this paper we argue that this confusion is due to the mix of the various types of knowledge organization systems with distinct objectives in the same graphical representation. Thus, constructing a formal ontology for a system does not always presume an improvement, frequently it is adequate with less complex representations.
The number of papers written on ontologies has increased considerably over the last twenty years. This trend can be easily observed by searching words like “ontology” or “thesaurus” in databases. Despite this fact, there hasn’t been a consensus about the significance of this concept. The graphical representation known as ontology spectrum must have generated
a lot of confusion amongst readers. In this paper we argue that this confusion is due to the mix of the various types of knowledge organization systems with distinct objectives in the same graphical representation. Thus, constructing a formal ontology for a system does not always presume an improvement, frequently it is adequate with less complex representations.
- by Vicente Palacios and +3
- •
- Ontologias, Tesauros
The semantics of vocabulary elements use to be defined locally with scarce rigorousness and without consideration to shared definitions in other vocabularies, this approach produces a lack in the interoperability between resources. This... more
The semantics of vocabulary elements use to be defined locally with scarce rigorousness and without consideration to shared definitions in other vocabularies, this approach produces a lack in the interoperability between resources. This document provides metadata vocabularies with a semantic map, articulated by a new qualifier set. The qualifier set is named semantic qualifiers, which permits to use semantics included in public reference resources. Moreover, a methodology is proposed. The solution improves previous initiatives concerning metadata management like Metadata Registries or other DCMI proposals. As example, the Dublin Core semantic qualification is carried out, making use of W3C-WordNet as reference ontology. In addition, this approach considers Modularity, Extensibility, Refining and Plurilinguistic criteria. A descriptive document is proposed with two views, one aimed to the user and an additional in RDF. The fields that would get benefits from the proposal are conceptual recovery of elements in the Semantic Web, the use of application profiles, and the friendlier use of vocabularies.
The semantics of vocabulary elements use to be defined locally with scarce rigorousness and without consideration to shared definitions in other vocabularies, this approach produces a lack in the interoperability between resources. This... more
The semantics of vocabulary elements use to be defined locally with scarce rigorousness and without consideration to shared definitions in other vocabularies, this approach produces a lack in the interoperability between resources. This document provides metadata vocabularies with a semantic map, articulated by a new qualifier set. The qualifier set is named semantic qualifiers, which permits to use semantics included in public reference resources. Moreover, a methodology is proposed. The solution improves previous initiatives concerning metadata management like Metadata Registries (ISO/IEC, 2006) or other DCMI proposals. In addition, it considers Modularity, Extensibility, Refining and Plurilinguistic criteria. A descriptive document is proposed with two views, one aimed to the user and an additional in RDF. The fields that would get benefits from the proposal are conceptual recovery of elements in the Semantic Web, the use of application profiles, and the friendlier use of vocabularies.
The importance that DCMI abstract model is acquiring as a metadata model scheme reference has motivated the work of the present analysis. This research has as an objective to make easy its understanding and contribute, from our experience... more
The importance that DCMI abstract model is acquiring as a metadata model scheme reference has motivated the work of the present analysis. This research has as an objective to make easy its understanding and contribute, from our experience in the use of UML model language revision proposals that improve the notation and representation of some concepts included in the resource model that is included in DCAM.
Finally, the model in UML is included, incorporating the recommendations on notation and representations of the concepts of the original model.
Finally, the model in UML is included, incorporating the recommendations on notation and representations of the concepts of the original model.
- by Vicente Palacios and +2
- •
- Formalization, UML, Dublin Core, Metadata vocabulary
En los nuevos entornos de aprendizaje, se pueden identificar cuatro grandes grupos tipos de ontologías: las ontologías dirigidas a la gestión de recursos y actividades educativas desde un punto de vista administrativo, las ontologías... more
En los nuevos entornos de aprendizaje, se pueden identificar cuatro grandes grupos tipos de ontologías: las ontologías dirigidas a la gestión de recursos y actividades educativas desde un punto de vista administrativo, las ontologías dirigidas a la gestión de contenidos, las relativas a su diseño instructivo y las ontologías de dominio.
Las primeras están relacionadas con el desarrollo tecnológico específico de los LMS (Learning Management Systems) mientras que el desarrollo de ontologías de diseño instructivo se considera dentro del ámbito de pedagogos e informáticos. La acción investigadora de nuestro proyecto se centra en los dos tipos restantes, que atañen al contenido de los recursos educativos, y por tanto, reclaman la atención del Análisis Documental.
El proyecto DOTEINE1 (Documentación y Tecnologías de la Información para la Educación: herramientas para la alfabetización informacional y la organización de recursos), tiene por principal objetivo el desarrollo de instrumentos documentales de recuperación informativa aplicables al ámbito educativo que contribuyan a facilitar el aprendizaje en red.
Tras el desarrollo en una fase anterior de un perfil de aplicación de IEEE LOM2 y Dublin Core3 denominado MIMETA y la construcción de los vocabularios controlados en forma de tesauros correspondientes a cuatro dominios (Biología, Lengua y Literatura, Derecho y Análisis de Contenido), el proyecto acomete en este momento una de sus últimas fases: la realización de propuestas de modelado de MIMETA y de los tesauros de dominio en forma de ontologías aplicables al desarrollo de sistemas avanzados de recuperación de información educativa.
La transformación de estos tesauros en ontologías de dominio se acomete de forma paralela al desarrollo de la ontología que es objeto de este trabajo. El objetivo de esta contribución es presentar una propuesta de modelo ontológico del perfil de metadatos MIMETA combinado con los vocabularios controlados definidos en algunos de los elementos, para la descripción de los recursos digitales de contenido educativo que constituyen el repositorio de recursos.
Esta ontología se desarrolla con la herramienta Protegé4. Se prevé, asimismo, publicarla en Web como referencia para la discusión, mejora y ampliación de sus conexiones con otras ontologías, así como para permitir su reutilización. El interés de su desarrollo se centra en su utilización en la gestión de recursos educativos en bibliotecas digitales para su implementación en CRA (Centros de recursos para el aprendizaje) y CRAI (Centros de recursos para el aprendizaje y la investigación).
Las primeras están relacionadas con el desarrollo tecnológico específico de los LMS (Learning Management Systems) mientras que el desarrollo de ontologías de diseño instructivo se considera dentro del ámbito de pedagogos e informáticos. La acción investigadora de nuestro proyecto se centra en los dos tipos restantes, que atañen al contenido de los recursos educativos, y por tanto, reclaman la atención del Análisis Documental.
El proyecto DOTEINE1 (Documentación y Tecnologías de la Información para la Educación: herramientas para la alfabetización informacional y la organización de recursos), tiene por principal objetivo el desarrollo de instrumentos documentales de recuperación informativa aplicables al ámbito educativo que contribuyan a facilitar el aprendizaje en red.
Tras el desarrollo en una fase anterior de un perfil de aplicación de IEEE LOM2 y Dublin Core3 denominado MIMETA y la construcción de los vocabularios controlados en forma de tesauros correspondientes a cuatro dominios (Biología, Lengua y Literatura, Derecho y Análisis de Contenido), el proyecto acomete en este momento una de sus últimas fases: la realización de propuestas de modelado de MIMETA y de los tesauros de dominio en forma de ontologías aplicables al desarrollo de sistemas avanzados de recuperación de información educativa.
La transformación de estos tesauros en ontologías de dominio se acomete de forma paralela al desarrollo de la ontología que es objeto de este trabajo. El objetivo de esta contribución es presentar una propuesta de modelo ontológico del perfil de metadatos MIMETA combinado con los vocabularios controlados definidos en algunos de los elementos, para la descripción de los recursos digitales de contenido educativo que constituyen el repositorio de recursos.
Esta ontología se desarrolla con la herramienta Protegé4. Se prevé, asimismo, publicarla en Web como referencia para la discusión, mejora y ampliación de sus conexiones con otras ontologías, así como para permitir su reutilización. El interés de su desarrollo se centra en su utilización en la gestión de recursos educativos en bibliotecas digitales para su implementación en CRA (Centros de recursos para el aprendizaje) y CRAI (Centros de recursos para el aprendizaje y la investigación).
- by Jorge Morato and +1
- •
- Bibliotecas Digitales, LOM, Perfil De Aplicación
Las ontologías son una pieza clave para el desarrollo de la Web Semántica. La irrupción de las ontologías en Internet es un fenómeno reciente pero de trascendental importancia para la transmisión y almacenamiento de datos en el ámbito... more
Las ontologías son una pieza clave para el desarrollo de la Web Semántica. La irrupción de las ontologías en Internet es un fenómeno reciente pero de trascendental importancia para la transmisión y almacenamiento de datos en el ámbito tecnológico y empresarial. La novedad de estas representaciones conjuntamente con cierta disparidad en su expresión y la incertidumbre en su grado de implantación debido a la escasez de estudios sobre el tema, provoca cierta desorientación en empresas que pretenden incorporar estas tecnologías. El presente estudio realiza una evaluación del desarrollo y uso de las ontologías, mostrando una visión general desde distintos puntos de vista incluyendo temática, países con mayor uso y ámbitos de aplicación, tanto en entidades dedicadas a la investigación como en empresas. El objetivo es proporcionar al investigador en este campo, un punto de partida para conocer el grado de implantación de los distintos tipos de documentos semánticos en Internet
- by Vicente Palacios and +1
- •
- Ontologias, Interoperabilidad
Se presenta una metodología para la creación automática de ontologías de tipo tesauro. La información es extraída mediante procesamiento del lenguaje natural de un corpus documental de un dominio. De este modo, el presente estudio se ha... more
Se presenta una metodología para la creación automática de
ontologías de tipo tesauro. La información es extraída mediante
procesamiento del lenguaje natural de un corpus documental de
un dominio. De este modo, el presente estudio se ha centrado en
interrelacionar, de forma automática, los conceptos designados
por los términos de los documentos, dependiendo de las relaciones semánticas que se establecen entre ellos. En el
presente documento se muestra los resultados de la aplicación
del método al dominio de la zoología. Se resumen estadísticamente los logros alcanzados, reseñando los problemas encontrados y la identificación de aquellas estructuras que aportan resultados más fiables.
ontologías de tipo tesauro. La información es extraída mediante
procesamiento del lenguaje natural de un corpus documental de
un dominio. De este modo, el presente estudio se ha centrado en
interrelacionar, de forma automática, los conceptos designados
por los términos de los documentos, dependiendo de las relaciones semánticas que se establecen entre ellos. En el
presente documento se muestra los resultados de la aplicación
del método al dominio de la zoología. Se resumen estadísticamente los logros alcanzados, reseñando los problemas encontrados y la identificación de aquellas estructuras que aportan resultados más fiables.
Se presenta una visión integradora de las diferentes herramientas que permiten el estudio de las conexiones entre documentos, las pautas de publicación, la representación del contenido y la optimización de la recuperación. Se entremezclan... more
Se presenta una visión integradora de las diferentes herramientas que permiten el estudio de las conexiones entre documentos, las pautas de publicación, la representación del contenido y la optimización de la recuperación. Se entremezclan conceptos de Psicología Cognitiva,Lingüística, Cienciometría, Documentación, Estadística, Clasificación e Informática en sus vertientes
más relacionadas con el tratamiento, organización y caracterización de información textual.
El objetivo final es analizar la influencia que tiene el análisis de
género en la carcterización de los parámetros cualitativos y cuantitativos, y en concreto, de las herramientas que se encargan tradicionalmente de estos estudios, como los indicadores cienciométricos y la clasificación de términos.
más relacionadas con el tratamiento, organización y caracterización de información textual.
El objetivo final es analizar la influencia que tiene el análisis de
género en la carcterización de los parámetros cualitativos y cuantitativos, y en concreto, de las herramientas que se encargan tradicionalmente de estos estudios, como los indicadores cienciométricos y la clasificación de términos.