Extraccion de Datos
Extraccion de Datos
Extraccion de Datos
RESUMEN
El grupo de investigación de Procesamiento del lenguaje natural y sistemas de
información de la Universidad de Alicante trabaja en técnicas que permiten obtener
información de bases de datos de una forma avanzada. La clave consiste en localizar los
aspectos relevantes y descartar los no relevantes (tanto en bases de datos como en
textos digitalizados). El grupo posee el know-how en tres aplicaciones distintas:
recuperación de información, clasificación de documentación y extracción de información,
que pueden ser aplicadas de forma independiente o integrada en multitud de sectores:
notarial, deportivo, médico, medioambiental, farmacéutico, periodístico, administración
pública, etc. El grupo busca empresas o entidades interesadas en su know-how para
desarrollar aplicaciones concretas a las necesidades y entornos de cada cliente.
DESCRIPCIÓN TECNOLÓGICA
El know-how que se ofrece se basa en tres aplicaciones para recuperar, clasificar y
extraer información, que pueden ser aplicadas de forma independiente o de forma
integrada, para una multitud de sectores y ámbitos en los que se maneje una gran
cantidad de documentos y/o información. El know-how consiste en:
1. Recuperación de información.
2. Clasificación de documentación.
3. Extracción de Información.
PRODUCTOS
ASPECTOS INNOVADORES
Las aplicaciones propuestas incluyen una serie de utilidades no disponibles actualmente
en otras herramientas en el mercado, por ejemplo, el uso del buscador multilingüe y la
clasificación de la información por conceptos.
VENTAJAS
Las distintas herramientas ya han sido desarrolladas para distintas aplicaciones, como por
ejemplo, en la gestión de la información de compra-venta de inmuebles en notarias.
SECTORES DE APLICACIÓN
Las aplicaciones pueden darse en cualquier sector en cuya actividad se trabaje con
grandes cantidades de información, que sea necesario procesar y de la cual sea
necesario extraer información y datos bajo demanda.
Sectores de aplicación:
COOPERACIÓN BUSCADA
El grupo busca empresas o entidades interesadas en su know-how para desarrollar
aplicaciones concretas a las necesidades y entornos de los clientes. Asimismo, busca
socios para llevar a cabo otras aplicaciones y/o proyectos de investigación conjuntos. Los
acuerdos de cooperación tecnológica propuestos serían:
En el seno del grupo se han leído un total de diez tesis doctorales relacionadas con las
temáticas de la resolución de ambigüedades léxica, referencial, estructural, sistemas
de recuperación de información y búsqueda de respuestas.
LINEAS DE INVESTIGACIÓN
Aplicaciones de PLN.
• Extracción de información.
• Recuperación de información.
• Búsqueda de respuestas.
• Clasificación de textos.
• Sistemas de diálogos.
• Traducción automática.
PROYECTOS
El grupo tiene una amplia experiencia en la participación en proyectos con financiación
tanto nacional como europea. Además, desarrolla aplicaciones, con financiación
privada, a medida para empresas privadas y públicas.
Nacionales:
• R2D2: Recuperación de respuestas en documentos digitalizados.
• Construcción de analizadores híbridos de lenguajes naturales.
• 3LB: Construcción de una base de datos de árboles sintáctico semánticos.
• TUSIR: Desarrollo de un sistema de comprensión de textos aplicado a la
recuperación de información.
Europeos:
• Development of a Corpus-based integrated anaphora resolution system for
Spanish and English.
• EUROTERM: Extending the EuroWordNet with Public Sector Terminology
Autonómicos:
• Reconocedor de entidades multilingüe (español, valenciano e inglés).
7
• Desarrollo de un clasificador para textos en castellano, inglés y valenciano
en el dominio de la administración pública.
• WSD-VAL: Desarrollo de un etiquetador semántico.
• Minería de textos.
• Recuperación de respuestas en documentos digitales.
• Buscadores: trabajo sobre respuesta concreta a pregunta y aumento de
efectividad de los buscadores en entornos reducidos, como en sector turismo y
en cualquier idioma, sobre bases de datos y texto.
• Lingüística forense para la autoría de textos.
• Asistente virtual para domótica.
DATOS DE CONTACTO
Víctor Manuel Pérez Lozano
SGITT-OTRI (Universidad de Alicante)
Teléfono: +34 96 590 3467
Fax: +34 96 590 3803
E-Mail: [email protected]
URL: http://sgitt-otri.ua.es/es/empresa/ofertas-tecnologicas.html