DSpace DSpace UPC
 Català   Castellano   English  

E-prints UPC >
Altres >
Enviament des de DRAC >

Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/2117/7540

Ítem no disponible en accés obert per política de l'editorial

Arxiu Descripció MidaFormat
sapena07b.pdf149,04 kBAdobe PDF Accés restringit

Citació: Sapena, E.; Padró, L.; Turmo, J. Alias assignment in information extraction. A: XXIII Congreso Anual de la Sociedad Española para el Procesamiento del Lenguaje Natural. "XXIII Congreso Anual de la Sociedad Española para el Procesamiento del Lenguaje Natural". Sevilla: -, 2007, p. 1-2.
Títol: Alias assignment in information extraction
Autor: Sapena Masip, Emilio Veure Producció científica UPC; Padró, Lluís Veure Producció científica UPC; Turmo Borras, Jorge Veure Producció científica UPC
Editorial: -
Data: 31-gen-2007
Tipus de document: Conference report
Resum: This paper presents a general method for alias assignment task in information extraction. We compared two approaches to face the problem and learn a classifier. The first one quantifies a global similarity between the alias and all the possible entities weighting some features about each pair alias-entity. The second is a classical classifier where each instance is a pair alias-entity and its attributes are their features. Both approaches use the same feature functions about the pair alias-entity where every level of abstraction, from raw characters up to semantic level, is treated in an homogeneous way. In addition, we propose an extended feature functions that break down the information and let the machine learning algorithm to determine the final contribution of each value. The use of extended features improve the results of the simple ones. ---------------------------------------Este artículo presenta un método general para la tarea de asignación de alias en extracción de información. Se comparan dos aproximaciones para encarar el problema y aprender un clasificador. La primera cuantifica una similaridad global entre el alias y todas las posibles entidades asignando pesos a las características sobre cada pareja alias-entidad. La segunda es el clásico clasificador donde cada instancia es una pareja alias-entidad y sus atributos son las características de ésta. Ambas aproximaciones usan las mismas funciones de características sobre la pareja alias-entidad donde cada nivel de abstracción, desde los carácteres hasta el nivel semántico, se tratan de forma homogénea. Ademés, se proponen unas funciones extendidas de características que desglosan la información y permiten al algoritmo de aprendizaje automático determinar la contribución final de cada valor. El uso de funciones extendidas mejora los resultados de las funciones simples.
URI: http://hdl.handle.net/2117/7540
Apareix a les col·leccions:GPLN - Grup de Processament del Llenguatge Natural. Ponències/Comunicacions de congressos
Departament de Llenguatges i Sistemes Informàtics. Ponències/Comunicacions de congressos
Altres. Enviament des de DRAC
Comparteix:


Stats Mostra les estadístiques d'aquest ítem

SFX Query

Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets.

Per a qualsevol ús que se'n vulgui fer no previst a la llei, dirigiu-vos a: sepi.bupc@upc.edu

 

Valid XHTML 1.0! Programari DSpace Copyright © 2002-2004 MIT and Hewlett-Packard Comentaris
Universitat Politècnica de Catalunya. Servei de Biblioteques, Publicacions i Arxius