dc.contributor.author | Sapena Masip, Emilio |
dc.contributor.author | Padró, Lluís |
dc.contributor.author | Turmo Borras, Jorge |
dc.contributor.other | Universitat Politècnica de Catalunya. Departament de Llenguatges i Sistemes Informàtics |
dc.date.accessioned | 2010-06-07T10:23:49Z |
dc.date.available | 2010-06-07T10:23:49Z |
dc.date.created | 2007-01-31 |
dc.date.issued | 2007-01-31 |
dc.identifier.citation | Sapena, E.; Padró, L.; Turmo, J. Alias assignment in information extraction. A: XXIII Congreso Anual de la Sociedad Española para el Procesamiento del Lenguaje Natural. "XXIII Congreso Anual de la Sociedad Española para el Procesamiento del Lenguaje Natural". Sevilla: -, 2007, p. 1-2. |
dc.identifier.uri | http://hdl.handle.net/2117/7540 |
dc.description.abstract | This paper presents a general method for alias assignment task in information extraction. We compared two approaches to face the problem and learn a classifier. The first one quantifies a global similarity between the alias and all the possible entities weighting some features about each pair alias-entity. The second is a classical classifier where each instance is a pair alias-entity and its attributes are their features. Both approaches use the same feature functions about the pair alias-entity where every level of abstraction, from raw characters up to semantic level, is treated in an homogeneous way. In addition, we propose an extended feature functions that break down the information and let the machine learning algorithm to determine the final contribution of each value. The use of extended features improve the results of the simple ones. ---------------------------------------Este artículo presenta un método general para la tarea de asignación de alias en extracción de información. Se comparan dos aproximaciones para encarar el problema y aprender un clasificador. La primera cuantifica una similaridad global entre el alias y todas las posibles entidades asignando pesos a las características sobre cada pareja alias-entidad. La segunda es el clásico clasificador donde cada instancia es una pareja alias-entidad y sus atributos son las características de ésta. Ambas aproximaciones usan las mismas funciones de características sobre la pareja
alias-entidad donde cada nivel de abstracción, desde los carácteres hasta el nivel semántico, se tratan de forma homogénea. Ademés, se proponen unas funciones
extendidas de características que desglosan la información y permiten al algoritmo
de aprendizaje automático determinar la contribución final de cada valor. El uso
de funciones extendidas mejora los resultados de las funciones simples. |
dc.format.extent | 2 p. |
dc.language.iso | eng |
dc.publisher | - |
dc.subject | Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial::Llenguatge natural |
dc.subject | Àrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic |
dc.subject.lcsh | Natural language processing (Computer science) |
dc.title | Alias assignment in information extraction |
dc.type | Conference report |
dc.subject.lemac | Processament de la parla |
dc.contributor.group | Universitat Politècnica de Catalunya. GPLN - Grup de Processament del Llenguatge Natural |
dc.description.peerreviewed | Peer Reviewed |
dc.rights.access | Restricted access - publisher's policy |
local.identifier.drac | 2462441 |
dc.description.version | Postprint (published version) |
local.citation.author | Sapena, E.; Padró, L.; Turmo, J. |
local.citation.contributor | XXIII Congreso Anual de la Sociedad Española para el Procesamiento del Lenguaje Natural |
local.citation.pubplace | Sevilla |
local.citation.publicationName | XXIII Congreso Anual de la Sociedad Española para el Procesamiento del Lenguaje Natural |
local.citation.startingPage | 1 |
local.citation.endingPage | 2 |