Mostra el registre d'ítem simple

dc.contributor.authorFerrés Domènech, Daniel
dc.contributor.authorRodríguez Hontoria, Horacio
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Llenguatges i Sistemes Informàtics
dc.date.accessioned2013-02-13T10:35:29Z
dc.date.available2013-02-13T10:35:29Z
dc.date.created2011
dc.date.issued2011
dc.identifier.citationFerrés, D.; Rodríguez, H. Georeferencing textual annotations and tagsets with geographical knowledge and language models. A: Congreso de la Sociedad Española para el Procesamiento del Lenguaje Natural. "Actas de la SEPLN 2011". Huelva: 2011.
dc.identifier.urihttp://hdl.handle.net/2117/17703
dc.description.abstractPresentamos en este artículo cuatro aproximaciones al georeferenciado genérico de anotaciones textuales multilingües y etiquetas sem ánticas. Las cuatro aproximaciones se basan en el uso de 1) Conocimiento geogr áfi co, 2) Modelos del lenguaje (LM), 3) Modelos del lenguaje con predicciones re-ranking y 4) Fusi ón de las predicciones basadas en conocimiento geográfi co con otras aproximaciones. Los recursos empleados incluyen el gazetteer geogr áfi co Geonames, los modelos de recuperación de informaci ón TFIDF y BM25, el Hiemstra Language Modelling (HLM), listas de stop words para varias lenguas y un diccionario electróonico de la lengua inglesa. Los mejores resultados en precisión del georeferenciado se han obtenido con la aproximación de re-ranking que usa el HLM y con su fusióon con conocimiento geográfi co. Estas estrategias mejoran los mejores resultados de los mejores sistemas participantes en la tarea o cial de georeferenciado en MediaEval 2010. Nuestro mejor resultado obtiene una precisión de 68.53% en la tarea de geoeferenciado hasta 100 Km. This paper describes generic approaches for georeferencing multilingual textual annotations and sets of tags from metadata associated to textual or multimedia content with high precision. We present four approaches based on: 1) Geographical Knowledge, 2) Language Modelling (LM), 3) Language Modelling with Re-Ranking predictions, 4) Fusion of Geographical Knowledge predictions with the other approaches. The resources employed were the Geonames geographical gazetteer, the TFIDF and BM25 Information Retrieval algorithms, the Hiemstra Language Modelling (HLM) algorithm, stopwords lists from several languages, and an electronic English dictionary. The best results in georeferencing accuracy are achieved with the HLM Re-Ranking approach and its fusion with Geographical Knowledge. These strategies outperformed the best results in accuracy reported by the state-of-the art systems that participated at MediaEval 2010 official Placing task. Our best results achieved are 68.53% of accuracy georeferencing up to a distance of 100 Km.
dc.format.extent9 p.
dc.language.isoeng
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Spain
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Informàtica::Intel·ligència artificial::Llenguatge natural
dc.subject.lcshInformation retrieval
dc.subject.otherGeoreferenciado
dc.subject.otherGazetteers geográficos
dc.subject.otherRecuperación de la información
dc.subject.otherGeoreferencing
dc.subject.otherGeographical gazetteers
dc.subject.otherLanguage models
dc.subject.otherModelos de lenguaje
dc.titleGeoreferencing textual annotations and tagsets with geographical knowledge and language models
dc.typeConference report
dc.subject.lemacRecuperació de la informació
dc.contributor.groupUniversitat Politècnica de Catalunya. GPLN - Grup de Processament del Llenguatge Natural
dc.rights.accessOpen Access
local.identifier.drac9432296
dc.description.versionPostprint (author’s final draft)
local.citation.authorFerrés, D.; Rodríguez, H.
local.citation.contributorCongreso de la Sociedad Española para el Procesamiento del Lenguaje Natural
local.citation.pubplaceHuelva
local.citation.publicationNameActas de la SEPLN 2011


Fitxers d'aquest items

Thumbnail

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple