Knowledge-based and data-driven approaches for georeferencing of informal documents
Visualitza/Obre
Versió de l'editor (648,1Kb) (Accés restringit)
Sol·licita una còpia a l'autor
Què és aquest botó?
Aquest botó permet demanar una còpia d'un document restringit a l'autor. Es mostra quan:
- Disposem del correu electrònic de l'autor
- El document té una mida inferior a 20 Mb
- Es tracta d'un document d'accés restringit per decisió de l'autor o d'un document d'accés restringit per política de l'editorial
10.1007/978-3-319-24033-6_51
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/86563
Tipus de documentComunicació de congrés
Data publicació2015
EditorSpringer
Condicions d'accésAccés restringit per política de l'editorial
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
This paper describes Knowledge-Based and Data-Driven approaches we have followed for generic Textual Georeferencing of Informal Documents. Textual georeferencing consists in assigning a set of geographical coordinates to formal (news, reports,..) or informal (blogs, social networks, chats, tagsets,...) texts and documents. The system presented in this paper has been designed to deal with informal documents from social sites. The paper describes four Georeferencing approaches, experiments, and results at the MediaEval 2014 Placing Task (ME2014PT) evaluation, and posterior experiments. The task consisted of predicting the most probable geographical coordinates of Flickr images and videos using its visual, audio and metadata associated features. Our approaches used only Flickr users textual metadata annotations and tagsets. The four approaches used for this task were: 1) a Geographical Knowledge-Based (GeoKB) approach that uses Toponym Disambiguation heuristics, 2) the Hiemstra Language Model (HLM), TFIDF and BM25 Information Retrieval (IR) approaches with Re-Ranking, 3) a combination of the GeoKB and the IR models with Re-Ranking (GeoFusion). 4) a combination of the GeoFusion with a HLM model derived from the English Wikipedia georeferenced pages. The HLM approach with Re-Ranking showed the best performance in accuracy within a margin of distance errors ranging from 10m to 1km. The GeoFusion approaches achieved the best results in accuracies from 10km to 5,000km. Both approaches achieved state-of-the-art results at ME2014PT evaluation and posterior experiments, including the best results for distance accuracies of 1000km and 5,000km in the task where only the official training dataset can be used to predict the coordinates.
CitacióFerres, D., Rodriguez, H. Knowledge-based and data-driven approaches for georeferencing of informal documents. A: International Conference on Text, Speech and Dialogue. "Text, speech, and dialogue: 18th international conference, TSD 2015, Pilsen, Czech Republic, September 14-17, 2015: proceedings". Plzen: Springer, 2015, p. 452-460.
ISBN978-3-319-24033-6
Versió de l'editorhttp://link.springer.com/chapter/10.1007%2F978-3-319-24033-6_51
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
chp_10.1007_978-3-319-24033-6_51.pdf | Versió de l'editor | 648,1Kb | Accés restringit |