DSpace DSpace UPC
 Català   Castellano   English  

E-prints UPC >
Altres >
Enviament des de DRAC >

Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/2117/11063

Arxiu Descripció MidaFormat
05601718.pdf298.91 kBAdobe PDFThumbnail
Veure/Obrir

Citació: Herranz, J.; Nin, J.; Solé, M. Optimal symbol alignment distance: a new distance for sequences of symbols. "IEEE Transactions on Knowledge and Data Engineering (TKDE)", 14 Octubre 2010.
Títol: Optimal symbol alignment distance: a new distance for sequences of symbols
Autor: Herranz Sotoca, Javier Veure Producció científica UPC; Nin Guerrero, Jordi Veure Producció científica UPC; Solé Simó, Marc Veure Producció científica UPC
Editorial: IEEE Press. Institute of Electrical and Electronics Engineers
Data: 14-oct-2010
Tipus de document: Article
Resum: Comparison functions for sequences (of symbols) are important components of many applications, for example clustering, data cleansing and integration. For years, many efforts have been made to improve the performance of such comparison functions. Improvements have been done either at the cost of reducing the accuracy of the comparison, or by compromising certain basic characteristics of the functions, such as the triangular inequality. In this paper, we propose a new distance for sequences of symbols (or strings) called Optimal Symbol Alignment distance (OSA distance, for short). This distance has a very low cost in practice, which makes it a suitable candidate for computing distances in applications with large amounts of (very long) sequences. After providing a mathematical proof that the OSA distance is a real distance, we present some experiments for different scenarios (DNA sequences, record linkage, ...), showing that the proposed distance outperforms, in terms of execution time and/or accuracy, other well-known comparison functions such as the Edit or Jaro-Winkler distances.
ISSN: 1041-4347
URI: http://hdl.handle.net/2117/11063
Versió de l'editor: 10.1109/TKDE.2010.190
Apareix a les col·leccions:Altres. Enviament des de DRAC
Departaments de Matemàtica Aplicada. Articles de revista
ICARUS - Intelligent Communications and Avionics for Robust Unmanned Aerial Systems. Articles de revista
MAK - Matemàtica Aplicada a la Criptografia. Articles de revista
Comparteix:


Stats Mostra les estadístiques d'aquest ítem

SFX Query

Queda prohibida la reproducció, transformació, distribució i comunicació pública d'aquesta obra. Es permet, en tot cas, la reproducció per a ús privat sempre i quan la còpia que se'n faci no sigui objecte d'utilització col·lectiva ni lucrativa (art. 31.2 del Reial Decret Legislatiu 1/1996, de 12 d'abril, pel qual s'aprova el Text Refós de la Llei de Propietat Intel·lectual, http://bibliotecnica.upc.es/sepi/legislacio.asp).

Per a qualsevol ús que es vulgui fer diferent al permès, dirigiu-vos a: sepi@upc.edu

 

Valid XHTML 1.0! Programari DSpace Copyright © 2002-2004 MIT and Hewlett-Packard Comentaris
Universitat Politècnica de Catalunya. Servei de Biblioteques, Publicacions i Arxius