Semantic blocking for record linkage
Visualitza/Obre
Nin.pdf (2,283Mb) (Accés restringit)
Sol·licita una còpia a l'autor
Què és aquest botó?
Aquest botó permet demanar una còpia d'un document restringit a l'autor. Es mostra quan:
- Disposem del correu electrònic de l'autor
- El document té una mida inferior a 20 Mb
- Es tracta d'un document d'accés restringit per decisió de l'autor o d'un document d'accés restringit per política de l'editorial
Tipus de documentText en actes de congrés
Data publicació2007
EditorIOS Press
Condicions d'accésAccés restringit per política de l'editorial
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
Record Linkage (RL) is an important component of data cleaning and integration and data processing in general. For years, many efforts have focused on improving the performance of the RL process, either by reducing the number of record comparisons or reducing the number of attribute comparisons, which reduces the computational time, but increases the amount of error. However, the real bottleneck of RL is the post-process, where the results have to be reviewed by experts that decide which pairs or groups of records are real links and which are false hits.
In this paper we show that exploiting the semantic relationships (e.g. foreign key), established between one or more data sources, makes it possible to find a new sort of semantic blocking method that improves the number of hits and reduces the amount of review effort.
CitacióNin, J. [et al.]. Semantic blocking for record linkage. A: Congrés Internacional de l'Associació Catalana d'Intel·ligència Artificial. "10é Congrés Internacional de l'Associació Catalana d'Intel·ligència Artificial". Sant Julià de Lòria: IOS Press, 2007, p. 141-149.
ISBN978-1-58603-798-7
Col·leccions
- DAMA-UPC - Data Management Group de la Universitat Politècnica de Catalunya - Ponències/Comunicacions de congressos [21]
- DMAG - Grup d'Aplicacions Multimèdia Distribuïdes - Ponències/Comunicacions de congressos [82]
- Departament d'Arquitectura de Computadors - Ponències/Comunicacions de congressos [1.945]
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
Nin.pdf | 2,283Mb | Accés restringit |