Mostra el registre d'ítem simple
Semantic blocking for record linkage
dc.contributor.author | Nin Guerrero, Jordi |
dc.contributor.author | Muntés Mulero, Víctor |
dc.contributor.author | Martínez Bazán, Norbert |
dc.contributor.author | Larriba Pey, Josep |
dc.contributor.other | Universitat Politècnica de Catalunya. Departament d'Arquitectura de Computadors |
dc.date.accessioned | 2011-09-19T15:15:29Z |
dc.date.available | 2011-09-19T15:15:29Z |
dc.date.created | 2007 |
dc.date.issued | 2007 |
dc.identifier.citation | Nin, J. [et al.]. Semantic blocking for record linkage. A: Congrés Internacional de l'Associació Catalana d'Intel·ligència Artificial. "10é Congrés Internacional de l'Associació Catalana d'Intel·ligència Artificial". Sant Julià de Lòria: IOS Press, 2007, p. 141-149. |
dc.identifier.isbn | 978-1-58603-798-7 |
dc.identifier.uri | http://hdl.handle.net/2117/13246 |
dc.description.abstract | Record Linkage (RL) is an important component of data cleaning and integration and data processing in general. For years, many efforts have focused on improving the performance of the RL process, either by reducing the number of record comparisons or reducing the number of attribute comparisons, which reduces the computational time, but increases the amount of error. However, the real bottleneck of RL is the post-process, where the results have to be reviewed by experts that decide which pairs or groups of records are real links and which are false hits. In this paper we show that exploiting the semantic relationships (e.g. foreign key), established between one or more data sources, makes it possible to find a new sort of semantic blocking method that improves the number of hits and reduces the amount of review effort. |
dc.format.extent | 9 p. |
dc.language.iso | eng |
dc.publisher | IOS Press |
dc.subject | Àrees temàtiques de la UPC::Informàtica::Sistemes d'informació::Emmagatzematge i recuperació de la informació |
dc.subject.lcsh | Data integration (Computer science) |
dc.subject.lcsh | Electronic data processing -- Data preparation |
dc.subject.lcsh | Electronic data processing -- Quality control |
dc.subject.other | Data processing |
dc.subject.other | Semantic information |
dc.subject.other | Blocking algorithms |
dc.subject.other | Record linkage |
dc.subject.other | Data integration |
dc.subject.other | Data cleansing |
dc.title | Semantic blocking for record linkage |
dc.type | Conference report |
dc.subject.lemac | Processament electrònic de dades -- Control de qualitat |
dc.subject.lemac | Processament electrònic de dades -- Depuració |
dc.contributor.group | Universitat Politècnica de Catalunya. DMAG - Grup d'Aplicacions Multimèdia Distribuïdes |
dc.contributor.group | Universitat Politècnica de Catalunya. DAMA-UPC - Data Management Group |
dc.rights.access | Restricted access - publisher's policy |
local.identifier.drac | 2417187 |
dc.description.version | Postprint (published version) |
local.citation.author | Nin, J.; Muntés, V.; Martinez-Bazan, N.; Larriba, J. |
local.citation.contributor | Congrés Internacional de l'Associació Catalana d'Intel·ligència Artificial |
local.citation.pubplace | Sant Julià de Lòria |
local.citation.publicationName | 10é Congrés Internacional de l'Associació Catalana d'Intel·ligència Artificial |
local.citation.startingPage | 141 |
local.citation.endingPage | 149 |