Mostra el registre d'ítem simple

dc.contributor.authorNin Guerrero, Jordi
dc.contributor.authorMuntés Mulero, Víctor
dc.contributor.authorMartínez Bazán, Norbert
dc.contributor.authorLarriba Pey, Josep
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament d'Arquitectura de Computadors
dc.date.accessioned2011-09-19T15:15:29Z
dc.date.available2011-09-19T15:15:29Z
dc.date.created2007
dc.date.issued2007
dc.identifier.citationNin, J. [et al.]. Semantic blocking for record linkage. A: Congrés Internacional de l'Associació Catalana d'Intel·ligència Artificial. "10é Congrés Internacional de l'Associació Catalana d'Intel·ligència Artificial". Sant Julià de Lòria: IOS Press, 2007, p. 141-149.
dc.identifier.isbn978-1-58603-798-7
dc.identifier.urihttp://hdl.handle.net/2117/13246
dc.description.abstractRecord Linkage (RL) is an important component of data cleaning and integration and data processing in general. For years, many efforts have focused on improving the performance of the RL process, either by reducing the number of record comparisons or reducing the number of attribute comparisons, which reduces the computational time, but increases the amount of error. However, the real bottleneck of RL is the post-process, where the results have to be reviewed by experts that decide which pairs or groups of records are real links and which are false hits. In this paper we show that exploiting the semantic relationships (e.g. foreign key), established between one or more data sources, makes it possible to find a new sort of semantic blocking method that improves the number of hits and reduces the amount of review effort.
dc.format.extent9 p.
dc.language.isoeng
dc.publisherIOS Press
dc.subjectÀrees temàtiques de la UPC::Informàtica::Sistemes d'informació::Emmagatzematge i recuperació de la informació
dc.subject.lcshData integration (Computer science)
dc.subject.lcshElectronic data processing -- Data preparation
dc.subject.lcshElectronic data processing -- Quality control
dc.subject.otherData processing
dc.subject.otherSemantic information
dc.subject.otherBlocking algorithms
dc.subject.otherRecord linkage
dc.subject.otherData integration
dc.subject.otherData cleansing
dc.titleSemantic blocking for record linkage
dc.typeConference report
dc.subject.lemacProcessament electrònic de dades -- Control de qualitat
dc.subject.lemacProcessament electrònic de dades -- Depuració
dc.contributor.groupUniversitat Politècnica de Catalunya. DMAG - Grup d'Aplicacions Multimèdia Distribuïdes
dc.contributor.groupUniversitat Politècnica de Catalunya. DAMA-UPC - Data Management Group
dc.rights.accessRestricted access - publisher's policy
local.identifier.drac2417187
dc.description.versionPostprint (published version)
local.citation.authorNin, J.; Muntés, V.; Martinez-Bazan, N.; Larriba, J.
local.citation.contributorCongrés Internacional de l'Associació Catalana d'Intel·ligència Artificial
local.citation.pubplaceSant Julià de Lòria
local.citation.publicationName10é Congrés Internacional de l'Associació Catalana d'Intel·ligència Artificial
local.citation.startingPage141
local.citation.endingPage149


Fitxers d'aquest items

Imatge en miniatura

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple