Adaptive sampling methods for scaling up knowledge discovery algorithms

Domingo Soriano, Carlos; Gavaldà Mestre, Ricard; Watanabe, Osamu

Visualitza/Obre

R01-35.ps (275,8Kb)

Veure estadístiques d'ús d'UPCommons

Estadístiques de LA Referencia / Recolecta

Cita com:

Mostra el registre d'ítem complet

Domingo Soriano, Carlos

Gavaldà Mestre, Ricard

Watanabe, Osamu

Tipus de documentReport de recerca

Data publicació2001-07

Condicions d'accésAccés obert

Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets

Abstract

One of the biggest research challenges in KDD and Data Mining is to develop methods that scale up well to large amounts of data. A possible approach for achieving scalability is to take a random sample and do data mining on it. In this paper, we propose an adaptive sampling method to solve a variety of practically appearing data mining tasks on very large data. Our algorithms are adaptive in the sense that they determine from the data whether it has already seen enough data to reach a reliable conclusion. We prove the correctness of our method, estimate its efficiency theoretically, and show its efficienty experimentally on a concrete task requiring sampling.

CitacióDomingo, C., Gavaldà, R., Watanabe, O. "Adaptive sampling methods for scaling up knowledge discovery algorithms". 2001.

Forma partLSI-01-35-R

URIhttp://hdl.handle.net/2117/97852

Col·leccions

Departament de Ciències de la Computació - Reports de recerca [1.107]

Veure estadístiques d'ús d'UPCommons

Mostra el registre d'ítem complet

Fitxers	Descripció	Mida	Format	Visualitza
R01-35.ps		275,8Kb	Postscript	Visualitza/Obre

UPCommons. Portal del coneixement obert de la UPC

Adaptive sampling methods for scaling up knowledge discovery algorithms

Visualitza/Obre

Explora