Adaptive sampling methods for scaling up knowledge discovery algorithms
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/97852
Tipus de documentReport de recerca
Data publicació2001-07
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
One of the biggest research challenges in KDD and Data Mining
is to develop methods that scale up well to large amounts of data.
A possible approach for achieving scalability is to take a random sample and do data mining on it. In this paper, we propose an adaptive sampling method to solve a variety of practically appearing data mining tasks on very large data.
Our algorithms are adaptive in the sense that they determine
from the data whether it has already seen enough
data to reach a reliable conclusion.
We prove the correctness of our method,
estimate its efficiency theoretically, and show its
efficienty experimentally on a concrete task requiring sampling.
CitacióDomingo, C., Gavaldà, R., Watanabe, O. "Adaptive sampling methods for scaling up knowledge discovery algorithms". 2001.
Forma partLSI-01-35-R
Col·leccions
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
R01-35.ps | 275,8Kb | Postscript | Visualitza/Obre |