Intelligent assistance for data pre-processing
Títol de la revista
ISSN de la revista
Títol del volum
Col·laborador
Editor
Tribunal avaluador
Realitzat a/amb
Tipus de document
Data publicació
Editor
Condicions d'accés
item.page.rightslicense
Publicacions relacionades
Datasets relacionats
Projecte CCD
Abstract
A data mining algorithm may perform differently on datasets with different characteristics, e.g., it might perform better on a dataset with continuous attributes rather than with categorical attributes, or the other way around. Typically, a dataset needs to be pre-processed before being mined. Taking into account all the possible pre-processing operators, there exists a staggeringly large number of alternatives. As a consequence, non-experienced users become overwhelmed with pre-processing alternatives. In this paper, we show that the problem can be addressed by automating the pre-processing with the support of meta-learning. To this end, we analyzed a wide range of data pre-processing techniques and a set of classification algorithms. For each classification algorithm that we consider and a given dataset, we are able to automatically suggest the transformations that improve the quality of the results of the algorithm on the dataset. Our approach will help non-expert users to more effectively identify the transformations appropriate to their applications, and hence to achieve improved results.
Descripció
Persones/entitats
Document relacionat
Versió de
Citació
Ajut
Forma part
Dipòsit legal
ISBN
ISSN
Altres identificadors
Referències
Col·leccions
inSSIDE - integrated Software, Service, Information and Data Engineering - Articles de revista
LIAM - Laboratori de Modelització i Anàlisi de la Informació - Articles de revista
Departament d'Enginyeria de Serveis i Sistemes d'Informació - Articles de revista
GESSI - Grup d'Enginyeria del Software i dels Serveis - Articles de revista
Departament d'Estadística i Investigació Operativa - Articles de revista

