Automated data pre-processing via meta-learning
Visualitza/Obre
10.1007/978-3-319-45547-1_16
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/103255
Tipus de documentText en actes de congrés
Data publicació2016
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
A data mining algorithm may perform differently on datasets with different characteristics, e.g., it might perform better on a dataset with continuous attributes rather than with categorical attributes, or the other way around.
As a matter of fact, a dataset usually needs to be pre-processed. Taking into account all the possible pre-processing operators, there exists a staggeringly large number of alternatives and nonexperienced users become overwhelmed.
We show that this problem can be addressed by an automated approach, leveraging ideas from metalearning.
Specifically, we consider a wide range of data pre-processing techniques and a set of data mining algorithms. For each data mining algorithm and selected dataset, we are able to predict the transformations that improve the result
of the algorithm on the respective dataset. Our approach will help non-expert users to more effectively identify the transformations appropriate to their applications, and hence to achieve improved results.
Descripció
The final publication is available at link.springer.com
CitacióBilalli, B., Abello, A., Aluja, T., Wrembel, R. Automated data pre-processing via meta-learning. A: International Conference on Model and Data Engineering. "Model and Data Engineering - 6th International Conference, MEDI 2016, Proceedings". Almeria: 2016, p. 194-208.
ISBN9783319455464
Versió de l'editorhttp://link.springer.com/chapter/10.1007/978-3-319-45547-1_16
Col·leccions
- MPI - Modelització i processament de la Informació - Ponències/Comunicacions de congressos [119]
- LIAM - Laboratori de Modelització i Anàlisi de la Informació - Ponències/Comunicacions de congressos [64]
- Departament d'Enginyeria de Serveis i Sistemes d'Informació - Ponències/Comunicacions de congressos [529]
- Departament d'Estadística i Investigació Operativa - Ponències/Comunicacions de congressos [254]
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
16.MEDI.Besim.pdf | 332,5Kb | Visualitza/Obre |