Bijoux : data generator for evaluating ETL process quality
Visualitza/Obre
dolap2014.pdf (1,004Mb) (Accés restringit)
Sol·licita una còpia a l'autor
Què és aquest botó?
Aquest botó permet demanar una còpia d'un document restringit a l'autor. Es mostra quan:
- Disposem del correu electrònic de l'autor
- El document té una mida inferior a 20 Mb
- Es tracta d'un document d'accés restringit per decisió de l'autor o d'un document d'accés restringit per política de l'editorial
Cita com:
hdl:2117/26130
Tipus de documentText en actes de congrés
Data publicació2014
Condicions d'accésAccés restringit per política de l'editorial
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
Obtaining the right set of data for evaluating the fulfillment of different quality standards in the extract-transform-load (ETL) process design is rather challenging. First, the real data might be out of reach due to different privacy constraints, while providing a synthetic set of data is known as a labor-intensive task that needs to take various combinations of process parameters into account. Additionally, having a single dataset usually does not represent the evolution of data throughout the complete process lifespan, hence missing the plethora of possible test cases. To facilitate such demanding task, in this paper we propose an automatic data generator (i.e., Bijoux). Starting from a given ETL process model, Bijoux extracts the semantics of data transformations, analyzes the constraints they imply over data, and automatically generates testing datasets. At the same time, it considers different dataset and transformation characteristics (e.g., size, distribution, selectivity, etc.) in order to cover a variety of test scenarios. We report our experimental findings showing the effectiveness and scalability of our approach.
CitacióNakuçi, E. [et al.]. Bijoux : data generator for evaluating ETL process quality. A: International Workshop On Data Warehousing and OLAP. "Proceedings of the 17th International Workshop on Data Warehousing and OLAP". Shanghai: 2014, p. 23-32.
ISBN978-1-4503-0999-8
Versió de l'editorhttp://dl.acm.org/citation.cfm?doid=2666158.2666183
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
dolap2014.pdf | 1,004Mb | Accés restringit |