Mostra el registre d'ítem simple
Performing data lineage for an ingestion system to a data lake
dc.contributor | Abelló Gamazo, Alberto |
dc.contributor.author | Garnica Caparrós, Marc |
dc.contributor.other | Universitat Politècnica de Catalunya. Departament d'Enginyeria de Serveis i Sistemes d'Informació |
dc.date.accessioned | 2017-01-17T12:43:25Z |
dc.date.available | 2017-01-17T12:43:25Z |
dc.date.issued | 2016-04-01 |
dc.identifier.uri | http://hdl.handle.net/2117/99453 |
dc.description.abstract | Aquest treball de final de grau engloba el disseny, desenvolupament i documentació d’un dels components del sistema WISCC. El World Information System for Chagas Control és un projecte propulsat per l’Organització Mundial de la Salut i actualment en desenvolupament pel grup Database Technologies and Information Management de la Facultat d’Informàtica de Barcelona. El projecte WISCC té el principal objectiu de construir un magatzem de dades provinents de nombroses i disperses fonts, tant en estructura com en contingut, relacionades amb la malaltia del Chagas. Aquest treball de final de grau documenta el desenvolupament complet del connector entre el sistema WISCC i el seu mòdul principal d’entrada de dades per part dels usuaris, implementat i distribuït mitjançant l’eina software DHIS2 . Aquest treball engloba des dels processos d’extracció per obtenir les dades de la font externa fins a la ingestió de les dades en el repositori central WISCC, mantenint un control i una anotació del flux de dades generat. |
dc.description.abstract | This bachelor degree project includes the design, development and documentation for a subcomponent of the WISCC System. The World Information System for Chagas Control is an ambitious project launched by the World Health Organization and currently being developed by Database Technologies and Information Management group in the Facultat d’Informàtica de Barcelona. WISCC project has the main goal to build a data repository integrating data from disparate sources related with Chagas disease. This project contains the complete development of the connector between the main WISCC System and its main manual data source, implemented and distributed through DHIS2 software tool. The documentation includes from the main software systems to obtain and extract all the information introduced on the external tool, to the main software systems to ingest the new data to the repository, maintaining annotations and control of this data lineage. |
dc.language.iso | cat |
dc.publisher | Universitat Politècnica de Catalunya |
dc.subject | Àrees temàtiques de la UPC::Informàtica::Sistemes d'informació |
dc.subject.lcsh | Information resources management |
dc.subject.lcsh | Data Mining |
dc.subject.other | repositori de dades |
dc.subject.other | flux de dades |
dc.subject.other | etl |
dc.subject.other | dhis2 |
dc.subject.other | data repository |
dc.subject.other | data lineage |
dc.subject.other | etl |
dc.title | Performing data lineage for an ingestion system to a data lake |
dc.type | Bachelor thesis |
dc.subject.lemac | Gestió del coneixement |
dc.subject.lemac | Mineria de dades |
dc.identifier.slug | 118304 |
dc.rights.access | Open Access |
dc.date.updated | 2016-07-06T06:27:28Z |
dc.audience.educationlevel | Grau |
dc.audience.mediator | Facultat d'Informàtica de Barcelona |
dc.audience.degree | GRAU EN ENGINYERIA INFORMÀTICA (Pla 2010) |