Project builder: analysis optimization & automation of data engineering processes
Fitxers
(Accés restringit)
Títol de la revista
ISSN de la revista
Títol del volum
Autors
Correu electrònic de l'autor
Tutor / director
Tribunal avaluador
Realitzat a/amb
Tipus de document
Data
Condicions d'accés
item.page.rightslicense
Publicacions relacionades
Datasets relacionats
Projecte CCD
Abstract
Aquest Treball de Fi de Grau presenta el desenvolupament de tres projectes integrats d’enginyeria de dades orientats a optimitzar l’anàlisi de dades i automatitzar processos clau dins del sector elèctric i de l’automatització industrial a Schneider Electric. El treball contribueix a millorar l’eficiència operativa, donar suport a la presa de decisions i reduir l’esforç manual mitjançant solucions escalables basades en dades. El primer projecte, Project Builder Analytics, transforma dades d’interacció d’usuaris en una base de dades estructurada a Redshift, permetent-ne el seguiment mitjançant panells d’intel·ligència empresarial. El segon, CAB Document Generator, automatitza la generació de la documentació requerida pel Change Advisory Board, substituint un flux de treball manual i repetitiu. El tercer, User Retention Analysis, aplica un model d’arbre de decisió per identificar els factors de comportament que influeixen en la fidelització dels usuaris professionals. La implementació utilitza eines com Informatica PowerCenter, SnapLogic, Python i DBeaver, i integra tècniques d’ETL, automatització de processos i machine learning interpretable. També es tracten consideracions ètiques relacionades amb l’ús de dades i la transparència.
Este Trabajo de Fin de Grado presenta el desarrollo de tres proyectos integrados de ingeniería de datos orientados a optimizar el análisis de datos y automatizar procesos clave dentro del sector eléctrico e industrial en Schneider Electric. El trabajo contribuye a mejorar la eficiencia operativa, apoyar la toma de decisiones y reducir el esfuerzo manual mediante soluciones escalables basadas en datos. El primer proyecto, Project Builder Analytics, transforma datos de interacción de usuarios en una base de datos estructurada en Redshift, permitiendo su seguimiento mediante paneles de inteligencia empresarial. El segundo, CAB Document Generator, automatiza la generación de documentación requerida por el Change Advisory Board, sustituyendo un flujo de trabajo manual y repetitivo. El tercero, User Retention Analysis, aplica un modelo de árbol de decisión para identificar los factores de comportamiento que influyen en la fidelización de usuarios profesionales. La implementación utiliza herramientas como Informatica PowerCenter, SnapLogic, Python y DBeaver, e integra técnicas de ETL, automatización de flujos de trabajo y machine learning interpretable. También se abordan cuestiones éticas relacionadas con el uso de datos y la transparencia.
This thesis presents the development of three integrated data engineering projects aimed at optimizing data analysis and automating core processes within the electrical and industrial automation sector at Schneider Electric. The work supports operational efficiency, informed decision-making, and the reduction of manual effort through scalable data-driven solutions. The first project, Project Builder Analytics, focuses on transforming user interaction data into a structured Redshift database and enabling monitoring through business intelligence dashboards. The second, CAB Document Generator, automates the generation of documentation required by the Change Advisory Board, replacing a time-consuming manual workflow. The third, User Retention Analysis, applies a decision tree model to identify key behavioral features influencing professional user loyalty. The implementation involves tools such as Informatica PowerCenter, SnapLogic, and incorporates techniques in ETL, workflow automation, and interpretable machine learning. Ethical considerations around data usage and transparency are also addressed.
Descripció
Títol alternatiu emprat a la intranet docent de l'EPSEVG: "Project builder: optimización del análisis y automatización de procesos de ingeniería de datos".