Show simple item record

dc.contributorPérez Marín, Ana María
dc.contributorBolancé Losilla, Catalina
dc.contributor.authorOrgaz Expósito, Álvaro
dc.contributor.otherUniversitat de Barcelona. Departament d'Econometria, Estadística i Economia Aplicada
dc.date.accessioned2018-11-08T13:36:10Z
dc.date.available2018-11-08T13:36:10Z
dc.date.created2018-09-05T10:07:41Z
dc.date.issued2018-07
dc.identifier.urihttp://hdl.handle.net/2117/123747
dc.description.abstract(eng) This bachelor’s degree thesis aims to develop a predictive analytics guide for credit fraud detection using the Big Data tool Spark. Thus, the essence of this project is structured in three main linked sections which combine theory and practice. The first part is a description of the problem and concepts about credit risk as well as its historical context. The second section contains a theoretical research in predictive algorithms, frequently known as machine learning1 or artificial intelligence2 models. The third part is a real case practical application of the studied models for predicting the probability of default for a given dataset. However, nowadays one of the most common problems in predictive analytics is the huge amount of available data, and it gives meaning to the concept of Big Data. Thus, this project will use the tool Spark, which is an engine for processing Big Data.
dc.description.abstract(cat) Aquest projecte final de grau pretén desenvolupar una guia sobre algoritmes predictius aplicats a la detecció del frau creditici utilitzant una eina de Big Data anomenada Spark. Així doncs, l'essència d'aquest projecte s'estructura en tres seccions enllaçades les quals combinen teoria i pràctica. La primera part és una descripció del problema i conceptes sobre el risc creditici així com el seu context històric. La segona secció conté una investigació teòrica en algoritmes predictius, freqüentment vinculats als conceptes d’aprenentatge automàtic o models d’intel·ligència artificial. La tercera part és una aplicació pràctica dels models estudiats a un cas real per predir la probabilitat d’impagament per a un determinat conjunt de dades. Malgrat això, actualment un dels problemes més comuns en els projectes d’algoritmes predictius és la gran quantitat de dades disponibles, la qual cosa dóna sentit al concepte del Big Data. Així doncs, aquest projecte utilitzarà l'eina Spark, la qual és un motor de processament de grans quantitats de dades. En conclusió, aquesta tesi final de grau serà un manual per aquells usuaris que vulguin aprendre sobre: la detecció i gestió del risc creditici amb algoritmes predictius; la teoria que hi ha darrere els principals algoritmes en l’àrea de l’aprenentatge automàtic i la intel·ligència artificial; i l’aplicació d’aquests a un cas real des del plantejament del problema fins a la presa de decisions (incloent-hi el codi de programació necessari).
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.publisherUniversitat de Barcelona
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Spain
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Matemàtiques i estadística::Estadística matemàtica
dc.subject.lcshAlgorithms and computation in mathematics
dc.subject.otherData science
dc.subject.otherMachine learning
dc.subject.otherArtificial intelligence
dc.subject.otherCredit scoring
dc.subject.otherBig Data
dc.subject.otherSpark
dc.subject.otherAnalytics
dc.subject.otherLinear and non-linear models
dc.titleGuide to Spark Machine Learning for credit scoring
dc.typeBachelor thesis
dc.subject.lemacAlgorismes
dc.subject.amsClassificació AMS::68 Computer science::68T Artificial intelligence
dc.subject.amsClassificació AMS::68 Computer science::68W Algorithms
dc.rights.accessOpen Access
dc.audience.educationlevelEstudis de primer/segon cicle
dc.audience.mediatorUniversitat Politècnica de Catalunya. Facultat de Matemàtiques i Estadística


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Spain
Except where otherwise noted, content on this work is licensed under a Creative Commons license : Attribution-NonCommercial-NoDerivs 3.0 Spain