A Review of Regression Trees Algorithms in C++ and their application

View/Open
Document typeBachelor thesis
Date2019-06
Rights accessOpen Access
Abstract
En aquesta tesis s'ha desenvolupat un software de generació d'arbres de decisió que fa completament autoexplicatius els arbres generats ja que, a més de la construcció del mateix, s'ha inclòs un conversor de regles lògiques d'una gramàtica natural. D'aquesta manera, qualsevol indiviu sense coneixement tènic previ pot entendre els factors més importants que influeixen en la presa de decisions de l'estructura de manera fàcil e intuitiva. A més, el nostre software generador d'arbres de decisió, permet a l'usuari modificar alguns dels paràmetres y mètodes de construcció per a realitzar anàlisi de rendiment d'arbres de decisió parametritzats de diferent manera. Algunes de les possibles modificacions o ajustos són: màxima profunditat de l'arbre (que afectarà tant a la precisió com a un possible sobreajustament), el criteri emprat per portar a terme les divisions en cadascú dels nodes o la tècnica de poda utilitzada. La generació d'arbres de decisió ha estat programada en R Shiny, una extgensió de R fàcil de utilitzar y en \CC{}, per tal d'amillorar la velocitat en els càlculs. Per últim, es presenten els resultats de la classificació mitjançant arbres de decisió en un senzill problema d'avaluació de riscos de clients en la concessió de prèstecs. In this thesis we developed a decision tree generation software which makes generated trees completely self-explanatory since, in addition to its construction, a converter to logical rules of a natural grammar is included. In this way, any individual without technical knowledge can understand the most important factors for making decisions in an easy and intuitive way. Furthermore, our decision tree generation software allows the user to change some of the building parameters and methods for doing performance analysis of different parametrised decision trees. Some of the adjustable options are: the maximum depth of the tree (which would affect both precision and a possible overfitting), the criteria used to perform the splits in each of the nodes or the pruning technique applied. The decision tree generation is programmed in a user-friendly R Shiny platform with functionalities in \CC{} to improve speed in computations. As applications we present the results of decision tree classification for financial credit scoring.
Collections
Files | Description | Size | Format | View |
---|---|---|---|---|
134205.pdf | 823,1Kb | View/Open |
All rights reserved. This work is protected by the corresponding intellectual and industrial
property rights. Without prejudice to any existing legal exemptions, reproduction, distribution, public
communication or transformation of this work are prohibited without permission of the copyright holder