Data mining in Breast Cancer
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/101910
Tutor / directorBonnet, Philippe
Realitzat a/ambIT-Universitetet i København
Tipus de documentTreball Final de Grau
Data2016
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
Machine learning and data mining methods can be the future of the clinical decision
process like pathological diagnosis. In this project we studied Breast Cancer Wisconsin
dataset and applied different algorithms, concretely classifiers, in order to predict the
diagnosis and the prognostic of the cancer.
In order to classify the different types of cancer we divided the classification in two steps
and we tested different algorithms for each step. The first step is the diagnosis
classification. Diagnosis consistsin predict if the cancer is malignant and benign. And the
second step is the prognostic classification. Prognostic consist in predict if cancer is
recurrent or non-recurrent.
After applying different models for each steps the result is that the best model to predict
the diagnosis is the Decision Forest model. And the best model to predict the prognostic
is the Boosted Decision Tree model.
So, we conclude that the two step classifier with Decision Forest model and Boosted
Decision Tree model is the best classifier.
TitulacióGRAU EN ENGINYERIA INFORMÀTICA (Pla 2010)
Col·leccions
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
122076.pdf | 1,555Mb | Visualitza/Obre |