Mostra el registre d'ítem simple
Machine learning approaches for the prediction of polygenic obesity using genome-wide genotyping data
dc.contributor | Reina Garcia, Óscar |
dc.contributor | De Cid Ibeas, Rafael |
dc.contributor | Ribas Ripoll, Vicente Jorge |
dc.contributor | Ruiz Dern, Laura |
dc.contributor.author | Pitarch i Abaigar, Carla |
dc.contributor.other | Universitat Politècnica de Catalunya. Departament d'Estadística i Investigació Operativa. Grup de Recerca en Bioestadística i Bioinformàtica |
dc.date.accessioned | 2020-07-29T12:44:11Z |
dc.date.issued | 2020-06 |
dc.identifier.uri | http://hdl.handle.net/2117/327980 |
dc.description.abstract | In the last decade, Polygenic Risk Scores (PRSs) have been widely used to identify individuals at high risk of being obese. In the present study, we propose to consider a variety of Machine Learning (ML) algorithms to estimate the prediction of obesity. We benchmarked PRS, Random Forest (RF), Gradient Boosting (GB) and Support Vector Machine (SVM) on a database of thousands of patients and millions of Single Nucleotide Polymorphisms (SNPs). To deal with the high-dimensional data we needed to deploy a HDP (Hortonworks Data Platform) cluster composed of multiple machines in order to distribute our data and processes. We used the most popular tools for processing Big Data, Apache Hadoop and Apache Spark, which allow for the parallelization across the cluster. |
dc.language.iso | eng |
dc.publisher | Universitat Politècnica de Catalunya |
dc.publisher | Universitat de Barcelona |
dc.subject | Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial |
dc.subject | Àrees temàtiques de la UPC::Matemàtiques i estadística |
dc.subject.lcsh | Artificial intelligence |
dc.subject.other | Obesity |
dc.subject.other | Polygenic Risk Score |
dc.subject.other | Machine Learning |
dc.subject.other | Random Forest |
dc.subject.other | Gradient Boosting |
dc.subject.other | Support Vector Machine |
dc.subject.other | Single Nucleotide Polymorphism |
dc.subject.other | Big Data |
dc.subject.other | Apache Hadoop |
dc.subject.other | Apache Spark |
dc.title | Machine learning approaches for the prediction of polygenic obesity using genome-wide genotyping data |
dc.type | Master thesis |
dc.subject.lemac | Intel·ligència artificial |
dc.subject.ams | Classificació AMS::68 Computer science::68T Artificial intelligence |
dc.identifier.slug | FME-2012 |
dc.rights.access | Restricted access - author's decision |
dc.date.lift | 10000-01-01 |
dc.date.updated | 2020-07-04T05:27:09Z |
dc.audience.educationlevel | Màster |
dc.audience.mediator | Universitat Politècnica de Catalunya. Facultat de Matemàtiques i Estadística |
dc.audience.degree | MÀSTER UNIVERSITARI EN ESTADÍSTICA I INVESTIGACIÓ OPERATIVA (Pla 2013) |
Fitxers d'aquest items
Aquest ítem apareix a les col·leccions següents
-
Màster universitari en Estadística i Investigació Operativa (UPC-UB) [437]
Titulació interuniversitària UPC-UB