Show simple item record

dc.contributorBelanche Muñoz, Luis Antonio
dc.contributor.authorSeshadri, Shreyas
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.date.accessioned2014-07-17T07:14:26Z
dc.date.available2014-07-17T07:14:26Z
dc.date.issued2014-06-18
dc.identifier.urihttp://hdl.handle.net/2099.1/22038
dc.description.abstract[ANGLÈS] The most common methodology of similarity based learning is the k-nearest neighbour method. But this has the disadvantage of having to store and calculate distances (similarities) for all the instances in the dataset. A more efficient methodology is to calculate similarities to only a set of chosen prototypes and use this as a new representation for learning. The current thesis deals with the implementation of these ideas using the Gower’s similarity measure for heterogeneous data. The comparison of clustering and feature selection methods for prototype selection is explored. Different methodologies are implemented in an attempt to improve the Gower’s similarity measure with the incorporation of weights for features. Novel methodologies to extract deep/higher level features from the similarity representation are proposed. The thesis provides preliminary results in these areas of research which are encouraging.
dc.description.abstract[CASTELLÀ] La metodología más común de aprendizaje basada en la similitud es el método del vecino k-más cercano. Pero esto tiene la desventaja de tener que almacenar y calcular distancias (similitudes) para todos los casos del conjunto de datos. Una metodología más eficiente es calcular similitudes con sólo un conjunto de prototipos seleccionados y utilizar esto como una nueva representación para el aprendizaje. La presente tesis trata de la puesta en práctica de estas ideas usando medida de similitud de Gower de datos heterogéneos. La comparación de la agrupación y la selección de características para la selección de métodos de prototipo se explora. Diferentes metodologías se implementan en un intento de mejorar la medida de similitud de la Gower, con la incorporación de los pesos para las características. Se proponen metodologías novedosas para extraer características de nivel de profundidad / superiores de la representación similitud. La tesis ofrece resultados preliminares en estas áreas de investigación que son alentadores
dc.description.abstract[CATALÀ] La metodologia més comuna d'aprenentatge basada en la similitud és el mètode del veí k-més proper. Però això té el desavantatge d'haver de emmagatzemar i calcular distàncies (similituds) per a tots els casos del conjunt de dades. Una metodologia més eficient és calcular similituds amb només un conjunt de prototips seleccionats i utilitzar això com una nova representació per a l'aprenentatge. Aquesta tesi tracta de la posada en pràctica d'aquestes idees utilitzant mesura de similitud de Gower de dades heterogènies. La comparació de l'agrupació i la selecció de característiques per a la selecció de mètodes de prototip s'explora. Diferents metodologies s'implementen en un intent de millorar la mesura de similitud de la Gower, amb la incorporació dels pesos per a les característiques. Es proposen metodologies noves per extreure característiques de nivell de profunditat / superiors de la representació similitud. La tesi ofereix resultats preliminars en aquestes àrees de recerca que són encoratjadors.
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsS'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Informàtica::Intel·ligència artificial::Aprenentatge automàtic
dc.subjectÀrees temàtiques de la UPC::Enginyeria de la telecomunicació
dc.subject.lcshMachine learning
dc.subject.otherSimilarity Representation
dc.subject.otherMachine learning
dc.subject.otheraprendizaje automático
dc.titleAnalysis of Similarity based Representations on Heterogeneous Data
dc.title.alternativeEl análisis de las representaciones basadas en similitud datos heterogéneos
dc.title.alternativeL'anàlisi de les representacions basades en similitud dades heterogènies
dc.typeMaster thesis
dc.subject.lemacAprenentatge automàtic
dc.identifier.slugETSETB-230.104052
dc.rights.accessOpen Access
dc.date.updated2014-07-03T05:50:39Z
dc.audience.educationlevelMàster
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivs 3.0 Spain
Except where otherwise noted, content on this work is licensed under a Creative Commons license : Attribution-NonCommercial-NoDerivs 3.0 Spain