DSpace DSpace UPC
 English   Castellano   Català  

Treballs academics UPC >
Facultat d'Informàtica de Barcelona >
Enginyeria Informàtica (Pla 2003) >

Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/2099.1/7667

Arxiu Descripció MidaFormat
Memoria.pdf5,15 MBAdobe PDFVeure/Obrir

Títol: Algoritmos de clustering basados en el concepto de líder
Autor: Hernández González, Jerónimo
Tutor/director/avaluador: Belanche Muñoz, Luis Antonio Veure Producció científica UPC
Universitat: Universitat Politècnica de Catalunya
Càtedra /Departament: Universitat Politècnica de Catalunya. Departament de Llenguatges i Sistemes Informàtics
Matèries: Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial::Representació del coneixement
Multivariate analysis
Representació de formes
Classificació automàtica
Anàlisi multivariable
Data: 23-jun-2009
Tipus de document: Master thesis (pre-Bologna period)
Resum: El objetivo principal de este proyecto final de carrera, que lleva por nombre “Algoritmos de clustering basados en el concepto de Líder”, consiste en obtener diferentes versiones de algoritmos de clustering modificando el algoritmo del Líder, asegurándose de que se conservan sus características básicas y buenas propiedades, modificándolo con el objetivo de aumentar las buenas propiedades y además resolver algunos de los problemas que le son conocidos. Un algoritmo de clustering trata de formar grupos con las instancias que recibe como entrada buscando una cierta estructura en los datos. Se caracteriza por ser una técnica no supervisada, es decir, no tiene en cuenta información de pertenencia previa de una instancia a un grupo. El algoritmo del Líder, en el cual se basa este proyecto, es un algoritmo clásico de clustering que realiza una sola pasada sobre las instancias de entrada. Sobre cada una comprueba su similitud con ciertas instancias “clave” ya pasadas, los líderes, que son los representantes de cada grupo de instancias creado hasta el momento. En base a los resultados de la comparación se toma una decisión: si la instancia es suficientemente similar a un líder, esta se incorpora al grupo de dicho líder. En cambio, si no es suficiente similar a ningún líder se crea un nuevo grupo con esa instancia como líder. El algoritmo básico del Líder tiene entre sus principales ventajas su rapidez de ejecución y el no necesitar más que una pasada sobre el conjunto de datos de entrada. Por el contrario, son varios los comportamientos que se podrían considerar defectuosos, como puede ser la dependencia del orden de los datos de entrada, así como otros inconvenientes en el funcionamiento interno del algoritmo que le otorgan una serie de propiedades que no son deseables (o más bien, le impiden contar con una serie de propiedades que se podrían considerar básicas y que son deseables para un algoritmo de este tipo). El algoritmo del Líder basa su funcionamiento en la comparación de las nuevas instancias con los líderes. Para llevar a cabo estas comparaciones hay dos opciones, usar medidas de distancia o usar medidas de similitud, siendo esta última la elegida en el proyecto. El trabajo consta de dos ramas concretas: estudio teórico-reflexivo y desarrollo en pruebas del método para tratar de resolver sus inconvenientes por un lado, y, luego, estudio algorítmico del método con la intención de mejorar su rendimiento dentro de los límites del lenguaje R, el elegido para el desarrollo del proyecto. Todo el proyecto se acompaña de un estudio de artículos de diversos autores que otorgan un poco de luz a la hora de tomar ciertas decisiones, conocer experiencias similares o buscar nuevas soluciones a problemas que se nos plantean.
URI: http://hdl.handle.net/2099.1/7667
Apareix a les col·leccions:Enginyeria Informàtica (Pla 2003)
Comparteix:



SFX Query

Aquest ítem (excepte textos i imatges no creats per l'autor) està subjecte a una llicència de Creative Commons Llicència Creative Commons
Creative Commons

 

Valid XHTML 1.0! Programari DSpace Copyright © 2002-2004 MIT and Hewlett-Packard Comentaris
Universitat Politècnica de Catalunya. Servei de Biblioteques, Publicacions i Arxius