Ir al contenido (pulsa Retorno)

Universitat Politècnica de Catalunya

    • Català
    • Castellano
    • English
    • LoginRegisterLog in (no UPC users)
  • mailContact Us
  • world English 
    • Català
    • Castellano
    • English
  • userLogin   
      LoginRegisterLog in (no UPC users)

UPCommons. Global access to UPC knowledge

Banner header
63.979 UPC academic works
You are here:
View Item 
  •   DSpace Home
  • Treballs acadèmics
  • Facultat d'Informàtica de Barcelona
  • Enginyeria Informàtica (Pla 2003)
  • View Item
  •   DSpace Home
  • Treballs acadèmics
  • Facultat d'Informàtica de Barcelona
  • Enginyeria Informàtica (Pla 2003)
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Algoritmos de clustering basados en el concepto de líder

Thumbnail
View/Open
Memoria.pdf (5,033Mb)
Share:
 
  View Usage Statistics
Cita com:
hdl:2099.1/7667

Show full item record
Hernández González, Jerónimo
Tutor / directorBelanche Muñoz, Luis AntonioMés informacióMés informacióMés informació
Document typeMaster thesis (pre-Bologna period)
Date2009-06-23
Rights accessOpen Access
Attribution-NonCommercial-NoDerivs 3.0 Spain
Except where otherwise noted, content on this work is licensed under a Creative Commons license : Attribution-NonCommercial-NoDerivs 3.0 Spain
Abstract
El objetivo principal de este proyecto final de carrera, que lleva por nombre “Algoritmos de clustering basados en el concepto de Líder”, consiste en obtener diferentes versiones de algoritmos de clustering modificando el algoritmo del Líder, asegurándose de que se conservan sus características básicas y buenas propiedades, modificándolo con el objetivo de aumentar las buenas propiedades y además resolver algunos de los problemas que le son conocidos. Un algoritmo de clustering trata de formar grupos con las instancias que recibe como entrada buscando una cierta estructura en los datos. Se caracteriza por ser una técnica no supervisada, es decir, no tiene en cuenta información de pertenencia previa de una instancia a un grupo. El algoritmo del Líder, en el cual se basa este proyecto, es un algoritmo clásico de clustering que realiza una sola pasada sobre las instancias de entrada. Sobre cada una comprueba su similitud con ciertas instancias “clave” ya pasadas, los líderes, que son los representantes de cada grupo de instancias creado hasta el momento. En base a los resultados de la comparación se toma una decisión: si la instancia es suficientemente similar a un líder, esta se incorpora al grupo de dicho líder. En cambio, si no es suficiente similar a ningún líder se crea un nuevo grupo con esa instancia como líder. El algoritmo básico del Líder tiene entre sus principales ventajas su rapidez de ejecución y el no necesitar más que una pasada sobre el conjunto de datos de entrada. Por el contrario, son varios los comportamientos que se podrían considerar defectuosos, como puede ser la dependencia del orden de los datos de entrada, así como otros inconvenientes en el funcionamiento interno del algoritmo que le otorgan una serie de propiedades que no son deseables (o más bien, le impiden contar con una serie de propiedades que se podrían considerar básicas y que son deseables para un algoritmo de este tipo). El algoritmo del Líder basa su funcionamiento en la comparación de las nuevas instancias con los líderes. Para llevar a cabo estas comparaciones hay dos opciones, usar medidas de distancia o usar medidas de similitud, siendo esta última la elegida en el proyecto. El trabajo consta de dos ramas concretas: estudio teórico-reflexivo y desarrollo en pruebas del método para tratar de resolver sus inconvenientes por un lado, y, luego, estudio algorítmico del método con la intención de mejorar su rendimiento dentro de los límites del lenguaje R, el elegido para el desarrollo del proyecto. Todo el proyecto se acompaña de un estudio de artículos de diversos autores que otorgan un poco de luz a la hora de tomar ciertas decisiones, conocer experiencias similares o buscar nuevas soluciones a problemas que se nos plantean.
SubjectsMultivariate analysis, Anàlisi multivariable
DegreeENGINYERIA INFORMÀTICA (Pla 2003)
URIhttp://hdl.handle.net/2099.1/7667
Collections
  • Facultat d'Informàtica de Barcelona - Enginyeria Informàtica (Pla 2003) [1.189]
Share:
 
  View Usage Statistics

Show full item record

FilesDescriptionSizeFormatView
Memoria.pdf5,033MbPDFView/Open

Browse

This CollectionBy Issue DateAuthorsOther contributionsTitlesSubjectsThis repositoryCommunities & CollectionsBy Issue DateAuthorsOther contributionsTitlesSubjects

© UPC Obrir en finestra nova . Servei de Biblioteques, Publicacions i Arxius

info.biblioteques@upc.edu

  • About This Repository
  • Contact Us
  • Send Feedback
  • Privacy Settings
  • Inici de la pàgina