Show simple item record

dc.contributorRubio Pacho, Enric
dc.contributorBlesa Aguilera, Maria Josep
dc.contributor.authorFelip Díaz, Agnès
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Ciències de la Computació
dc.date.accessioned2024-04-16T15:06:35Z
dc.date.available2024-04-16T15:06:35Z
dc.date.issued2024-01-22
dc.identifier.urihttp://hdl.handle.net/2117/406586
dc.description.abstractmyReach és una startup nascuda l'any 2018 amb l'objectiu de maximitzar la productivitat dels usuaris i minimitzar el temps perdut en la cerca de documents. Aquesta eina es diferencia d'altres aplicacions per la seva estructura de graf, representant la informació com a Nodes i Edges (Arestes). Tanmateix, un problema que s'ha observat és que a mesura que un usuari afegeix informació al seu compte, aquest es torna més difícil d'organitzar, o fa perdre més temps a l'usuari. L'objectiu d'aquest projecte és crear un sistema de recomanació que permeti recomanar Nodes existents per reduir el temps de cerca, ja que el sistema de recomanació actual es basa en recomanar la creació de nous Nodes i no soluciona aquest problema. Primerament es durà a terme un estudi dels diferents sistemes i tècniques per a la implementació del projecte. Seguidament es dissenyarà i implementarà una proposta de sistema, en aquest cas híbrid, que separa el procés de recomanació en dos passos. El primer pas consistirà en la recomanació de nodes similars mitjançant l'ús de tècniques de vectorització de text. Un cop aconseguit, s'aplicaran diverses estratègies i mètriques per poder trobar-ne una que funcioni correctament i retornar la llista de Nodes Similars. El segon pas es basarà en els nodes similars per poder recomanar tags. Aquest utilitzarà el pès o l'ordre en el que es trobaven els nodes similars per retornar les recomanacions de tags. Un cop implementat el sistema, es crearà un dataset de fitxers similars que s'utilitzaran per testejar quina de les diferents estratègies retorna millors recomanacions. Finalment, els resultats obtinguts que han permès implementar el sistema recomanador han sigut aquells que fan ús de centroid embeddings amb la mètrica cosine ja que semblen ser molt més estables en quant a eficàcia, espai i cost temporal.
dc.description.abstractmyReach is a startup born in 2018 with the objective of maximizing users' productivity and minimizing the time wasted on document search. What makes myReach stand out from competing productivity tools is the graph structure, where each unit of data is represented as a Node, allowing the user to create Relationships between any pair of Nodes. However, an observed issue is that as a user populates his account the large amount of information quickly becomes difficult to manage and the possibility of losing or misplacing documents and wasting time arises. The aim of this project is to create a Recommender System that suggests existing nodes to the user, reducing search time. Moreover, the current Recommender System implemented in myReach does not recommend existing Tags but only recommends the creation of new ones. To begin with, a study of possible types of Recommender Systems and techniques relevant to the project will be carried out. Subsequently, a proposal for a Recommender System will be designed and implemented, specifically a hybrid system that separates the recommendation process into two steps. The first step involves recommending similar nodes using text vectorization techniques. Once these recommendations are obtained, various strategies and metrics will be applied to return a list of similar nodes. The second step will rely on the Similar Nodes to recommend Tags. This step will consider the weight or order in which they appear to return related Tags as recommendations. Once the system is implemented, a dataset will be created to test the different strategies and to determine which one provides better recommendations. Finally, the obtained results, which have facilitated the successful implementation of this system in the application, indicate that the strategy using Centroid Embeddings and the Cosine metric appears to be much more stable in terms of space, efficiency, and temporal cost.
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.subjectÀrees temàtiques de la UPC::Informàtica::Sistemes d'informació
dc.subject.lcshRecommender systems (Information filtering)
dc.subject.otherSistema de recomanació
dc.subject.otherLLM
dc.subject.otherTransformadors
dc.subject.otherCerca Semàntica
dc.subject.otherVectorització de Text
dc.subject.otherApplicació
dc.subject.otherRecommender System
dc.subject.otherLarge Language Model
dc.subject.otherSemantic Search
dc.subject.otherText Vectorization
dc.subject.otherApplication
dc.titleDesign and implementation of a recommender system
dc.typeBachelor thesis
dc.subject.lemacSistemes recomanadors (Filtratge d'informació)
dc.identifier.slug183483
dc.rights.accessOpen Access
dc.date.updated2024-01-29T05:00:51Z
dc.audience.educationlevelGrau
dc.audience.mediatorFacultat d'Informàtica de Barcelona
dc.audience.degreeGRAU EN ENGINYERIA INFORMÀTICA (Pla 2010)


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record