Mostra el registre d'ítem simple

dc.contributorForné Muñoz, Jorge
dc.contributorEstrada Jiménez, José Antonio
dc.contributor.authorBrull Corretger, Hèlia
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament d'Enginyeria Telemàtica
dc.date.accessioned2019-09-07T19:46:33Z
dc.date.available2019-09-07T19:46:33Z
dc.date.issued2019-07-10
dc.identifier.urihttp://hdl.handle.net/2117/168006
dc.description.abstractDespite its undeniable advantages, the exponential growth of data analytic capabilities implies a significant increase in the risk of personal privacy loss and re-identification of the individuals appearing in databases. A tool capable of treating the data in a way that would avoid re-identification of the user and, thus, could be shared to other companies or to study groups would be undoubtedly effective. The main objective of this project focuses on anonymization of textual data. That is, the goal is to create a tool that enables the anonymization of an input text to prevent identity disclosure while conserving as much utility as possible. This is achieved with the help of Information Theory and Natural Language Processing techniques. Additionally, the user interaction is required to make certain decisions, having as a consequence a semi-automatic anonymization tool for textual data. Because of that, we have developed a Graphical User Interface. The evaluation of the tool in automatic mode has been carried out in order to check its performance in function of certain parameters.
dc.description.abstractA pesar de sus innegables ventajas, el crecimiento exponencial de las capacidades de análisis de datos han comportado un crecimiento significativo del riesgo de pérdida de privacidad del individuo. Una herramienta capaz de tratar los datos de forma que se evitara la re-identificación del usuario y, por lo tanto, permitiera que los datos pudiesen ser compartidos a empresas o grupos de estudio, sería indudablemente útil. El objetivo principal de este proyecto se basa en la anonimización de documentos textuales. Así, el objetivo es la creación de una herramienta que permita la anonimización de un texto de entrada para prevenir la re-identificación del usuario y, a la vez, conserve tanta utilidad del documento como sea posible. Esto es posible con la ayuda de la Teoría de la Información y técnicas de NLP (Natural Language Processing). Además, la interacción del usuario es necesaria para la toma de ciertas decisiones, obteniendo en consecuencia una herramienta semi-automática para anonimización de documentos textuales. Es por eso que se ha desarrollado una Interfaz Gráfica de Usuario. Se ha llevado a cabo la evaluación de la herramienta para analizar su comportamiento en función de varios parámetros.
dc.description.abstractMalgrat els innegables avantatges que aporta, el creixement exponencial de les capacitats d'anàlisi de dades comporta un creixement significatiu del risc de pèrdua de privacitat i re-identificació d'individus que apareixen en bases de dades. Una eina capaç de tractar les dades de manera que s'impedeixi la re-identificació de l'usuari i, per tant, permeti compartir les dades per estudis o a altres empreses seria, sens dubte, útil. L'objectiu principal d'aquest projecte es basa en l'anonimització de documents textuals. D'aquesta manera, l'objectiu és crear una eina que permeti l'anonimització d'un document textual d'entrada per prevenir que es reveli la seva identitat procurant tant com sigui possible mantenir la utilitat del document. Això és possible amb l'ajuda de la Teoria de l'Informació i de tècniques de NLP (Natural Language Processing). A més, la interacció de l'usuari es requereix per prendre certes decisions, obtenint, com a conseqüència, una eina semi-automàtica per l'anonimització de documents textuals. És per aquest motiu que s'ha desenvolupat una interfície gràfica d'usuari. A més, s'ha dut a terme l'evaluació de l'eina en mode automàtic per analitzar el seu comportament en funció de certs paràmetres.
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.rightsS'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectÀrees temàtiques de la UPC::Física
dc.subject.lcshInformation theory
dc.subject.lcshGraphical user interfaces (Computer systems)
dc.subject.lcshComputer security
dc.subject.lcshNatural language processing (Computer science)
dc.subject.otherinformation theory
dc.subject.othergraphical user interface
dc.subject.othercibersecurity
dc.subject.othernatural language processing
dc.subject.othertext processing
dc.subject.otherteoría de la información
dc.subject.otherinterfaz gráfica de usuario
dc.subject.otherseguridad informática
dc.subject.othertratamiento de textos
dc.subject.othertratamiento del lenguaje natural
dc.titleDevelopment and evaluation of a semi-automatic anonymization tool for textual data
dc.title.alternativeDesenvolupament i evaluació d'una eina semi-automàtica per a l'anonimització de documents textuals
dc.title.alternativeDesarrollo y evaluación de una herramienta semi-automática para la anonimización de documentos textuales
dc.typeBachelor thesis
dc.subject.lemacInformació, Teoria de la
dc.subject.lemacInterfícies gràfiques d'usuari (Informàtica)
dc.subject.lemacSeguretat informàtica
dc.subject.lemacTractament del llenguatge natural (Informàtica)
dc.identifier.slugETSETB-230.143576
dc.rights.accessOpen Access
dc.date.updated2019-07-12T05:51:22Z
dc.audience.educationlevelGrau
dc.audience.mediatorEscola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
dc.audience.degreeGRAU EN ENGINYERIA FÍSICA (Pla 2011)


Fitxers d'aquest items

Thumbnail

Aquest ítem apareix a les col·leccions següents

Mostra el registre d'ítem simple