Dataset characterization for graph neural networks
Títol de la revista
ISSN de la revista
Títol del volum
Correu electrònic de l'autor
Tutor / director
Tribunal avaluador
Realitzat a/amb
Tipus de document
Data
Condicions d'accés
item.page.rightslicense
Publicacions relacionades
Datasets relacionats
Projecte CCD
Abstract
En los últimos años, un nuevo enfoque de modelado y aprendizaje a partir de datos relacionales ha conquistado el mundo del Deep Learning: las Graph Neural Networks (GNN). Los algoritmos distintivos de las GNN se encuentran en continuo desarrollo y crecimiento, con el objetivo de atender los desafíos específicos que se presentan en este dominio. Entre ellos, está el problema de que las soluciones actuales no se ajustan a todo tipo de datos. Además, las GNN conllevan metodologías muy costosas computacionalmente, y el número de operaciones que tienen que realizar puede crecer exponencialmente, dependiendo del grafo de entrada. Por todas estas razones, es necesario comprender mejor las propiedades comunes de estos grafos y sus efectos sobre el rendimiento de las GNN. Este proyecto tiene como objetivo explorar características importantes de varios datasets que pueden ayudar a las nuevas herramientas de aceleración de software a superar los problemas actuales y contribuir al desarrollo de las GNN.
In the last few years, a new approach of modeling and learning from relational data, has taken the Deep Learning world by storm: the Graph Neural Network (GNN) field. Distinctive GNN algorithms are in continuous development and growth, with the aim of attending the specific challenges that are presented over this domain. Among them, there is the problem that current solutions don't adjust to all kinds of data. In addition to that, GNNs entail very expensive methodologies in terms of computational cost, and the number of operations that they have to perform can exponentially grow, depending on the input graph. For all these reasons, there is a need to better understand network common properties and their effects towards GNN performance. This project aims to explore significant dataset characteristics that can assist new software acceleration tools to overcome the current issues and contribute to the GNNs development.

