A semantic data integration approach to capture domain knowledge within collaborative projects
Fitxers
Títol de la revista
ISSN de la revista
Títol del volum
Autors
Correu electrònic de l'autor
Tutor / director
Tribunal avaluador
Realitzat a/amb
Tipus de document
Data
Condicions d'accés
item.page.rightslicense
Publicacions relacionades
Datasets relacionats
Projecte CCD
Abstract
Diverses ineficiències dificulten els projectes col·laboratius, com els projectes finançats, a causa de la seva complexa temàtica i estructura i a la diversitat de socis. Una de les majors ineficiències és el nombre de sitges de dades i coneixements que es produeixen en compartir informació sobre els dominis. Una sitja es produeix quan un soci perd informació rellevant d'un altre soci perquè no estava ben explicada o era inaccessible. Utilitzant les tecnologies de Semantic Web, un enfocament va ser desenvolupat per organitzar el coneixement de domini i incorporar-lo en la fase de definir la proposta d'un projecte finançat. Aquest enfocament conté un diagrama, anomenat DrOWLing, que recull el contingut del projecte per alinear-lo fàcilment amb els socis. Aquests DrOWLings poden convertir-se fàcilment en una ontologia llegible per màquina. Això permet identificar i eliminar les sitges de dades dins o entre projectes, departaments o paquets de treball. Utilitzant dos gràfics de coneixement (knowledge graphs) de projectes finançats per la indústria, es van crear preguntes de competència per reduir un triat conjunt de sitges de dades. Les consultes SPARQL en ambdós gràfics de coneixement de projectes finançats responen informació sobre aquestes sitges. Com a pas final, es va desenvolupar una matriu de complexitat per mesurar la millora d' un enfocament de DrOWLing sobre un basat en documents, concloent que era un enfocament eficaç per a l' alineació amb socis.
Various inefficiencies hinder collaborative projects, such as funded \break projects, due to their complex topic and structure and diversity of domain partners. One of the biggest inefficiencies is the number of data and knowledge silos when sharing domain information. A silo is when a partner misses relevant information from another partner because it was not well explained or was inaccessible. Using Semantic Web technologies, an approach was developed to organize domain knowledge and incorporate it into the funded proposal phase. This approach contains a diagram, named DrOWLing, that collects the project content to easily align it with the partners. These DrOWLings can be easily converted into a machine-readable ontology in the proposed approach. This allows to identify and remove data silos within or across projects, departments, or work packages. Using two knowledge graphs of funded projects from the industry, competency questions were created to reduce a chosen set of data silos. SPARQL queries on both funded project knowledge graphs answer information regarding these silos. As a final step, a complexity matrix was developed to measure the improvement of a DrOWLing approach over a document-based proposal one, concluding that it was an effective approach for alignment.

