Forschung

Semantisches Datenmanagement

Um die Anzahl der steigenden strukturierten, semi-strukturierten und unstrukturierten Datenquellen effektiv zu verwalten, stellt das semantische Datenmanagement einen wichtigen Schwerpunkt unserer aktuellen Forschung dar. Ziel des semantischen Datenmanagements ist es Klarheit, Struktur und Verständlichkeit in die heterogene Datenlandschaft von Unternehmen, Kommunen und Forschungseinrichtungen zu bringen. Der gezielte Einsatz von semantischen Technologien, wie beispielsweise Wissensgraphen, Ontologien und semantischen Modellen, ermöglicht dabei die Verwaltung von Datenquellen auf Informationsebene, so dass die Bereitstellung wie auch die Zugänglichkeit und Verständlichkeit dieser Daten gewährleistet wird.

Semantische Modellierung

Um Daten auf dem Datenmarktplatz zu veröffentlichen, müssen Anbieter ihre Datenquellen hinzufügen und diese mit einem semantischen Modell beschreiben. Ein semantisches Modell ordnet dabei jedem Datenattribut innerhalb des Datensatzes eine dem System bekannte Bedeutung zu, in dem es Konzepte aus einem Wissensgraphen verwendet. Darüber hinaus kann weiteres zusätzliches für den Datensatz relevantes Wissen modelliert werden. Unsere Forschung beschäftigt sich hier insbesondere mit den Aspekten der (i) automatisierten Generierung von semantischen Modellen mittels maschineller Lernmethoden sowie der (ii) Erhöhung der Zugänglichkeit und Nutzbarkeit für sowie Unterstützung von Nutzer mit unterschiedlichen Vorerfahrungen im Bereich von semantischen Technologien. 

Aufbau von Wissensgraphen

Anstatt wie im Ontologie-basierten Datenmanagement das Modell alleine auf der Grundlage einer vordefinierten Ontologie zu generieren, erfolgt die semantische Modellierung entweder durch die Verwendung von Konzepten, die in dem vom Datenmarktplatz verwalteten Wissensgraphen verfügbar sind, oder durch die Definition eigener domänenspezifischer Konzepte. Letzteres führt zu einer automatisierten Erweiterung des Wissensgraphen. Im Vergleich zu statischen Ontologien ist dieser Wissensgraph in der Lage, neue und unbekannte Konzepte und Beziehungen kontinuierlich auf der Grundlage der hinzugefügten Datenquellen und ihrer semantischen Modelle zu adaptieren oder anzupassen.

PLASMA

Um große Teile unserer Forschung auch der Öffentlichkeit zugänglich zu machen, haben wir die Konzepte die im Datenmarktplatz verwendet werden in einem zusätzlichen Forschungsdemonstrator zur Verfügung gestellt. Dieses System, genannt PLASMA, ermöglicht die semantische Modellierung und das semantische Verbesserung für zur Verfügung gestellte Datensätze. Das Tool ist Open Source und kann über GitHub bezogen werden.

Veröffentlichungen

Recent Advances and Future Challenges of Semantic Modeling

Alexander Paulus, Andreas Burgdorf, André Pomp, Tobias Meisen, 2021 IEEE 15th International Conference on Semantic Computing (ICSC), Laguna Hills, CA,
USA, 2021, pp. 70-75, doi: 10.1109/ICSC50631.2021.00016

PLASMA: Platform for Auxiliary Semantic Modeling Approaches

Alexander Paulus, Andreas Burgdorf, Tristan Langer, André Pomp, Tobias Meisen, 2021 23rd International Conference on Enterprise Information Systems

Verbesserung der Nutzbarkeit von Open Data auf Basis eines semantischen Datenmarktplatzes

André Pomp, Alexander Paulus, Andreas Burgdorf, Tobias Meisen, 2021, Offene Kommunen NRW – Science Track https://oknrw.de/wordpress/wp-content/uploads/2020/12/Sammelband_ScienceTrack_2020_TR2021-1.pdf 

Towards NLP-supported Semantic Data Management

Andreas Burgdorf,  André Pomp, Tobias Meisen, 2020 22nd International Conference on Enterprise Information Systems – Doctoral Consortium (Best Paper Award) https://arxiv.org/abs/2005.06916