IT-Architektur und Infrastruktur icon
IT-Architektur und Infrastruktur

Aufgabe der Arbeitsgruppe IT-Architektur ist die Entwicklung der technischen Basis der Plattform-MaterialDigital-Dienste. Über diese Dienste sollen materialwissenschaftliche Daten geteilt und transferiert werden. Das Teilen von Daten besteht aus mehreren Teilschritten: das Verfügbarmachen von Daten, die Suche nach Daten und die Nutzung von gefundenen Daten. An alle diese Teilschritte bestehen Qualitätsanforderungen, insbesondere auch bezüglich Sicherheit. Gleichzeitig soll die Instanziierung der dafür benötigten PMD-Software für Materialwissenschaftler*innen bzw. deren Institutionen mit vertretbarem Aufwand umsetzbar sein. Die Grundlage der Plattform bilden frei verfügbare und offene Software (Open Source) sowie standardisierte Protokolle. Dazu gehören unter anderem Container-, VPN- und Authentifizierungstechnologien sowie Webservices und das OAuth-Protokoll. Auf diesen freien Komponenten aufbauend entwickeln wir Komponenten, die die einzelnen Software-Pakete verbinden sowie die Anbindung für die Ausführung der Workflows und die Integration der Ontologien schaffen.

PMD-Mesh

Das PMD-Mesh ist ein Netzwerk zwischen den Software-Instanzen der PMD-Teilnehmer. Durch die Verwendung moderner Sicherheitstechnologien erlaubt das PMD-Mesh eine abgesicherte, direkte aber dennoch performante Kommunikation zwischen den Instanzen.

Wie funktioniert das PMD-Mesh?

Das PMD-Mesh basiert auf WireGuard, einer modernen, performanten VPN-Technologie. In der PMD werden direkte WireGuard-Tunnel zwischen den einzelnen PMD-Instanzen aufgesetzt und so ein Overlay-Netzwerk erstellt. Innerhalb dieses WireGuard-Netzwerkes wird IPv6 verwendet. Die grundlegenden Netzwerkdienste in dem Overlay-Netzwerk wie DHCP, DNS und Routing werden von der PMD bereitgestellt und sind für Anwendende weitestgehend transparent. Einzelne Dienste von PMD-Teilnehmenden sind somit über eindeutige, aber nur innerhalb des PMD-Meshs auflösbare, DNS-Namen addressierbar.

Unser dezentraler Ansatz

Die PMD versucht nicht eine weitere Datenhalde zu schaffen. Ein Dienst zur zentralen Sammlung von materialwissenschaftlichen Daten wird den differenzierten Anforderungen an den Umgang mit solchen Daten nicht gerecht. Insbesondere Nutzende unterschiedlicher Kategorien (Industrie, Wissenschaft) haben teils stark divergierende Anforderungen an das Teilen von Daten, denen eine zentrale Datenhaltung kaum gerecht werden kann.

Die PMD stellt somit die Hoheit über die eigenen Daten der PMD-Nutzerinnen in den Vordergrund. Jeder Anbieter*in von Daten soll differenziert entscheiden können, wer wie auf die angebotenen Daten zugreifen darf. Die Daten verbleiben somit auch bei den Anbietenden.

PMD-Satelliten

PMD-S Server

PMD-Satelliten (PMD-S) bestehen aus mehreren Software-Paketen. Einige davon sind zwingend notwendig zur Teilnahme an der PMD, andere sind optional und ermöglichen das Anbieten oder die Inanspruchnahme zusätzlicher Dienste. Wird diese Software an einer Institution aufgesetzt und mit gültigen PMD-Identitätsdaten (Schlüssel, Zertifikate) versorgt, entsteht eine PMD-S Instanz, die Teilnehmer im PMD-Mesh ist. Über diese PMD-S Instanz können die Dienste und Daten der PMD, also auch aller anderen PMD-S, in Anspruch genommen und auch eigene Dienste und Daten angeboten werden.

Container-basierte Architektur

Instanzen der PMD bestehen aus einer Kombination verschiedener Softwarepakete. Um diese Pakete möglichst einfach aufsetzen zu können, setzt die PMD auf Container. Container minimieren die Software-Anforderungen an die Ausführungsumgebung. Die zentralen PMD-Funktionen (wie z. B. das PMD-Mesh oder die Anbindung an das SSO) sind in einzelnen Containern gekapselt. Die Kombination und Vernetzung dieser Container untereinander macht eine PMD Instanz aus.

Es gibt dabei auch optionale Container, die nur bei Bedarf zum Einsatz kommen. Dies sind z. B. spezielle Ausführungsumgebungen für materialwissenschaftliche Anwendungen, die nicht auf jeder Instanz genutzt werden. Welche dieser optionalen Container vorhanden sind, darüber entscheidet der Betreiber der jeweiligen Instanz.

Obligatorische Komponenten von PMD-S Instanzen: - PMD-Mesh - DNS

Optionale Komponenten: - OntoDocker - Keycloak - SimStack - pyiron/jupyter

PMD-Central

Ein Teil der angestrebten Funktionalität der PMD lässt sich am effektivsten mithilfe eines zentralen Verzeichnisdienstes umsetzen. Die Suche nach angebotenen Diensten und Daten ist hier das prominenteste Beispiel. Daher gibt es eine Instanz der PMD, die diese zentralen Dienste bereitstellt. Diese Instanz wird als PMD-Central (PMD-C) bezeichnet.

PMD-C unterscheidet sich von PMD-S nur durch die Bereitstellung der zentralen Dienste. Eine Funktion der PMD ohne diese zentralen Dienste ist zwar möglich, bietet aber weitaus weniger Mehrwert.

Zentrale Dienste von PMD-C: - Verzeichnisdienst für Suchanfragen - App- und Workflow-Store Backend - Autoritativer DNS-Server für die PMD

Datensicherheit

Der Schutz der Daten im Transport wird durch das PMD-Mesh sichergestellt. Der Schutz der Daten liegt in der Verantwortung der anbietenden Seite. Die PMD-Instanz bietet die Möglichkeit, den Zugriff auf Daten über die PMD anhand von Zugriffsberechtigungen zu steuern.

Deployment & Teilnahme

Aufsetzen eines PMD-Satelliten

Der PMD-S Deployment Guide beschreibt alle Schritte, die für eine erfolgreiche Instanziierung und Integration eines "Platform Material Digital" (PMD)-Dienstes erforderlich sind.

Der Deployment Guide umfasst: - Systemvoraussetzungen und Vorbereitung - Installation und Konfiguration der Container - Anbindung an das PMD-Mesh - Konfiguration von Authentifizierung und Autorisierung - Best Practices für den Betrieb

Angebote und Mehrwerte

DataPortal: Das PMD DataPortal ist ein zentraler Zugangspunkt zur Suche und zum Abruf von materialwissenschaftlichen Daten innerhalb der PMD. Es demonstriert die Funktionsfähigkeit der dezentralen Architektur.

Demonstrator: Erleben Sie die PMD-Infrastruktur in Aktion und verstehen Sie, wie die verschiedenen Komponenten zusammenwirken.

Warum sollten Sie sich beteiligen?

Die Teilnahme an der PMD bietet: - Datensouveränität: Sie behalten die volle Kontrolle über Ihre Daten - Interoperabilität: Nutzen Sie Tools und Daten anderer Teilnehmer nahtlos - Sicherheit: Profitieren Sie von moderner, geprüfter Sicherheitsinfrastruktur - Community: Werden Sie Teil eines wachsenden Netzwerks von Materialwissenschaftlerinnen - Effizienz:* Vermeiden Sie Datensilos und redundante Entwicklungen

Wie beteilige ich mich?

  1. Informieren Sie sich im Deployment Guide
  2. Kontaktieren Sie das PMD-Team für Unterstützung beim Aufsetzen
  3. Nehmen Sie an Community-Meetings teil
  4. Teilen Sie Ihre Erfahrungen und tragen Sie zur Weiterentwicklung bei

Kontaktieren Sie uns, um mehr über die Teilnahme an der PMD-Infrastruktur zu erfahren!