Jede_r von uns produziert tägliche jede Menge digitale Objekte, also Daten. Im Gespräch gibt Professor Andreas Rauber aus dem Forschungsbereich Data Science Einblick in das Thema Daten und digitale Objekte und lädt alle an Daten Interessierten zur 3rd FAIR Digital Objects Conference Ende März ein.
Was sind Digitalobjekte?
Andreas Rauber: Der Begriff Digitalobjekt umfasst so gut wie alles, was digital gespeichert wird, also Fotos und Videos, aber auch Satellitenbilder, Messreihen oder Large Language Models (LLMs).
Was macht Digitalobjekte zu FAIRen Digitalobjekten?
Andreas Rauber: Das Akronym FAIR steht für Findable (auffindbar), Accessible (zugänglich), Interoperable (kompatibel) und Reusable (wiederverwendbar) und beschreibt Kern-Anforderungen an solche digitalen Objekte. Was heißt das jetzt konkret? Digitale Objekte müssen von Maschinen auffindbar und unter Einhaltung aller zuvor definierten Regeln, was auch die rechtlichen Rahmenbedingungen inkludiert, zugänglich sein. Des Weiteren müssen die Systeme miteinander kommunizieren können – wenn es keine Verständigung von zwei oder mehr Systemen gibt, dann gibt es auch keinen Datenaustausch. Für den vierten Punkt, die Wiederverwendbarkeit, müssen neben den anderen drei der soeben genannten Voraussetzungen unter anderem auch die Erlaubnis zur Nutzung (Lizenz) oder Dokumentation über ihre Herkunft vorhanden sein. Denn nur dann können die Daten auch wieder verwendet werden.
Welche Rolle spielen FAIRe Digitalobjekte bei der Schaffung einer vertrauenswürdigen, weltweit nutzbaren Datenlandschaft?
Andreas Rauber: Eine sehr zentrale Rolle. Für Datenaustausch und Datennutzung müssen zumindest die Punkte Auffindbarkeit und Zugänglichkeit gegeben sein. Es geht um die Themen Interdisziplinarität, aber auch um globale Daten-Lieferketten. Da diese riesige Datenmenge händisch nicht mehr bewältigbar ist, braucht es den Einsatz von Maschinen, die, im besten Fall, die Daten „verstehen“ und automatisiert verarbeiten können, natürlich wieder unter der Einhaltung aller definierten Regeln. Oft wird auch die Frage nach guten und schlechten Daten gestellt. Daten per se sind weder gut noch schlecht, die Daten sind je nach Fragestellung brauchbar oder weniger brauchbar. Ein Beispiel dazu: für die Analyse von Klimavorhersagen werden oft sehr alte Daten verwendet, auch aus einer Zeit, wo die Messgeräte und -methoden weit weniger ausgefeilt waren als heute. Trotzdem sind auch diese Daten für die Gesamtanalyse sehr hilfreich und wertvoll, wenn auch die Daten per se eine nicht so präzise Aussagekraft haben.
Warum ist das Thema Digitalobjekte bzw. FAIRe Digitalobjekte in heutiger Zeit so ein wichtiges Thema?
Andreas Rauber: Daten sind essenziell, wir erzeugen und verwenden sie überall. Wichtig ist die Qualität der Daten sowie ihre Transparenz, ebenso wie die Frage nach der Kontrolle der Daten und wer die Verantwortung für sie und ihre Nutzung trägt. Eine Lösung muss auf drei verschiedenen Ebenen entstehen: auf der technischen, der politischen und der institutionellen Ebene. Auf technischer Ebene geht es um konkrete Lösungen, also darum, wie die Daten verarbeitet und ausgelesen werden mit denen die Systeme arbeiten, während auf der politischen Ebene die Rahmenbedingungen und Regeln für die Nutzung gestaltet werden. Die institutionelle Ebene ist strukturelle wichtig, hier werden die Organisationen, Verfahren und Regeln angepasst, um die Umsetzung der politischen Ziele zu ermöglichen. So entstehen schließlich Datenräume, denen ich als User_in prinzipiell vertrauen können sollte.
Vom 25. bis 27. März findet an der TU Wien die 3rd FAIR Digital Objects Conference statt. Der erste Konferenztag steht unter dem Motto "Trust Day", dazu wird es auch die Panel-Diskussion "Panel on Perspectives and Recommendation" mit renommierten Panel-Teilnehmenden unter anderem mit Ministerin Eva Maria Holzleitner, TU Wien Rektor Jens Schneider oder Thomas Hahn geben. Was wäre aus Ihrer Sicht ein idealer Outcome dieser Panel Diskussion?
Andreas Rauber: Gleich vorweg möchte ich sagen, dass wir am Ende der Podiumsdiskussion wahrscheinlich keine finale Lösung präsentieren werden können. Ziel der Diskussion wird vielmehr sein, dass wir Brücken bauen und uns auf ein gemeinsames Verständnis einigen und daraus erste Lösungsansätze oder Pilotanwendungen ableiten, die dann erweitert und verfeinert werden können. Es geht außerdem auch um Begriffe wie Offenheit und Transparenz sowie das gemeinsame Erkennen und Verstehen des großartigen Potenzials, das uns die Daten ermöglichen.
Auch in dieser Diskussion werden wir uns an den drei bereits genannten Ebenen orientieren. Auf der technischen Ebene werden uns Fragen nach technischen Problemlösungen, Protokollen und Mechanismen beschäftigen, während es auf institutioneller Ebene um Struktur und Umsetzung geht. Auf der politischen Ebene soll ein Regelwerk entstehen.
Durch die großen weltweiten vor allem kulturellen Unterschiede wird es nur schwer möglich sein, einen globalen Weltdatenraum zu erschaffen. Was wir aber sehr wohl erarbeiten können sind Gemeinsamkeiten und Ähnlichkeiten, die im Idealfall zu Standards werden. Mit solchen Standards können dann auch Maschinen so weit automatisiert werden, dass sie Datenverständnis ausverhandeln und prüfen können, ob bzw. wie Systeme zu einer Lösung gelangen. So eine Automatisierung spart dann Zeit und Geld. Wichtig ist auch eine leichte Zugänglichkeit zu Forschungsdaten-Repositorien, um Daten anderen Forschenden zur Verfügung zu stellen und miteinander zu teilen. Auch das spart Zeit und Kosten, wenn nicht jeder wieder bei Null anfängt, sondern schon erste Ergebnisse vorliegen, mit denen man schnell und einfach weiterarbeiten kann.
Vielen Dank für das Gespräch.
Konferenz-Details
3rd FAIR Digital Objects Conference
25. bis 27. März 2026
TU Wien, Kuppelsaal
Mehr Informationen und Anmeldung zur 3rd FAIR Digital Objects Conference, öffnet eine externe URL in einem neuen Fenster

