Langzeitverfügbarkeit
Bayern

Informationen für Forschende

Forschungsdaten und Forschungsdatenmanagement

Als Forschungsdaten können alle Daten verstanden werden, die im Laufe eines Forschungsprozesses entstehen und diesen dokumentieren. Diese Daten sowie deren Formate weisen dabei eine große Vielfalt auf und unterscheiden sich in der Regel sowohl disziplin- als auch projektabhängig. Forschungsdaten können also beispielweise Mess- oder Umfragedaten, 3D-Modelle, audiovisuelle Daten oder auch Software-Entwicklungen sein.

Forschungsdaten bilden eine Grundlage wissenschaftlichen Arbeitens sowie neuer wissenschaftlicher Erkenntnisse. Um die Nachvollziehbarkeit dieser essentiellen Daten und die damit verbundene Qualität des gesamten Forschungsprozesses aufrecht zu erhalten, ist die Umsetzung eines nachhaltigen Forschungsdatenmanagements notwendig. Anhand des Lebenszyklus von Forschungsdaten wird dabei der gesamte Forschungsprozess von der Planung eines Forschungsvorhabens über die Erhebung, Analyse und Veröffentlichung bis hin zur Speicherung und Nachnutzung der Daten systematisch begleitet.

Die rechtliche Grundlage für die langfristige Verfügbarkeit von Forschungsdaten bildet die sogenannte Datenübernahmevereinbarung. Diese Vereinbarung zwischen dem Forschenden und der Institution definiert verschiedene Begriffe, stellt sicher, dass die Rechte und Pflichten beider Parteien gewahrt bleiben, und legt unter anderem fest, was mit den Daten geschieht, wenn ein Forschender die Institution verlässt.

Forschungsdatenlebenszyklus

Langzeitverfügbarkeit von Forschungsdaten

Warum sollte ich meine Forschungsdaten langfristig verfügbar machen?

Für ein nachhaltiges Forschungsdatenmanagement ist nicht nur die Speicherung der Daten, sondern vor allem deren Nachnutzung essentiell. Im Laufe des Forschungsprozesses werden die Daten häufig in Form eines Back-Up (mehrfach) gesichert. Bei diesem Vorgehen, der sogenannten Bitstream Preservation werden die Daten quasi im aktuellen Zustand eingefroren. Es hat sich jedoch gezeigt, dass durch den technologischen Wandel bedingt insbesondere Dateiformate veralten können und in der Konsequenz nicht mehr zugänglich und damit nicht mehr nutzbar sind. Die Langzeitverfügbarkeit setzt genau an diesem Punkt an und stellt sowohl die technische als auch die inhaltliche Interpretierbarkeit der Forschungsdaten sicher und ermöglicht dadurch eine langfristige Verfügbarkeit der Daten.

Was ist der Vorteil eines Langzeitarchivierungssystems?

Im Gegensatz zu einem klassischen Speichersystem, welches eine rein physische Speicherung der Daten gewährleistet, ermöglicht die Langzeitverfügbarkeit, wie der Name bereits sagt, eine dauerhafte Verfügbarkeit und damit auch mögliche Nutzbarkeit der Daten. Dies erfolgt automatisiert, beispielsweise bei der drohenden Obsoleszenz eines Formats, indem die Migration auf ein neues, wieder lesbares Format erfolgt.

Wie kann ich meine Daten langfristig verfügbar machen?

Grundsätzlich muss eine Möglichkeit vorhanden sein, Daten in ein geeignetes Langzeitarchivierungssystem zu bringen. In Bayern besteht eine solche Möglichkeit im Rahmen der zentral-dezentralen Infrastruktur. Damit Forschenden innerhalb dieser Struktur ihre Forschungsdaten selbstständig für die Langzeitverfügbarkeit vorbereiten und schlussendlich langfristig verfügbar machen können, wurde im Projekt „Digitale Langzeitverfügbarkeit im Bibliotheksverbund Bayern“ das Pre-Ingest Tool „FDOrganizer“ entwickelt.

Welche Voraussetzungen müssen meine Daten für die Langzeitverfügbarkeit erfüllen?

Grundsätzlich gibt es keine Einschränkungen für die Speicherung im Langzeitarchivierungssystem. Es sollte jedoch beachtet werden, dass für bestimmte Daten unter Umständen keine logische oder semantische Langzeitverfügbarkeit, sondern lediglich eine rein physische Speicherung der Daten (Bitstream Preservation) erfolgen kann, wenn beispielsweise das Dateiformat bereits zum Zeitpunkt der Einlieferung veraltet ist und keine Migration mehr möglich ist. Vor der Übergabe von Forschungsdaten in die langfristige Verfügbarkeit sollte zwischen dem Forschenden und der jeweiligen Institution eine individuelle Datenübernahmevereinbarung abgeschlossen werden. Diese regelt die Rechte und Pflichten der beiden Parteien und definiert die Zugriffs- und Langzeitverfügbarkeitsziele. Um vorab einen ersten Überblick über die zu erfüllenden technischen und rechtlichen Voraussetzungen zu erhalten, kann im Vorfeld eine Checkliste zu Rate gezogen werden.

Welches Dateiformat eignet sich am besten für die Langzeitverfügbarkeit?

Diese Frage lässt sich nicht pauschal beantworten. Grundsätzlich sollten offene, nicht-proprietäre Dateiformate bevorzugt werden. Je nach Verwendungszweck können jedoch verschiedene Formate unterschiedlich geeignet sein. Bei der Auswahl eines geeigneten Formats kann der Best-Practice-Guide für Dateiformate zu Rate gezogen werden.

Gibt es eine Begrenzung der Datenmenge?

Von Seiten des Langzeitarchivierungssystems gibt es keine prinzipielle Begrenzung der Datenmenge. Jedoch kann diese aufgrund von technischen Einschränkungen während des Ingest-Prozess faktisch beschränkt sein. Auch der dauerhafte finanzielle Aufwand für die Langzeitverfügbarkeit sollte bei der Größe und Menge der Daten berücksichtigt werden.

Was kostet die Langzeitverfügbarkeit?

Die Kosten für die Langzeitverfügbarkeit setzen sich aus verschiedenen Komponenten zusammen. Im Rahmen der ZDI werden in erster Linie Speicherkosten verrechnet, dies erfolgt je nach Datenmenge und Zahl der genutzten Workflows gestaffelt in drei Nutzerklassen. Die Kooperationspartner beteiligen sich somit in Form einer jährlichen Kostenbeteiligung an der Finanzierung. Eine direkte Abrechnung zwischen der Bayerischen Staatsbibliothek/Verbundzentrale des BVB und den Forschenden findet nicht statt. Für weitere Informationen wenden Sie sich bitte an den zuständigen Ansprechpartner Ihrer Einrichtung.

Gibt es Fördermöglichkeiten für die Finanzierung der Langzeitverfügbarkeit?

Derzeit sind uns leider noch keine offiziellen Fördermöglichkeiten für eine explizite Finanzierung der Langzeitverfügbarkeit von Forschungsdaten bekannt. Dennoch empfiehlt es sich, möglichst zu Beginn der Antragstellung oder im Rahmen der Erstellung eines Datenmanagementplans mit den zuständigen Ansprechpartnern der eigenen Institution Kontakt aufzunehmen, um allgemeine Fördermöglichkeiten zur Finanzierung von Langzeitverfügbarkeitskosten zu prüfen.

Meine Forschungsdaten enthalten personenbezogene Daten, kann ich diese ebenfalls langzeitverfügbar machen?

Für die Übernahme in das Langzeitarchivierungssystem müssen die geltenden datenschutzrechtlichen Standards sowie Bestimmungen eingehalten werden. Es dürfen dadurch keine Rechte Dritter im Sinne des Datenschutzes verletzt werden. Die Verarbeitung besonderer Kategorien von Daten nach Art. 9 DSGVO ist grundsätzlich ausgeschlossen. Bei allgemeinen Fragen zur Verwendung von personenbezogenen Daten innerhalb Ihres Forschungsprojekts wenden Sie sich bitte an den zuständigen Ansprechpartner Ihrer Institution.

Verwaiste Daten

Was versteht man unter verwaisten Daten?

Unter verwaisten Daten können solche Daten verstanden werden, für die kein verantwortlicher Ansprechpartner mehr ermittelt werden kann, deren Rechteinhaber/in nicht mehr eindeutig festgestellt werden kann oder für die die Finanzierung der Langzeitverfügbarkeit nicht mehr sichergestellt werden kann.

Warum können Daten verwaisen?

Langfristig gesehen führt eine zeitlich unbefristete Aufbewahrung von Forschungsdaten immer dazu, dass diese Daten ab einem bestimmten Zeitpunkt als verwaist gelten und somit keine zuständige verantwortliche Person mehr ermittelt werden kann. Aber auch kurzfristig gesehen besteht bereits die Gefahr, dass Daten verwaisen, in der Folge nicht mehr verfügbar gemacht werden und damit nicht mehr nutzbar sind. Solche Situationen können durch alltägliche Umstände entstehen, wie beispielsweise, wenn Forschende eine Institution verlassen oder Forschungsprojekte beendet werden.

Warum sind verwaiste Daten für die Langzeitverfügbarkeit von Forschungsdaten problematisch?

Der Umgang mit verwaisten Daten kann beispielsweise zu Problemen führen, wenn zum Zeitpunkt der Langzeitverfügbarmachung der Forschungsdaten nicht entsprechende Vorbereitungen getroffen werden. Wenn beispielsweise keine Lizenzbedingungen vergeben wurden oder die Finanzierung nicht geregelt wurde, kann dies dazu führen, dass in Zukunft keine Nachnutzung der Daten mehr möglich ist oder diese unter Umständen sogar gelöscht werden müssen, obwohl sie noch von Interesse sein können.