Nachhaltiges Datenmanagement
Der verantwortungsvolle Umgang mit Forschungsdaten ist Teil der guten wissenschaftlichen Praxis und für die Nachvollziehbarkeit der Forschung, den wissenschaftlichen Fortschritt und die Verbreitung wissenschaftlicher Erkenntnis unerl?sslich. Um den FAIR Data Prinzipien des nachhaltigen Forschungs Datenmanagements (FDM) gerecht zu werden, fallen zu unterschiedlichen Zeitpunkten eines Forschungsprojekts unterschiedliche Aufgaben innerhalb des FDM an. Im Folgenden werden die Aufgaben den drei unterschiedlichen Phasen, vor (Planungsphase), w?hrend (Implementierungsphase) und nach (Abschlussphase) der Projektdurchführung zugeordnet.
Planungsphase
In der Planungsphase eines Forschungsprojekts sollte unter anderem ein Datenmanagementplan (DMP) entstehen. Dabei k?nnen Tools wie der Research Data Management Organiser (RDMO) unterstützen. Für Projekte, die über Drittmittel finanziert werden sollen, ist es zudem wichtig, die Vorgaben der F?rdergeber zum FDM genau zu kennen.
Datenmanagementplan
F?rdergeber fordern zunehmend die Einreichung ausführlicher Datenmanagementpl?ne (DMP), gleichzeitig bieten sie die M?glichkeit, zus?tzliche Gelder für deren Umsetzung zu beantragen. Ein DMP beschreibt, welche Forschungsdaten innerhalb eines Forschungsprojekts produziert, wie diese dokumentiert und archiviert werden und welche Nachnutzungsm?glichkeiten bestehen. Er stellt sowohl einen Leitfaden für den Projektverlauf als auch für den Verbleib der Daten nach Projektende dar. Eine ?bersicht über die generellen FDM-Anforderungen einzelner F?rdergeber finden 360直播吧 hier. Sollten 360直播吧 Fragen zur Erstellung eines DMPs haben oder sich ein Feedback zu einem DMP-Entwurf wünschen, wenden 360直播吧 sich an das Forschungsdatenmanagement-Team der UPB.
Ein DMP sollte folgende grundlegende Fragen beantworten:
- Was ist das Ziel des Projekts? Welche Einrichtungen/Personen werden miteinbezogen?
- Welche Forschungsdaten werden dafür verarbeitet (erhoben/verwendet/gespeichert/nachgenutzt etc.) und wie flie?en diese Daten (Datenflussdiagramm)?
- Welche (fachspezifischen) Standards werden angewendet/berücksichtigt (z. B. Datenformate, Metadaten, Ontologien)?
- Welche Forschungsdaten werden dafür erhoben/nachgenutzt und wie?
- Welche (fachspezifischen) Standards werden angewendet / berücksichtigt (z. B. Datenformate, Metadaten, Ontologien)?
- Wie wird die Speicherung, Sicherung, Archivierung und ggf. Zug?nglichmachung von Forschungsdaten organisiert? Mit welchen Datenvolumina ist zu rechnen?
- Gibt es rechtliche, zeitliche oder andere Einschr?nkungen für die Zug?nglichmachung von Forschungsdaten, die berücksichtigt werden müssen?
- Wer übernimmt im gesamten Prozess welche Verantwortlichkeiten?
- Wer entscheidet über Mittel und Zwecke der Datenverarbeitung?
- Welche Kosten und Folgekosten fallen im Projekt an und wie werden sie abgedeckt?
Research Data Management Organiser (RDMO)
Mit dem Research Data Management Organiser (RDMO) bieten wir Ihnen ein Tool, das 360直播吧 bei der Erstellung eines DMP unterstützen soll. Das Tool führt 360直播吧 durch alle Fragen, die für einen DMP zu beantworten sind und gibt dabei hilfreiche Hinweise zur Beantwortung. Es kann dafür verwendet werden, einen DMP für die Beantragung von F?rdergeldern zu erstellen und im laufenden Forschungsprozess immer wieder ?nderungen aufzunehmen (z.B. neue Datens?tze anlegen). Momentan haben 360直播吧 auf der RDMO-Instanz der UPB Zugriff auf einen Fragenkatalog, der sich an den von der deutschen Forschungsgemeinschaft (DFG) empfohlenen Checkliste für einen angemessenen Umgang mit Forschungsdaten orientiert. Zukünftig sollen auch für einzelne F?rdergeber spezifische Fragenkataloge mit aufgenommen werden. Bei Fragen oder für Feedback zu diesem Tool, melden 360直播吧 sich gerne beim Forschungsdatenmanagement-Team der UPB.
Anforderungen von F?rdergebern zum Forschungsdatenmanagement (FDM)
Sind Angaben zum FDM bei der Beantragung von F?rdergeldern verpflichtend?
Für F?rderantr?ge an die Bundesministerien gibt es (noch) keine einheitlichen Anforderungen an das FDM. Einzelne Ausschreibungen k?nnen jedoch konkrete Vorgaben zum FDM beinhalten, beachten 360直播吧 daher die jeweiligen F?rderrichtlinien.
Wie im ?Aktionsplan Forschungsdaten“ des BMBF festgehalten, sollen jedoch alle Zuwendungsempf?nger verpflichtet werden, im Sinne der FAIR-Prinzipien ihre im Projekt erhobenen Daten systematisch, m?glichst standardbasiert zu verarbeiten und aufzubewahren.
In welcher Form müssen Angaben zum FDM im Forschungsantrag gemacht werden?
Die Bundesministerien erwarten zwar, dass Angaben zum FDM in F?rderantr?gen aufgenommen werden, jedoch gibt es bisher nur bei einzelnen Ausschreibungen konkrete Vorgaben, beachten 360直播吧 daher die jeweiligen F?rderrichtlinien.
Sollte es in Ihrer Ausschreibung keine konkreten Anforderungen zum FDM geben, empfehlen wir Ihnen, sich an den grundlegenden Fragen zur Erstellung eines DMPs zu orientieren oder unser RDMO zur schrittweisen Erstellung eines DMPs zu nutzen.
Muss jeder Verbundpartner ein eigenes FDM-Konzept vorlegen?
Dazu gibt es keine allgemeinen Vorgaben. Konkrete Vorgaben k?nnen in den einzelnen Ausschreibungen genannt werden, beachten sie daher die jeweiligen F?rderrichtlinien.
Gibt es F?rderm?glichkeiten für Kosten, die durch FDM anfallen?
Ja, in begründeten F?llen (z.B. gro?e Verbundvorhaben mit einem erh?hten FDM-Aufwand) k?nnen Mittel für FDM beantragt werden. Hierbei sind auch die jeweiligen F?rderrichtlinien zu beachten.
Sind Angaben zum FDM bei der Beantragung von F?rdergeldern verpflichtend?
In allen F?rderprogrammen der DFG, in denen ein Arbeitsprogramm für ein Forschungsvorhaben beschrieben wird, sind Angaben zum FDM verpflichtend. Bitte beachten 360直播吧 die Website der DFG zum FDM für detaillierte Anforderungen in den einzelnen F?rderprogrammen.
In welcher Form müssen Angaben zum FDM im Forschungsantrag gemacht werden?
Grundlage für die Angaben zum fDM sind die Checkliste und fachspezifische Empfehlungen der DFG. Zur schrittweisen Erstellung eines DMPs nach Vorgaben der DFG k?nnen 360直播吧 auch unser RDMO nutzen.
Muss jeder Verbundpartner ein eigenes FDM-Konzept vorlegen?
Nein, im Verbund kann ein gemeinschaftliches Konzept entwickelt werden.
Gibt es F?rderm?glichkeiten für Kosten, die durch FDM anfallen?
Ja, in allen F?rderprogrammen der DFG gibt es beantragbare Mittel für das FDM und die Nachnutzbarkeit sowie Verfügbarmachung der Daten. Für den Auf- und Ausbau von Forschungsdateninfrastrukturen oder von methodischen Ans?tzen für den Umgang mit Forschungsdaten stehen spezifische F?rderangebote der DFG zur Verfügung.
Sind Angaben zum FDM bei der Beantragung von F?rdergeldern verpflichtend?
In allen Linien von Horizon Europe sind Angaben zum FDM verpflichtend. Innerhalb der ersten 6 Projektmonate muss ein DMPs eingereicht werden, der jeweils zur Projekth?lfte und zu Projektende aktualisiert werden muss (siehe Annotated Model Grant Agreement). Um die Aktualisierungen des DMPs zu vereinfachen, empfehlen wir Ihnen die Nutzung des RDMO.
In welcher Form müssen Angaben zum FDM im Forschungsantrag gemacht werden?
Es gibt keine festen Vorgaben wie der DMP auszusehen hat, zur Unterstützung gibt es jedoch sowohl für ERC-Grants (siehe Dokumentenübersicht des ERC für die aktuelle Version) als auch die übrigen Horizon Europe F?rderlinien Templates (siehe Templates&forms bei den Reference Documents für die aktuelle Version). Au?erdem gilt, dass die im Projekt generierten Daten in einem geeigneten Repositorium ver?ffentlicht werden müssen (Ausnahmen nur in Einzelf?llen).
Muss jeder Verbundpartner ein eigenes FDM-Konzept vorlegen?
In der Regel wird ein gemeinsames FDM-Konzept vorgelegt.
Gibt es F?rderm?glichkeiten für Kosten, die durch FDM anfallen?
Ja, in allen F?rderlinien von Horizon Europe gibt es beantragbare Mittel für das FDM und die Nachnutzbarkeit sowie Verfügbarmachung der Daten (z.B. Kosten für Open Access Publikationen der Daten).
Implementierungsphase
In der Implementierungsphase eines Forschungsprojektes geht es um die Datenerhebung und Speicherung. Um die einzelnen Schritte der Datenerhebung dauerhaft nachvollziehen zu k?nnen, ist deren Dokumentation essentiell. Hierbei kann die Nutzung eines elektronischen Laborbuches hilfreich sein.
Datenerhebung
Bei der Datenerhebung – wie w?hrend der gesamten Projektlaufzeit – sollten 360直播吧 m?glichst auf Open-Source-Programme zurückgreifen, die Daten in einem offenen, nicht an das Programm gebundenen Dateiformat speichern. Sollten 360直播吧 auf ein propriet?res System angewiesen sein, empfiehlt sich trotzdem der Export in offene Dateiformate, um Abh?ngigkeiten von einzelnen Programmen entgegenzuwirken. Auch sollten die Daten m?glichst schon bei der Erhebung mit Metadaten beschrieben werden, um die Nachvollziehbarkeit ihres Entstehungskontextes sowohl innerhalb des Projektes als auch in Hinblick auf ihre evtl. sp?tere Ver?ffentlichung zu gew?hrleisten. In den verschiedenen Fachrichtungen haben sich eigene Standards von Metadaten entwickelt. Die Orientierung an diesen Standards kann zu einem besseren Austausch Ihrer Daten führen.
- Empfehlungen für Dateiformate finden 360直播吧 auf Forschungsdaten.info, usgs.gov, und ETHzürich.
- Mehr Informationen zu fachspezifischen Metadatenstandards finden 360直播吧 im Metadata Standards Directory, Metadata Standards Catalog, auf FAIRsharing.org und Forschungsdaten.info
Elektronische Laborbücher
In einem Laborbuch wird die Planung, Durchführung und Auswertung eines Laborversuchs dokumentiert. So bleibt die wissenschaftliche T?tigkeit für die Forschenden selbst, aber auch für Dritte nachvollziehbar, beispielsweise im Falle eines Personalwechsels oder Rechtstreits. Elektronische Laborbücher sind Programme, die zus?tzlich zu einer reinen Notizbuchfunktion weitere Features bieten, die speziell auf die wissenschaftliche Arbeit zugeschnitten sind (z.B. teilweise automatische Vergabe von Metadaten). Es gibt eine Vielzahl an elektronischen Laborbüchern für verschiedene Fachbereiche, Orientierung bei der Auswahl kann der ?ELN Finder“ von ZB MED und TU Darmstadt bieten.
Die Uni Paderborn wird zukünftig eine eigene Instanz des weit verbreiteten Open-Source-Laborbuchs eLabFTW anbieten. Auch wenn sich die eLabFTW-Instanz der UPB noch im Testbetrieb befindet, und wir Ihnen empfehlen, zu diesem Zeitpunkt noch keine sensiblen Daten hochzuladen, k?nnen 360直播吧 sich hier schon jetzt anmelden und einen Eindruck des Laborbuchs gewinnen.
Speicherung der Daten
W?hrend des laufenden Forschungsvorhabens sollte darauf geachtet werden, dass die Speicherung der entstehenden Daten bestimmte Qualit?tsstandards erfüllt. Beispielsweise muss sichergestellt sein, dass nur Forschende auf dei Daten zugreifen k?nnen, die dazu berechtigt sind. Au?erdem müssen regelm??ige Sicherungen durchgeführt werden, um den Datenverlust im Falle physischer Zerst?rung oder menschlicher Fehler m?glichst gering zu halten.
Je nach Art der Daten bieten sich verschiedene Speicherm?glichkeiten an, etwa der Netzwerkspeicher der Universit?t, die Online-Plattform GitLab, oder der Cloud-Speicherdienst Sciebo.
Speicherm?glichkeiten
Für nichtbin?re Daten (etwa reine Textdaten oder Programmcode) empfiehlt sich die Ablage in GitLab, denn hier werden Daten nicht nur gespeichert, sondern darüber hinaus versioniert. Jede ?nderung in der Projektlaufzeit kann auf diese Weise nachvollzogen und ggf. rückg?ngig gemacht werden. Au?erdem erlaubt GitLab das parallele Arbeiten an den Daten und bietet weitere Instrumente des Projektmanagements, wie etwa ein Ticketsystem. Da das ZIM eine eigene GitLab-Instanz betreibt, bleiben die Daten au?erdem innerhalb der Universit?t. Mehr Informationen erhalten SIe auf dem HilfeWiki des ZIM.
Das ZIM betreibt einen Netzwerkspeicher, der Angestellten, Studierenden und G?sten der UPB zur Verfügung steht. Die Daten liegen dabei redundant auf mindestens drei verschiedenen Festplatten. Regelm??ige Snapshots des Netzwerkspeichers schützen die Daten vor versehentlichem L?schen und ?berschreiben. Ein Backup erfolgt jede Nacht automatisch. Da er die Daten nicht verschlüsselt, muss bei Bedarf selbst für eine Verschlüsselung gesorgt werden.
Sciebo ist ein nichtkommerzieller Cloud-Speicherdienst, an dem 22 Hochschulen aus NRW teilnehmen. Er steht Angeh?rigen dieser Hochschulen für Forschung, Studium und Lehre zur Verfügung. Er eignet sich besonders für Daten, die auf GitLab nicht abgelegt werden k?nnen. Sciebo erm?glicht die die Synchronisation von Daten auf verschiedenen Ger?ten und das gemeinsame Arbeiten an Dokumenten. Besonders für gro?e Datenmengen (bis 2 TB) empfiehlt sich in einem Forschungsprojekt das Anlegen einer Sciebo-Projektbox. Da Sciebo die Daten nicht verschlüsselt, muss bei Bedarf selbst für eine Verschlüsselung gesorgt werden. Mehr Informationen erhalten SIe auf dem HilfeWiki des ZIM.
Abschlussphase
Nach Projektabschluss müssen die im Projekt entstandenen Forschungsdaten – entsprechend der DFG-Leitlinie zur Sicherung guter wissenschaftlicher Praxis – für mindestens 10 Jahre archiviert werden. Dies geschieht z.B. durch die Ablage der Daten in geeignete Datenarchiven oder Repositorien. Wann immer m?glich, sollen die Forschungsdaten für die weitere Nutzung frei zug?nglich gemacht werden, dies ist auch in der Leitlinie zu Forschungsdaten der UPB verankert. Sowohl bei der Nutzung als auch bei der Ver?ffentlichung von Daten ist zu prüfen, ob diese dem Urheberrecht unterliegen. Durch die Vergabe von entsprechenden Lizenzen ist es m?glich, auch urheberrechtlich geschützte Daten für andere Forschende zug?nglich zu machen. Weiterführende Informationen rund um die Ver?ffentlichung und Archivierung von Forschungsdaten finden 360直播吧 auf der Informationsplattform forschungsdaten.info.
Repositorien
Repositorien sind Speicherorte für digitale Forschungsdaten. Je nach Repositorium k?nnen Daten hier für mehrere Jahre oder dauerhaft, unter Open-Access- oder Restricted-Access-Regelungen, fachspezifisch oder generisch archiviert werden. Ein Repositorium garantiert dabei nicht nur die reine Speicherung der Daten, sondern erm?glicht h?ufig durch die Verbindung mit Metadaten und der Nutzung von Suchfunktionen auch ihre bessere Auffindbarkeit. Aktuell stellt die UPB kein eigenes Repositorium zur Verfügung.
Als generisches Repositorium empfehlen wir den von der Europ?ischen Kommission finanzierten Dienst Zenodo. Zenodo archiviert ohne zus?tzliche Kosten Datenmengen von bis 50 GB über einen Zeitraum, der über die geforderten 10 Jahre hinausgeht. Au?erdem bietet Zenodo viele Vorteile für die Publikation der Daten wie etwa die die Verknüpfung mit Lizenzen und die automatische Vergabe eines Persistent Identifiers (PI). Ein PI, wie z.B. DOI, ist ein auf Dauerhaftigkeit ausgelegter (digitaler) Identifikator, der einen Datensatz eindeutig bestimmt. Anders als URLs bleibt ein PI auch dann erhalten, wenn ein Datensatz an einen anderen Ort verschoben wird. Weitere Informationen zu PIs finden 360直播吧 hier.
Wie finde ich ein geeignetes Repositorium für meine Daten?
Einen Vergleich von verschiedenen generischen Repositorien bietet Ihnen The General Repository Comparison Chart.
Um sich unter der Vielzahl an fachlichen Repositorien einen ?berblick zu verschaffen, bieten sich Repositorienregister an, die Repositorien auflisten und z.B. nach Disziplin filtern. Re3Data, ROAR und OPENDOAR registrieren Repositorien etwa international, w?hrend sich RIsources besonders für die Suche nach deutschen Repositorien eignet.
In den meisten F?llen bieten auch die disziplinspezifischen Konsortien der nationalen Forschungsdaten Infrastruktur (nfdi) eine ?bersicht an fachlichen Repositorien an.
- Vorgaben: Gibt es bestimmte Vorgaben des F?rdergebers oder meiner Fachdisziplin?
- Datentypen: Welche Datentypen und Formate erhebe ich und sind diese im Repositorium zul?ssig?
- Datenvolumen: Welches Datenvolumen ben?tige ich?
- Speicherdauer: Bietet das Repositorium eine Speicherdauer von mindestens 10 Jahren?
- Access-Regelungen: Wer soll nach Ver?ffentlichung welchen Zugriff auf meine Daten haben? Bietet das Repositorium die M?glichkeit den Zugriff zu restriktieren und meine Daten mit Lizenzen zu versehen?
- Auffindbarkeit: Vergibt das Repositorium automatisch persisten identifier (z.B. DOIs), um die dauerhafte Auffindbarkeit meiner Daten zu gew?hrleisten?
Leitlinien zum Umgang mit Forschungsdaten
Die Grunds?tze der Universit?t Paderborn zum Umgang mit Forschungsdaten k?nnen der Leitlinie der UPB entnommen werden. Hier weist die Universit?t darauf hin, dass Forschungsdaten, Forschungsergebnisse und ggf. die eingesetzte Forschungssoftware ?ffentlich zug?nglich durch die zust?ndigen Forschenden zu sichern sind. Des weiteren enthalten die Leitlinien Informationen zu Verantwortlichkeiten, Rechten und Pflichten im Umgang mit Forschungsdaten. Die Leitlinie kann auf den Webseiten des Forschungsdatenamanagements im Downloadbereich heruntergeladen werden.
Urheberrecht
Einige Forschungsdaten sind urheberrechtlich geschützt. In diesem Fall dürfen andere Forschende sie nicht ohne Weiteres nutzen. Die Forschenden, die die Daten erzeugt haben, müssen ihrer Verwendung ausdrücklich zustimmen. Ob die Daten, die in einem Forschungsprojekt entstehen, urheberrechtlich geschützt sind, muss für den konkreten Einzelfall geprüft werden. Weiterführende Informationen zum Urheberrecht, k?nnen 360直播吧 folgenden Links entnehmen:
- Handreichung zum Urheberrecht in der Wissenschaft des BMBF
- Datenlizenzen für geisteswissenschaftliche Forschungsdaten. Rechtliche Bedingungen und Handlungsbedarf
- Forschen in der digitalen Welt. Juristische Handreichungen für die Geisteswissenschaften
- Rechtsfragen bei Open Science. Ein Leitfaden
- Urheberrecht und wissenschaftliche Forschung
Im Zweifelsfall wird dringend empfohlen, die Rechtsberatung des Justiziariat (SG 4.5) der Uni Paderborn in Anspruch zu nehmen.
- Messdaten, die rein maschinell erzeugt wurden, genie?en in der Regel keinen Schutz. Erst ihre Anordnung, Einordnung oder Auswertung durch die Forschenden stellt eine sch?pferische Leistung dar, die urheberrechtlich geschützt ist.
- Metadaten, die aus (technisch ermittelbaren) Zahlenangaben bestehen (z. B. Breite, H?he, Gewicht, Speicherbelegung) sind in der Regel nicht geschützt.
- Metadaten, die Kurzbeschreibungen oder Abstracts enthalten, sind in der Regel geschützt.
- Textbasierte Forschungsdaten (z. B. Bildbeschreibungen, Interviews) sind in der Regel geschützt.
- Darstellungen und Abbildungen (z. B. Karten, Skizzen, Fotos) sind in der Regel geschützt.
Lizenzen
Um anderen Forschenden die rechtssichere Nutzung urheberrechtlich geschützter Forschungsdaten zu erlauben, empfiehlt sich die Verwendung der sogenannten ?CC-Lizenzen“ der Creative-Commons-Organisation. Wenn 360直播吧 Ihre Forschungsdaten unter einer CC-Lizenz ver?ffentlichen, machen 360直播吧 sie dadurch ?frei zug?nglich“. Das bedeutet aber nicht automatisch, dass andere Forschende sie ohne Einschr?nkungen und für jeden beliebigen Zweck nutzen dürfen. Es ist m?glich, die weitere Nutzung gar nicht, wenig oder stark einzuschr?nken. Eine ?bersicht der verschiedenen Lizenzen erhalten 360直播吧 auf der Webseite der Creative-Commons-Organisation. Entscheidungshilfe bei der Wahl der geeigneten Lizenz bietet deren ?License Chooser“.
Für Software bzw. Quellcode sind die CC-Lizenzen in der Regel ungeeignet. Um den in Ihrem Projekt entstehenden Code frei zug?nglich zu machen, stehen zahlreiche bew?hrte Lizenzen zur Verfügung, die speziell für Software entwickelt wurden. Zu den g?ngigsten z?hlen die GNU General Public License 3, die Apache-Lizenz und die MIT-Lizenz. Bei der Wahl der richtigen Lizenz unterstützt 360直播吧 zum Beispiel die Webseite ?choosealicence.com“.