Pexels / Pixabay / Pixabay-Lizenz

Daten publizieren

Vorteile und Möglichkeiten des Data-Sharing

Vorteile einer Datenpublikation

Im Mittelpunkt des wissenschaftlichen Forschungsprozesses steht ein Rohstoff, ohne welchen die Forschungsarbeit undenkbar wäre: Forschungsdaten. Allerdings sind Forschungsdaten längst nicht nur für die eigene Tätigkeit einer Forscherin oder eines Forschers bzw. für eine Arbeitsgruppe relevant. Viele Förderer fordern dies in ihren Auflagen, auch Policies etwa von Einrichtungen sehen vermehrt eine Datenpublikation - sofern keine trifftigen Gründe dagegen sprechen - vor. Daher sollten sie keineswegs auf dem USB-Stick gespeichert und in der Schublade verschwinden.  

Denn das offene Zugänglichmachen von Daten ermöglicht eine weltweite Arbeitsaufteilung. Forschende können einen Blick auf relevante Daten werfen und schauen, ob diese einen Mehrwert für die eigene Studie liefern. Durch die Integration und erneute Analyse können Forschungsergebnisse gewinnbringender werden. Der Rohstoff Forschungsdaten wird somit durch das Teilen effizienter genutzt.

Aber auch Meta-Analysen sind ein entscheidender Grund für mehr Datenoffenheit. In einigen Disziplinen, in denen sich eine offene Datenkultur durchgesetzt hat, sind signifikante Analysefehler seit Jahren etablierter Verfahren oder Werkzeuge erst dadurch erkannt worden, dass Meta-Analysen über viele Studiendaten hinweg Inkonsistenzen aufzeigten. Diese Analysefehler (z.B. Softwarebug, falsche Standardannahmen) fallen in einer einzelnen Studie nicht immer auf, können aber Verzerrungen und somit falsche Ergebnisse erzeugen. Dies kann durch Meta-Analysen vermieden werden.

Welche konkreten Vorteile bringt die Datenpublikation?

  1. Es können neue Kooperationen weltweit entstehen.
  2. Forschungsergebnisse werden durch die Veröffentlichung von Daten und deren Zitierung sichtbarer.[1]
  3. Öffentlich zugängliche Daten können zu neuen oder ergänzenden Hypothesen anregen.
  4. Wissenschaftliche Integrität wird gestärkt.
  5. Durch das Teilen von Daten wird eine offene Wissenschaftskultur befördert.
  6. Einmalige Daten gehe nicht verloren, sondern stehen für weitere Forschungen zur Verfügung.
  7. Kosten werden gespart.

Wer unterstützt die Publikation von Daten?

Forschungsdaten und Publikationen können in Online-Repositorien archiviert und über diese veröffentlicht werden. In den letzten Jahren sind hunderte unterschiedlicher Repositorien für verschiedene Fachgebiete entstanden. Je nach wissenschaftlicher Disziplin kann die Auswahl sehr groß und unübersichtlich sein.

Einen Überblick über international existierende Repositorien sowie eine Suchfunktion mit einer großen Auswahl an Sucheinstellungen bietet die Seite re3data. Diverse Icons geben Auskunft darüber, welche Charakteristiken die jeweiligen Plattformen aufweisen. Beispielsweise kann gezielt nach Repositorien gefiltert werden, die Open Access oder Restricted Access anbieten. Deutsche Repositorien finden Sie auf RIsources.

Zertifikate für Repositorien

Qualitätskriterien können die Entscheidung für oder gegen ein Repositorium deutlich erleichtern. Solche Zertifikate geben der Datenerzeugerin bzw. dem Datenerzeuger die Sicherheit, dass die Daten langfristig vorgehalten, nutzbar und zitierbar sind. Datennutzerinnen und Datennutzer können auf ein Mindestmaß an Qualität (Datenformat, Zitierbarkeit, etc.) der in zertifizierten Repositorien vorgehaltenen Daten vertrauen. Zertifizierte Repositorien, Archive, Bibliotheken oder Museen profitieren von einer erhöhten Sichtbarkeit ihrer Services. Es gibt mehrere Initiativen die, basierend auf unterschiedlichen Kriterien, Gütesiegel bzw. Zertifikate für Repositorien vergeben. Die beiden gängigsten Siegel, die hohe Qualitätsmerkmale ansetzen, sind das CoreTrustSeal und das nestor-Siegel.

CoreTrustSeal

Das CoreTrustSeal ist eine Zertifizierungsorganisation, die aus dem ICSU World Data System (ICSU-WDS) und dem Data Seal of Approval (DSA) hervorgegangen ist. Die CoreTrustSeal-Data-Repository-Zertifizierung löst die DSA-Zertifizierung und die WDS Regular Members Zertifizierung ab. Das CoreTrustSeal ist eine community-basierte und gemeinnützige Organisation und bietet jedem interessierten Repositorium eine Core Level Zertifizierung auf Basis des DSA-WDS Core Trustworthy Data Repositories Requirements Catalogue und der damit verbundenen Verfahren an. Die insgesamt 16 detaillierten Richtlinien (guidelines) basieren im Wesentlichen auf fünf Kriterien:

  1. Die Daten sind im Internet auffindbar.
  2. Die Rechtssituation der Daten ist geklärt und diese sind ohne Einschränkung zugänglich.
  3. Die Daten liegen in einem gebräuchlichen Format vor.
  4. Die Daten sind zuverlässig.
  5. Die Daten sind über persistente Identifikatoren zitierbar.

Mehr erfahren

nestor-Siegel für vertrauenswürdige digitale Langzeitarchive

Nestor ist das deutsche Kompetenznetzwerk für Langzeitarchivierung digitaler Quellen, das die Standardisierungsbestrebungen der aller Partnerinstitutionen (Archive, Bibliotheken, Museen) bündelt und weiter verteilt.

Das nestor-Siegel umfasst in der Summe 34 Kriterien, die rechtliche Aspekte genauso behandeln wie Fragen der Finanzierung und personellen Ausstattung der zertifizierten Einrichtung. Die vorgehaltenen Daten werden aufgrund ihrer Qualität, Zitierbarkeit, rechtlicher Fragen der Nachnutzbarkeit und der langfristigen Speicherung (Datenformate und -träger) beurteilt.

Mehr erfahren

Eine weitere Möglichkeit ist die Veröffentlichung der Forschungsdaten in Datenjournalen. Diese widmen sich der Beschreibung, Dokumentation und der Qualitätsprüfung der Daten. Datenjournale verlangen häufig keine wissenschaftliche Publikation, sondern eine Beschreibung der Daten in Form eines Papers bzw. eines Data-Curation-Profile. Der eigentliche Datensatz wird in einem Repositorium archiviert und der Beitrag im Journal verweist auf den jeweiligen Datensatz.

Außerdem bieten Verlage Supplemente zu Veröffentlichungen an. Dies ist besonders dann sinnvoll, wenn die Forschungsdaten zentral für das Verständnis der Publikation ist.

Was ist bei der Publikation von Daten zu beachten?

  • Passt das Repositorium oder das Datenjournal zur Fachdisziplin?
  • Ist erkennbar, ob das Repositorium langfristig verfügbar bleibt?
  • Entspricht das Angebot den Bedürfnissen (bspw. Open/Restricted Access)?
  • Welche Datenformate und Metadatenstandards werden verwendet?
  • Was kann der Anbieter zum Thema Datenschutz und Sicherheit mitteilen?
  • Wird das Urheberrecht berücksichtigt und ist eine Zitierung verpflichtend?
  • Sind die Datenüberlassungs- und die Datennutzungsvereinbarungen überprüft worden?
  • Welche Nachnutzung ist durch die angebotenen Lizenzen erlaubt?
  • Sind die Forschungsdaten durch fachspezifische Suchdienste dort auffindbar?
  • Bei personenbezogenen/sensiblen Daten: Wurden die Daten vor dem Upload anonymisiert/pseudonymisiert?
Entscheidungshilfe zur Veröffentlichung von Forschungsdaten in Form eines Flussdiagramms
Entscheidungshilfe zur Veröffentlichung von Forschungsdaten in Form eines Flussdiagramms

Best Practices zum Teilen von Daten (Data-Sharing) können beispielsweise auch der Webpräsenzen des UK DATA Archive entnommen werden.

Einzelnachweise

  1. Piwowar, H. A., Day, R. S., Fridsma, D. B. (2007). Sharing detailed research data is associated with increased citation rate. PloS one, 2 (3), e308.