Daten teilen

Vorteile und Möglichkeiten des Data-Sharing

Originalbild von Gerd Altmann/CC0

Vorteile des Teilens von Daten

Im Mittelpunkt des wissenschaftlichen Forschungsprozesses steht ein Rohstoff, ohne welchen die Forschungsarbeit undenkbar wäre: Forschungsdaten. Häufig ist es so, dass Daten nur von einem Forscher oder einer Arbeitsgruppe bearbeitet und analysiert werden und danach auf einem USb-Stick gespeichert in einer Schublade verschwinden.

Das Teilen von Daten ermöglicht demgegenüber eine weltweite Arbeitsaufteilung. Forschende können je nach Zeit, Ressourcen und Aufgabengebieten Ihren eigenen Blick auf die Daten werfen und sie entsprechend ihrer individuellen Bedürfnisse analysieren. Der Rohstoff Forschungsdaten kann somit durch das Teilen effizienter genutzt werden.

Aber auch Meta-Analysen sind ein entscheidender Grund für mehr Datenoffenheit. In einigen Disziplinen, in denen sich eine offene Datenkultur durchgesetzt hat, sind signifikante Analysefehler seit Jahren etablierter Verfahren oder Werkzeuge erst dadurch erkannt worden, dass Meta-Analysen über viele Studiendaten hinweg Inkonsistenzen aufgezeigten. Diese Analysefehler (z.B. Softwarebug, falsche Standardannahmen) fallen in einer einzelnen Studie nicht immer auf , können aber Verzerrungen und somit falsche Ergebnisse erzeugen. Dies kann durch Meta-Analysen vermieden werden.

Welche konkrete Vorteile bringt das Teilen von Daten?

  1. Es können neue Kooperationen weltweit entstehen.
  2. Forschungsergebnisse werden durch die Veröffentlichung von Daten und deren Zitierung sichtbarer.[1]
  3. Öffentlich zugängliche Daten können zu neuen oder ergänzenden Hypothesen anregen.
  4. Durch das Teilen von Daten wird eine offene Wissenschaftskultur getragen.

Wer unterstützt das Teilen von Daten?

Forschungsdaten und Publikationen können in Online-Repositorien archiviert und über diese veröffentlich werden. In den letzten Jahren sind hunderte unterschiedliche Repositorien für verschiedene Fachgebiete entstanden. Je nach wissenschaftlicher Disziplin kann die Auswahl sehr groß und unübersichtlich sein.

Einen Überblick über international existierende Repositorien sowie eine Suchfunktion mit einer großen Auswahl an Sucheinstellungen bietet die Seite re3data. Diverse Icons geben Auskunft darüber, welche Charakteristiken die jeweiligen Plattformen aufweisen. Beispielsweise kann gezielt nach Repositorien gefiltert werden, die Open Access oder Restricted Access anbieten.

Zertifikate für Repositorien

Qualitätskriterien können die Entscheidung für oder gegen ein Repositorium deutlich erleichtern. Solche Zertifikate geben dem Datenerzeuger die Sicherheit, dass ihre Daten langfristig vorgehalten, nutzbar und zitierbar sind. Datennutzer können auf ein Mindestmaß an Qualität (Datenformat, Zitierbarkeit, etc.) der in zertifizierten Repositorien vorgehaltenen Daten vertrauen. Zertifizierte Repositorien, Archive, Bibliotheken oder Museen profitieren von einer erhöhten Sichtbarkeit ihrer Services. Es gibt mehrere Initiativen die, basierend auf unterschiedlichen Kriterien, Gütesiegel bzw. Zertifikate für Repositorien vergeben.

DINI-Zertifikat

Die Deutsche Initiative für Netzwerkinformationen e. V. (DINI) vergibt das sog. DINI-Zertifikat für deutsche Publikationsdienste und Open-Access-Repositorien für Dokumente, welche die folgenden Kriterien erfüllen:

1.) Die Organisation einer effektiven Kommunikation zwischen anbietenden und nutzenden Gruppen, d. h. die Sicherstellung einer adäquaten Verbreitung

2.) Ein hohes Maß an Vertrauenswürdigkeit, das den Publizierenden vermittelt wird (z. B. in Bezug auf das Prioritätsrecht, die Wahrung des Urheberrechts sowie die Authentizität und die inhaltliche Qualität wissenschaftlicher Arbeiten)

3.) Nachhaltigkeit und Nachprüfbarkeit (dauerhafte Zitierbarkeit und langfristige Verfügbarkeit, Nachvollziehbarkeit von einzelnen Schritten auf dem Weg zur Veröffentlichung)

Mehr erfahren

Data Seal of Approval (DSA)

Diese Zertifikat wird von den Data Archiving and Networked Services (DANS) vergeben und ist Teil des Institute of the Royal Netherlands Academy of Arts and Sciences (KNAW) und der Netherlands Organization for Scientific Research (NWO). Dieses Datensiegel zertifiziert Bibliotheken, Museen, Archive ebenso wie Repositorien für Forschungsdaten.

Die insgesamt 16 detaillierte Richtlinien (guidelines) basieren im Wesentlichen auf fünf Kriterien:

1.) Die Daten sind im Internet auffindbar.

2.) Die Rechtssituation der Daten ist geklärt und diese sind ohne Einschränkung zugänglich.

3.) Die Daten liegen in einem gebräuchlichen Format vor.

4.) Die Daten sind zuverlässig.

5.) Die Daten sind über persistente Identifikatoren zitierbar.

Mehr erfahren

nestor-Siegel für vertrauenswürdige digitale Langzeitarchive

Nestor ist das deutsche Kompetenznetzwerk für Langzeitarchivierung digitaler Quellen, das die Standardisierungsbestrebungen der aller Partnerinstitutionen (Archive, Bibliotheken, Museen) bündelt und weiter verteilt.

Das nestor-Siegel umfasst in der Summe 34 Kriterien, die rechtliche Aspekte genauso behandeln wie Fragen der Finanzierung und personellen Ausstattung der zertifizierten Einrichtung. Die vorgehaltenen Daten werden aufgrund ihrer Qualität, Zitierbarkeit, rechtlicher Fragen der Nachnutzbarkeit und der langfristigen Speicherung (Datenformate und -träger) beurteilt.

Mehr erfahren

Eine weitere Möglichkeit ist die Veröffentlichung der Forschungsdaten in Datenjournalen. Diese widmen sich der Beschreibung, Dokumentation und der Qualitätsprüfung der Daten. Datenjournale verlangen häufig keine wissenschaftliche Publikation, sondern eine Beschreibung der Daten in Form eines Papers bzw. eines Data-Curation-Profile. Der eigentliche Datensatz wird in einem Repositorium archiviert und der Beitrag im Journal verweist auf den jeweiligen Datensatz.

Was ist beim Teilen von Daten zu beachten?

  • Passt das Repositorium oder das Datenjournal zur Fachdisziplin?
  • Ist erkennbar, ob das Repositorium langfristig verfügbar bleibt?
  • Entspricht das Angebot den Bedürfnissen (bspw. Open/Restricted Access)?
  • Welche Datenformate und Metadatenstandards werden verwendet?
  • Was kann der Anbieter zum Thema Datenschutz und Sicherheit mitteilen?
  • Wird das Urheberrecht berücksichtigt und ist eine Zitierung verpflichtend?
  • Sind die Datenüberlassungs- und die Datennutzungsvereinbarungen überprüft worden?
  • Sind die Forschungsdaten durch fachspezifische Suchdienste dort auffindbar?
  • Wurden die Daten vor dem Upload anonymisiert/pseudonymisiert?

Best Practices zum Teilen von Daten (data sharing) können den Webpräsenzen des UK DATA Archive und des ZBW (Leibniz-Informationszentrum Wirtschaft) entnommen werden.

Einzelnachweise

  1. Piwowar, H. A., Day, R. S., Fridsma, D. B. (2007). Sharing detailed research data is associated with increased citation rate. PloS one, 2 (3), e308.