Repositorien

Daten professionell zur Verfügung stellen

Bild von Ainsley Seago/CC BY 4.0

Was ist ein Repositorium?

Um Forschungsdaten Drittnutzern zugänglich zu machen, müssen diese an einem gut sortierten und verwalteten Ort aufbewahrt werden. Solche Speicherorte für digitale Forschungsdaten nennt man Repositorien. Sie unterscheiden sich grundlegend von anderen Methoden der Web-Veröffentlichung von digitalen Objekten (bspw. auf einer einfachen Webseite). So werden Repositorien so gut wie immer von einem oder mehreren Datenkuratoren verwaltet und in der Regel von einer universitären Einrichtung wie bspw. einer Bibliothek oder einem Rechenzentrum oder von einer anderen Institution gehostet. Im Unterschied zu Datenspeicherorten herkömmlicher Online-Journale bieten Repositorien in der Regel kostenlosen Zugang zu den auf ihren Dokumentservern abgelegten Daten.

Da Repositorien und die auf ihnen abgelegten Daten meistens öffentlich oder zumindest einem eingeschränkten Nutzerkreis zugänglich sind, ist dieser Begriff eng mit dem Thema Open Access verknüpft. Ein Repositorium kann als eine spezielle Form des Archivs betrachtet werden. Daher werden Repositorien auch als Infrastruktur für die sogenannten Langzeitarchivierung verwendet.

Wie funktionieren Repositorien?

Ein Repositorium ist im Grunde ein Dokumentenserver mit einer Online-Benutzeroberfläche, über welche Datenerzeuger ihre Daten auf das Repositorium laden können. Des Weiteren verfügen Repositorien über eine Suchfunktion, über welche Dritte diese Daten finden, betrachten und ggfs. anschließend herunterladen können.

Dies ist jedoch nur möglich, wenn der Zugang zu den abgelegten Daten nicht vom Autor ganz oder teilweise beschränkt wurde. Dies kann bspw. der Fall sein, wenn es sich um sensible, personenbezogene Daten handelt. Weiterhin unterliegen Datensätze nach der Veröffentlichung auf einem Repositorium in einigen Fällen einer Embargofrist, welche gewährleisten soll, dass der Datenautor sein Erstverwertungsrecht wahrnehmen kann (Grüner Weg des Open Access).

Fast alle Repositorien verfügen weiterhin über einen Mechanismus für das Hinzufügen von Metadaten. In seltenen Fällen müssen diese manuell über ein Formular erfasst werden. Viele Repositorien verfügen jedoch bereits über eine Schnittstelle über welche diese Metadaten automatisch „geharvestet“, also eingesammelt, werden können. Eines der meistgenutzten Protokolle für diesen Vorgang ist das Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH).

Ein passendes Repositorium auswählen

Die Auswahl des passenden Repositoriums richtet sich natürlich nach der Fachdisziplin und weiteren Ansprüchen. Online existieren mehrere Verzeichnisse, die die Suche nach einem passenden Repositorium erleichtern. Es handelt sich hierbei um Dienste, die Repositorien nach vorgegebenen Kriterien in Listen sammeln und diese kostenlos zur Verfügung stellen.

Für den deutschsprachigen Raum wurde das DINI-Zertifikat als Qualitätssiegel entwickelt. Die DINI-Zertifikatsliste bietet eine Übersicht über zertifizierte und unzertifizierte Repositorien. Weiterhin stehen mit re3data, ROAR und OPENDOAR drei englischsprachige Verzeichnisse zur Verfügung, welche Open-Acess-Repositorien aus aller Welt listen. Durch Such- und Filterfunktionen kann die Auswahl auf diesen Seiten angepasst und eingegrenzt werden.

Ebenso können Forscher das Repository Ranking der Berlin School of Library and Information Science der Berliner Humboldt Universität nutzen. Diese Seite listet Open-Access-Repositorien aus Deutschland, Österreich und der Schweiz in einem Ranking nach den Kriterien Open Access, Usability, Services, Metadaten und Interoperabilität.

Forschungseinrichtungen können auch Repositorien selbst aufsetzen und betreiben. Die Webseite open-access.net informiert darüber und gibt hilfreiche Hinweise. Beim eigenen Betrieb von Repositorien muss das Urheberrecht entsprechend gewahrt werden. Die IUWIS-Webseite hat sich speziell mit der Rechtslage zur Repositorienbetreibung auseinandergesetzt.

Einschränkungen

1. Bei geplanter Patentanmeldung.

2. Daten enthalten vertrauliche Informationen und können nicht anonymisiert werden  bzw.  es liegt keine Einverständniserklärung zur Veröffentlichung vor.

Alternative: Hier gibt es die Möglichkeit, nur Metadaten zu veröffentlichen, sodass die Studie dennoch in einem Repositorium gefunden werden kann.

3. Veröffentlichung der Forschungsdaten vom Förderer untersagt.

Alternative: Hier gibt es oft die Möglichkeit, Daten zu einem späteren Zeitpunkt zu veröffentlichen.

Repositorien (Auswahl)