Persistente Identifikatoren

Digitale Objekte dauerhaft zitierbar und nachnutzbar halten

Originalbild von Jacqueline Macou/CC0

Was ist ein persistenter Identifikator?

Gutes Forschungsdatenmanagement zeichnet sich unter anderem dadurch aus, dass wissenschaftliche Datensätze für Dritte leicht nachnutzbar sind. Hierbei geht es vor allem um einheitliche Standards und Formate und das Versehen der Datensätze mit genügend Metadaten. Dies allein reicht jedoch nicht aus, denn vor der Nachnutzung muss ein potentieller Interessent die Daten auch finden können.

Ein Persistent Identifier ist definiert als ein dauerhafter (persistenter), digitaler Identifikator, bestehend aus Ziffern und/oder alphanumerischen Zeichen, welcher einem Datensatz (oder einem anderen digitalen Objekt) zugeordnet wird und direkt auf diesen verweist.

Bisher waren wissenschaftliche Datensätze, wenn sie überhaupt für Dritte zugänglich gemacht wurden, zumeist über bestimmte Webadressen (URLs) oder Verlinkungen auf diese Adressen zu erreichen. Aus der Perspektive eines effizienten Forschungsdatenmanagements ist dies aus verschiedenen Gründen problematisch.

URLs verweisen nicht auf einen bestimmten Inhalt, sondern auf einen ‚Ort‘ im Internet. Wird der gewünschte Inhalt, wie bspw. ein wissenschaftlicher Datensatz, an einen anderen Ort verschoben, so wird die URL zur Auffindung desselben nutzlos. Weiterhin ist es häufig der Fall, dass ein Datensatz an mehreren Orten im Internet veröffentlicht wird, so dass sich mehrere URLs auf ihn beziehen, was für eine zuverlässige wissenschaftliche Zitierbarkeit unpraktisch ist. Und nicht zuletzt enthalten URLs häufig semantische Hinweise auf die Domain, auf welcher sie basieren und eignen sich so nicht als neutrale Identifikatoren.

Aus den oben genannten Gründen wurde das Konzept des Persistent Identifier entwickelt, welches sich in der wissenschaftlichen Gemeinschaft in den vergangenen Jahren weithin als Standard für die Identifikation digitaler Objekte durchgesetzt hat.

Aufbau eines persistenten Identifikators

Häufig verwendete Identifikator-Systeme sind DOI (Digital Object Identifiers) und URN (Uniform Resource Names). Ein DOI-Identifikator könnte beispielsweise so aussehen:

forschungsdaten.info (CC0)

Die Deutsche Nationalbibliothek bietet einen kostenlosen URN-Vergabe-Service für wissenschaftliche Datensätze von Wissenschaftlern und Autoren einer deutschen Einrichtung im Namensraum urn:nbn:de. Neben dem URN-Vergabe-Service bietet die Deutsche Nationalbibliothek auch einen URN-Resolving Dienst für Deutschland und die Schweiz an.

Für eine kostenlose DOI-Vergabe können sich deutsche Einrichtungen an die vier deutschen Mitglieder von Data Cite (GESIS, TIB, ZB MED und ZBW) wenden. DOI-Resolving-Dienste sind unter anderem auf den Seiten von CrossRef, Data Cite und der International DOI Foundation aufgelistet.