Bild von Neil Armstrong/JPL Image Use Policy
Bild von Neil Armstrong/JPL Image Use Policy

Das Data-Curation-Profile

Wichtige Schritte nachvollziehbar machen

Was ist ein Data-Curation-Profile?

Auf ihrem Weg durch den Datenlebenszyklus, von der Erstellung bis hin zur Daten­nach­nutzung, unterliegen Forschungsdaten verschiedenen Veränderungen. Damit der Werdegang der Daten langfristig nachvollziehbar bleibt, kann ein „Data-Curation-Profile“ angelegt werden. Ein Data-Curation-Profile entsteht während der Verarbeitung der Daten und kann als eine Doku­mentation der Geschichte der Daten verstanden werden. Die Dokumentation der Daten­geschichte hilft den Überblick zu behalten und unterstützt die Überprüf- und Nach­nutzbarkeit, falls die Daten bspw. in Repositorien veröffentlicht werden.

Wie wird ein Data-Curation-Profile erstellt?

Ein Data-Curation-Profile besteht meist aus den folgenden drei Elementen:

• Eine Beschreibung des Datensatzes und Informationen über dessen Lebenszyklus.
• Informationen über alle relevanten Maßnahmen, die getätigt wurden, um den Datensatz zu managen, zu organisieren, zu teilen, zu verändern und zu erhalten.
• Angaben zu offenen Fragen und ungelösten Problemen hinsichtlich der getroffenen Maßnahmen im Umgang mit den Daten.

Ein entsprechendes Toolkit[1] zur effizienten Erstellung eines eigenen Data-Curation-Profiles kann von der Website der Purdue University heruntergeladen werden. Neben einer Anleitung und weiteren Informationen beinhaltet das Toolkit eine frei verwendbare Vorlage,  die unter einer Creative-Commons-Lizenz veröffentlicht wurde. Zur zusätzlichen Arbeitserleichterung gibt es auf dieser Grundlage eine Kurzfassung der Vorlage und Beispielprofile, die einen ersten Einblick in den Aufbau und die Verwendung von Data-Curation-Profilen ermöglichen.

Datenkonvertierungen im Rahmen des Data-Curation-Profile

Abhängig von ihrer Funktion im Datenlebenszyklus ist es bisweilen notwendig, Daten in unterschiedliche Dateiformate zu konvertieren. Gründe hierfür liegen bspw. in den Erfordernissen für eine Langzeitarchivierung der Daten, für einen Datenaustausch, für die Zusammenarbeit in einer Forschungsgruppe oder der Aufrechterhaltung der Funktionalität in anderen Softwareumgebungen. Dabei ist zu beachten, dass eine Konvertierung sowohl Verluste je nach Format verursachen kann als auch zu einer inhaltlichen Veränderung der Daten führen kann.

Die Konvertierung der Daten ist dabei an mehreren Stellen im Datenlebenszyklus möglich:

• Phase der Datenerstellung: Wahl der Dateiformate, Hinzufügen von Informationen und Optimierung der Datensätze (Lesbarkeit)
• Bereinigung, Umstrukturierung, Ergänzung und Modifikation der Datensätze
• Anonymisierung personenbezogener und sensibler Daten

Einzelnachweise

1. Carlson, J. (2010). The Data Curation Profiles Toolkit: The Profile Template. Data Curation Profiles Toolkit. Paper 4.