Datendokumentation

Festhalten, was wichtig ist

Bild von Aaron Burden/CC0

Datendokumentation – wie, was und warum?

Um Forschungsdaten sinnvoll zu publizieren, ist eine für Dritte nachvollziehbare Dokumentation unabdingbar, denn diese erleichtert die weitere Nutzung der Daten erheblich und stellt deren Reproduzierbarkeit sicher. Dies hat nicht nur Vorteile für potentielle Nachnutzer von Daten, sondern auch für Datenerzeuger und -autoren selbst. Je besser ein Datensatz dokumentiert ist, desto wahrscheinlicher ist es, dass dieser von Dritten genutzt und zitiert wird und der Datenerzeuger dadurch „credit“ in Form einer wissenschaftlichen Zitation erhält.

Wenn keine Vorgaben (durch Förderer, Einrichtung oder Repositorium) gemacht werden, muss eine geeignete Dokumentationsform selbst bestimmt werden. Hierfür kann man sich am Datenlebenszyklus orientieren. Die Bandbreite geht vom einfachen Überblick bis hin zum vollständigen Data-Curation-Profile. Eine Vorlage zur Erstellung eines Data-Curation-Profiles bietet „The Data Curation Profiles Toolkit: The Profile Template“[1]. In Anlehnung daran ist eine Kurzfassung als Data-Curation-Profile-Template auf unserer Website abrufbar.

Beispiele grundlegender Dokumentation

• Forschungsvorhaben (Projekttitel oder Person)
• Projektziele
• zugrundeliegende Hypothesen
• Informationen zur Erhebung der Daten (bspw.: Größe des Samples, Methode,  Zeitraum und Ort der Erhebung und verwendete Technik oder sekundären Datenquellen)
• Maßnahmen zur Datenbereinigung- oder -gewichtung
• Codes und Labels erklären
• Datenversionen und wie sie sich unterscheiden
• Zugang und Nutzungsbedingungen der Daten

Wie dokumentiert wird, bleibt jedem Forschenden selbst überlassen. Es kann in einem simplen Word-Dokument mithilfe einer Software oder auch analog, beispielsweise in einem Laborbuch, geschehen. Wenn eine analoge Form der Dokumentation gewählt wird, ist es wichtig, dass auf dokumentenechtes Schreibwerkzeug geachtet wird. Wer eine elektronische Form der Dokumentation nutzt, sollte ein möglichst offenes Format wählen, um so den Zugang zu den Informationen zu erleichtern.

Auf einen Blick – Tipps zur Datendokumentation

Warum dokumentieren?

  1. Macht die Entstehung eines Datensatzes nachvollziehbar
  2. Stellt Reproduzierbarkeit und Transparenz sicher
  3. Erhöht dadurch Nachnutzbarkeit und Zitierbarkeit

Was dokumentieren

  1. Kontext der Erhebung (Projektziele, Hypothesen)
  2. Erhebungsmethode (Sampling-Methode, Erhebungsinstrumente, verwendete Hard- und Software, sekundäre Datenquellen, Erhebungsort und Erhebungszeitraum)
  3. Struktur der Daten und deren Beziehungen zueinander
  4. Qualitätsmaßnahmen wie Bereinigung, Gewichtung, Datenprüfung etc.
  5. Datenversionen und die enthaltenen Änderungen
  6. Informationen zum Zugang, Nutzungsbedingungen und Vertraulichkeit

Wie dokumentieren

  1. Wenn analog, auf dokumentenechtes Schreibwerkzeug achten
  2. Wenn elektronisch möglichst in einem offenen Format

Einzelnachweise

  1.   Carlson, Jake (2010): The Data Curation Profiles Toolkit: The Profile Template. Data Curation Profiles Toolkit, Paper 4.