Langzeitarchivierung

Herausforderungen und Chancen der digitalen Archivierung

Bild von liz west/CC BY 2.0

Was bedeutet Langzeitarchivierung?

Teil eines effektiven Forschungsdatenmanagements ist es, Forschungsdaten langfristig nutzbar und abrufbar zu erhalten. Eine mögliche Strategie ist die Ablage der Daten in einem Repositorium. Einige Forschungsdaten sind jedoch einmalig und können nicht ein zweites Mal erhoben werden, sind von besonderer gesellschaftlicher Bedeutung oder aus anderen Gründen besonders schützenswert.

Langzeitarchivierung (LZA) bedeutet mehr als die bloße Sammlung von Daten und anderen Inhalten an einem Ort für bestimmte Zeit. Die Speicherung von digitalen Objekten ist eine Herausforderung, da digitale Daten bedingt durch die Kurzlebigkeit vieler Datenträger, Formate, Software und Ablageorte im digitalen Raum schnell unzugänglich und unbenutzbar werden. Das über allem stehende Ziel der LZA ist es, Kurzlebigkeit entgegen zu wirken.

Wie funktioniert Langzeitarchivierung?

Bei der Archivierung von digitalen Daten treten durch massive technologische Veränderungen besondere Herausforderungen auf. Ziel der LZA ist es sicherzustellen, dass digitale Forschungsdaten trotz dieser Veränderungen langfristig verfügbar und nachnutzbar bleiben. Dabei müssen vor allem zwei Aspekte beachtet werden:

1. Substanzerhaltung

Dieser Aspekt bezieht sich auf die Bewahrung der eigentlichen Dateninhalte. Dies kann nur gelingen, wenn diese nicht untrennbar mit einem Datenträger oder Auslesegerät verbunden sind, da sie nur so auf andere Systeme und Träger migriert werden können. Daher ist es ratsam Datenträger nicht mit Kopierschutz oder anderen Migrationsbarrieren zu versehen, wenn LZA angestrebt wird. 

2. Erhaltung der Benutzbarkeit

Im Vergleich zur Substanzerhaltung ist die Erhaltung der Benutzbarkeit eine sehr komplexe Aufgabenstellung, da jedem Datensatz eine andere technische Nutzungsumgebung (verwendete Hardware/Software, Betriebssysteme) zugrunde liegt. Diese veralten schnell und sind oft nur wenige Jahre verfügbar. Dies gilt speziell, wenn es sich um proprietäre (firmeneigen, anwendereigen, d. h. eigentumsrechtlich zugeordnet) Formate handelt. Hier ist eine Strategie ggfs. Open-Source-Software zu verwenden.

Um die Benutzbarkeit von digitalen Objekten langfristig zu erhalten, kommen zwei Strategien in Frage:

  • Migration der Daten in eine neue technische Nutzungsumgebung (vor allem bei einfachen digitalen Objekten) 
  • Emulation der originären Nutzungsumgebung (vor allem für komplexe digitale Objekte) Initiativen wie nestor, das deutsche Kompetenznetzwerk zur Langzeitarchivierung, wirken darauf hin, dass digitale Objekte bereits bei der Genese so erstellt und gespeichert werden, dass deren Eigenschaften für eine spätere LZA günstig sind. Hierfür ist unter anderem die Erstellung eines Datenmanagementplans von Vorteil. Ebenso sind inhaltliche und, für die LZA noch relevanter, technischen Metadaten eine gute Voraussetzung.[1]

 

Welche Merkmale zeichnen ein vertrauenswürdiges Langzeitarchiv aus?

Die Daten sind erhoben, das Forschungsprojekt in Kürze abgeschlossen – und nun? Es gibt zwar bisher noch kein allgemein anerkanntes Zertifizierungsverfahren, jedoch kann anhand einiger Kriterien die Vertrauenswürdigkeit von Archiven zumindest grob eingeschätzt werden. So hat sich als Qualitätsmerkmal für vertrauenswürdige Archive Konformität mit dem OAIS -Referenzmodell durchgesetzt. Ebenso sollte die archivierende Institution Informationen über die erwartete Beständigkeit ihrer institutionellen Struktur sowie Transparenz über ihre Methoden und Leistungen zur Verfügung stellen, um eine Vertrauensbasis für potentielle Nutzer zu schaffen.[2]

APARSEN   ist ein von der Europäischen Kommission gefördertes Kompetenznetzwerk zur digitalen Langzeitarchivierung mit 30 vernetzten Institutionen in ganz Europa. Das Leibniz-Institut für Sozialwissenschaften (gesis) stellt weitere vertrauenswürdige Zertifizierungs- und Self-Audit-Verfahren im Bereich der LZA vor. Weiterhin besteht ein strategische Verbund der Zentralen Fachbibliotheken in Deutschland: Goportis, der Leibniz-Bibliotheksverbund Forschungsinformation. Die Goportispartner (TIB, ZB MED und ZBW) betreiben gemeinsam ein digitales Langzeitarchivierungssystem.

Einzelnachweise

  1.  Schumann, N. (2012). Einführung in die digitale Langzeitarchivierung. In: Altenhöner, R., Oellers, C. (Hrsg.) Langzeitarchivierung von Forschungsdaten. Standards und disziplinspezifische Lösungen. Scivero, Berlin.
  2.  Schrimpf, S. (2012). Überblick über das OAIS-Referenzmodell. In: Altenhöner, R., Oellers, C. (Hrsg.) Langzeitarchivierung von Forschungsdaten. Standards und disziplinspezifische Lösungen. Scivero, Berlin.