Bibliographische Metadaten

Standards über Standards

Originalbild von Sanwal Deen/CC0

RDF - Metadatenstruktur für digitale Daten und das Web

Mit dem Resource Description Framework (RDF, „Beschreibungsystem von Res­sourcen“) wurde vom World Wide Web Consortium (W3C) eine Metasprache zur Beschreibung von beliebigen Dingen durch logische Aussagen geschaffen. Auf sehr abstraktem Niveau kann über diese Dinge und ihre Verhältnisse untereinander „gesprochen“ werden, so dass auch Computer dies verstehen. Es ist ein grundlegender Baustein für das Semantic Web und dient als technisches Modell für spezifischere Metasprachen und Metadatenstandards. Jede Aussage im RDF besteht aus drei Bestandteilen: Subjekt, Prädikat und Objekt. Eine solche Struktur ist für die Erfassung einfacher Metadaten vollkommen ausreichend, z. B.:

  • Ein Verfasser - schreibt - einen Text.
  • Der Text - ist - auf Deutsch.
  • Der Text - wurde - 2016 - geschrieben.

RDF stellt beispielsweise auch die Grundlage für das Simple Knowledge Organisation System (SKOS, „einfaches System zur Organisation von Wissen“), das zur Kodierung von Dokumentationssprachen wie Thesauri, Klassifikationen oder anderen kontrollierten Vokabularen genutzt wird, die wiederum das semantische Web ermöglichen.

Darüber hinaus gibt es für die strukturierte Angabe von bibliographischen Informationen, wie sie üblicherweise in Katalogen verwendet werden, eine Reihe von Metadatenstandards, die bisweilen auch Metasprachen genannt werden, wenn sie über eine Vielzahl an spezifischen Strukturmerkmalen verfügen. Diese Standards haben oft eine hohe Schnittmenge untereinander, aber besitzen zugleich einen eigenen Ansatz, der sie wiederum von anderen Standards unterscheidet und für bestimmte Zwecke besser geeignet ist als andere. Gerade im Bereich der bibliographischen Metadaten ist ein sogenanntes Mapping, also die Überführung strukturell gleichförmiger Metadaten von einem Standard in einen anderen, leicht durchführbar.

Metadatenformate hängen in der Regel eng mit einem entsprechenden Regelwerk zusammen, das bestimmt, wie die einzelnen Datenfelder zu benutzen sind. Zweck dieser Regelwerke ist es, durch ihre Anwendung einheitliche und vergleichbare Katalogisate zu den einzelnen Daten und Medien zu erhalten.

Bibliographische Metadatenstandards – eine Auswahl

Bibliographische Metadatenstandards werden auch als bibliographische Datenformate bezeichnet und dienen in erster Linie der Beschreibung von Büchern und anderen vergleichbaren Medien, wie zum Beispiel auch Datensätzen. Sie spielen eine wichtige Rolle im Austausch von bibliographischen Daten zwischen Bibliotheken und vergleichbaren Institutionen beziehungsweise deren digitalen Katalogen. In der Praxis werden verschiedene bibliographische Metadatenstandards miteinander kombiniert, um eine komplette bibliographische Beschreibung eines Objekts zu erreichen. Alle Formate unterstützen eine XML-Kodierung; die meisten arbeiten mit sprechenden Bezeichnern und sind dadurch für Menschen verständlich. Zwischen den einzelnen Formaten ist meist eine computergestützte Konvertierung (Mapping) möglich.

Metadata Encoding & Transmission Standard (METS)

METS ist ein XML-Format zur Beschreibung von digitalen Objekten mit strukturellen und bibliographischen bzw. administrativen Metadaten. Er ist wiederum ein Teil des MARC-Standards der US-amerikanischen Nationalbibliothek (Library of Congress). Ein METS-Dokument umfasst sieben Bereiche / Abschnitte, in denen die Metadaten strukturiert abgelegt werden: Kopfteil, Erschließungsangaben, Verwaltungsangaben, Dateiabschnitt, Strukturbeschreibung, Strukturverknüpfung und Verhalten. Welche konkreten Angaben in den einzelnen Bereichen abgespeichert werden sollen, kann dieser Anleitung entnommen werden.

Grundsätzlich kann das Format der Metadaten in den einzelnen Bereichen verschieden sein und wird nicht von METS festgelegt. So können in einem METS-Dokument unterschiedliche Formate (z. B. Dublin Core, MARC, MODS etc.) Verwendung finden.

Machine-Readable Cataloging (MARC 21)

MARC ist ein bereits in den 1960er Jahren entwickeltes bibliographisches Dateiformat. Die heute gängige Version ist MARC 21. Sie wird weltweit in den Bibliotheken verwendet, um bibliographische Daten zwischen verschiedenen Einrichtungen auszutauschen. Für den Austausch werden heute zahlreiche Formate gebraucht, die von den verschiedenen Nationalbibliotheken auf Basis von MARC 21 entwickelt wurden. Diese Vereinheitlichung führte dazu, dass unabhängige Formate, wie beispielsweise das Maschinelle Austauschformat für Bibliotheken (MAB), heute kaum noch Anwendung finden. Die umfangreiche Kodierung fußt auf Zahlencodes, die für den Menschen kaum verständlich sind.

Metadaten mit Dublin Core (DC)

Die 1994 gegründete Dublin Core Metadata Initiative (DCMI) schuf mit Dublin Core (DC) eine Sammlung an standardisierter Konventionen für eine einfache Beschreibung von Dokumenten und anderen verwandten Objekten im Web mithilfe von bibliographischen Metadaten. DC besitzt 15 Kernfelder und weitere zusätzliche Felder, in denen die Objekte beschrieben werden sollen. Die 15 Kernfelder betreffen technische Aspekte, die inhaltliche Beschreibung, rechtliche Aspekte und die Vernetzung des beschriebenen Objekts. Einen vollständigen Überblick über alle DC-Elemente erhält man auf der Webseite  von Dublin Core.

Metadata Object Description Schema (MODS) und Metadata Authority Description Schema (MADS)

MODS ist ein weiteres bibliographisches Dateiformat der US-amerikanischen Nationalbibliothek (Library of Congress). Es wurde entwickelt, um zwischen der Komplexität von MARC 21 und der für viele Anwendungen zu einfachen Kodierung von Dublin Core einen Kompromiss zu finden. Viele aber nicht alle MARC-21-Felder können mit MODS wiedergegeben werden. Es gibt auch Felder in MODS, die keine Entsprechung in MARC 21 haben.

MADS ist eine Erweiterung zu MODS und wird nur mit diesem zusammen verwendet. Das Schema wurde ebenfalls von der US-amerikanischen Nationalbibliothek (Library of Congress) erstellt. Es wird für die Übertragung von Metadaten zu Personen und Einrichtungen, Ereignissen sowie Begriffen gebraucht.

Beschreibungen von Archivgut und Provenienzen

Encoded Archival Description (EAD) ist ein weiterer Standard der US-amerika­nischen Nationalbibliothek (Library of Congress). Zusammen mit der Erweiterung Encoded Archival Context (EAC), das von der der Society of American Archivists in Zusammenarbeit mit der Staatsbibliothek zu Berlin (SBPK) entwickelt wird, findet der dokumentarische XML-Standard EAD in Archiven, Bibliotheken und Museen Anwendung zur Erstellung von Findbüchern und anderen Findhilfen.