Gen-, Umwelt- und Sammlungsdaten in den Lebenswissenschaften

GFBio - das Rundum-sorglos-Paket für wissenschaftliches Datenmanagement biologischer Daten

In der Biodiversitätsforschung werden eine Fülle von Daten unterschiedlichster Art erzeugt. Leider sind bisher 90% der Daten, die in Forschungsprojekten anfallen, für die Wissenschaftler/innen nicht verfügbar.  Umwelt-relevante Daten liegen momentan noch weit verstreut in den Datenbanken verschiedener Projekte und Institutionen vor, die daher oft schwer aufzufinden sind, um in einem größeren Kontext wiederverwendet zu werden.

GFBio ist ein DFG gefördertes Projekt welches im Moment an einer kohärenten Infrastruktur arbeitet um dem Verlust von Daten entgegenzuwirken, das auffinden und die Integration von ökologisch relevanten Daten zu ermöglichen und zu vereinfachen. Die Forschungsplattform GFBio Datenportal baut auf bewährten Datenarchivierungsinfrastrukturen und -abläufen auf, wie PANGAEA für Umweltdaten und integriert Ressourcen der wichtigsten deutschen naturwissenschaftlichen Sammlungen.

Spezielle Repositorien und Tools in GFBio

Daten können in Repositorien aufgenommen werden, und es gibt auch ein "Data Center Recommendation Tool (DCRT)", dass das passende Data Center für die Daten auswählt.

Ein besonderer Service ist der GFBio Terminolgy Service. Hier können über einen einzigen Zugangspunkt verschiedene Arten von Terminologien im biologischen Bereich in einer einheitlichen und transparenten Weise verbinden werden. TS bietet Dienstleistungen und Werkzeuge zur Suche, Erforschung, Freigabe und Wiederverwendung von Terminologien für die semantische Erweiterung von Forschungsplattformen.

Ein weitere interessantes Werkzeug ist der GFBio VAT (Visualization, Analysis & Transformation System), welches die Synthese heterogener räumlich-zeitlicher Datensätze ermöglicht und Mehrwertdienste über eine GIS-artige Web-Browser-Schnittstelle für Biodiversitätsforscher bietet.

FDM-Training

Neben Trainingsmaterialien und Lehrmodulen (Education Modules) zum Forschungsdatenmanagement werden  Weiterbildungsmöglichkeiten (Training Acitivities) für Nachwuchswissenschaftler/innen sowie für Foscher/innen und Datenmanagern/innen angeboten.

Übersicht der adressierten Disziplinen

Die gemeinsame Infrastruktur berücksichtigt die Datenmanagement-Bedürfnisse einer Vielzahl von Interessensgruppen in der Biodiversitätsforschung:

  • naturwissenschaftliche Sammlungen
  • große Wissenschaftsnetzwerke
  • hoch interdisziplinäre, heterogene Daten
  • großskalige und komplexe Datenprodukte
  • Genomdaten
  • Umweltdaten
  • Ökologiedaten 
  • sammlungsbezogene Daten