ramboldheiner / Pixabay / Pixabay-Lizenz

Tools für die Organisation wissenschaftlicher Datenarbeit

Neben den Tools für das generische Management von Daten, Dateien und Dokumenten gibt es ein breites Feld an speziellen Werkzeugen für die kollaborative wissenschaftliche Arbeit mit Daten. Mit diesen soll möglichst einfach der Forschungsalltag gestaltet werden können, indem besonders die Dokumentation der Forschungsprozesse und der Datenbearbeitung unterstützt werden, um die Nachhaltigkeit und Reproduzierbarkeit der Forschungsleistungen im Sinne der Regeln der guten wissenschaftlichen Praxis zu gewährleisten. 

Ein breites Spektrum solcher Tools hat sich vor allem in der Chemie und den Lebenswissenschaften etabliert:

Elektronisches Laborbuch (ELB) / Electronic Laboratory Notebook (ELN) oder Laborjounal

Ein elektronisches Laborbuch ist eine digitale Version, sprich Softwareplattform, eines traditionellen handschriftlichen Labornotizbuchs oder Laborjournals aus Papier. Es dient der digitalen Dokumentation und Verwaltung des gesamten Forschungsprozesses von Versuchen, Messungen und Experimenten von der Planung und Durchführung bis zur Auswertung der produzierten Forschungsdaten. Daher ist es ein geeignetes Tool für die orts- und zeitunabhängige Projektarbeit. Durch die Standardisierung der Datenerfassung und Möglichkeit der direkten Anbindung von elektronischen Messgeräten zur automatischen Erfassung der Daten kann die Arbeit im Labor außerdem beschleunigt werden.

Der Schwerpunkt des Einsatzes und der Nutzung eines elektronischen Laborbuchs (ELN) liegt oft bei der Verwaltung unstrukturierter Daten von Versuchen oder Synthesen, aber auch von Rezepturen. Dabei werden Dialogformen unterstützt, welche Eingaben in angepassten Formularen, Tabellen oder großen Freitextfeldern ermöglichen, bis hin zur Erfassung von Reaktionsgleichungen oder Bildern.

Generische ELNs wie openBis und eLabFTW werden zunehmend in anderen Fachbereichen genutzt, da sie für die jeweiligen Bedürfnisse der Forschenden konfiguriert werden können.

Auf forschungsdaten.info finden Sie Artikel zu Elektronischen Laborbüchern in den Lebenswissenschaften und in der Chemie.  

Eine Sammlung zur ELB-bezogenen Fachliteratur und weiterer Informationssammlungen hat forschungsdaten.org zusammengestellt.

Weiteres zu ELNs auf LiMSwiki

Laborausführungssystem / Laboratory Execution System (LES)

Ein Laborausführungssystem (LES) ist ist eine spezialisierte Variante oder Untereinheit eines ELNs für die Qualitätskontrolle auf Arbeitsebene des Forschenden. Es wird zur Unterstützung und einer systematischen Dokumentation von allen Labortätigkeiten nach vorgegebenen Arbeitsanweisungen eingesetzt, um die Konsistenz der wiederholten Durchführungen von Tests und Messungen etc. zu gewährleisten. Dabei wird der Nutzer im Dialog mit Hinweisen oder Anweisungen geführt und gleichzeitig zur manuellen oder elektronischen Erfassung der relevanten Daten für den jeweiligen Arbeitsschritt aufgefordert. LES-Anwendungen finden sich oft in geregelten Bereichen wie der Pharmaindustrie aber auch in anderen Labors mit hohen Dokumentationsanforderungen.

Weiteres zu LES auf LiMSwiki

Wissenschaftliches Datenmanagementsystem / Scientific Data Management System (SDMS)

Ein Scientific Data Management System (SDMS) ist eine Software, die in erster Linie zur zentralen Dokumentation, Speicherung und zum Wissensmanagement in wissenschaftlichen Laboren eingesetzt wird. Mit einem SDMS können Forschende und das gesamte Laborpersonal Labordaten und Wissen besser speichern und suchen, Arbeitsabläufe und Genehmigungsprozesse beschleunigen und die Zusammenarbeit zwischen den Mitarbeiterinnen und Mitarbeitern optimieren. Es ist daher darauf ausgelegt, alle generierten unstrukturierten wie strukturierten Labordaten (Rohdaten, Ergebnisdateien, Dokumente) aus Datensystemen wie einem LIMS oder einem ELN sowie Gerätedaten zu verarbeiten und speichern. Die Softwareanwendungen sind häufig auf die geordnete Langzeitspeicherung komplexer Analysedaten wie Spektren oder Chromatogramme ausgerichtet und umfassen neben der Datenerfassung und Übernahme auch die Datenvisualisierung sowie teilweise die Erstellung von Berichten.

Weiteres zu SDMS auf LiMSwiki

Labor-Informations- und Management-Systeme (LIMS) / Laboratory Information and Management Systems (LIMS)

Ein Labor-Informations- und Management-System (LIMS) ist ein Softwaresystem für die strukturierte Erfassung und Verwaltung von Daten sowie die Unterstützung von Arbeitsabläufen in Forschungs- und Entwicklungs-Laboren, die probenorientiert arbeiten. Sie können die Produktivität und Effizienz von Laboren verbessern, indem sie den Prozess der Erfassung von Informationen und der Verwaltung von Aufgaben automatisieren und rationalisieren. Nicht nur alle wichtigen Informationen von Proben und Experimenten, sondern auch von Laborabläufen, Geräten und Personal werden hierüber dokumentiert und verwaltet. Ein LIMS ist also eher an vordefinierten, verallgemeinerten und gleichbleibenden Arbeitsabläufen auf der Ebene der Laborleitung orientiert und dient in erster Linie der Nachverfolgung und Lokalisierung von Proben.

Weiteres zu LIMS auf LiMSwiki

Diese Tools sind spezialisiert auf die Arbeit in Laboren und mit Experimenten. Eine exakte Abgrenzung dieser Systeme ist häufig schwierig, da sie oft übergreifende Funktionalitäten aufweisen. Bei der Suche eines geeigneten Systems empfiehlt sich daher sowohl eine breiter angelegte, als auch eine gezielte Recherche in den jeweiligen Fachdisziplinen. 

Beispiele aus anderen Bereichen sind:

GitLab und GitHub

Git ist eine freie Software zur verteilten Versionsverwaltung von textbasierten Dateien. Git registriert Unterschiede zwischen Dateien und kann damit Veränderungen an unterschiedlichen Stellen automatisch und eigenständig integrieren. Man kann mit Git rein lokal arbeiten, um Versionen seiner Arbeit zu speichern. Durch die Einbeziehung von zentralen Servern (sog. Remote Servern) können aber auch viele Beteiligte gemeinsam an den gleichen Dateien arbeiten.
Git eignet sich daher ideal für die Versionierung bzw. das kollaborative Arbeiten im Rahmen des Forschungsdatenmanagements und der Entwicklung von Forschungssoftware. So wird es überwiegend bei der Versionsverwaltung von Software-Code eingesetzt, eignet sich aber genauso zum gemeinsamen Schreiben von LaTeX-Dokumenten oder anderen textbasierten Dateien.

GitHubGitLab und Bitbucket sind beispielhafte Plattformen, die die Server-Seite von Git implementieren. GitHub stellt eine momentan kostenlose Plattform zur Verfügung, auf der Projekte ihre Arbeit öffentlich zur Verfügung stellen können. Mit GitLab, GitHub Enterprise oder Bitbucket kann man seinen eigenen Git-Server aufsetzen oder betreiben lassen. 
In den meisten Linux-Distributionen ist Git bereits als Paket enthalten. Unter Windows können Tools wie git bash (Kommandozeilen-Tool), TortoiseGit (Integration in den Windows-Explorer) oder auch SourceTree (grafische Benutzeroberfläche) genutzt werden.

Hier geht's zu einem Cheatsheet mit den wichtigsten Git Befehlen

Hier gibt es eine ausführliche Git Dokumentation

Wie Git im Bereich Forschungsdatenmanagement eingesetzt werden kann, zeigen die beiden Schulungsvideos „Git einrichten“ und „Git bedienen“, die im Rahmen von Forschungsdatenmanagement Bayern entstanden sind.

Hier gibt es eine Schulungseinheit zum Erlernen von Git bei den Carpentries

Hier geht's zu Spielen zum Erlernen von Git: GitHub und Learn Git Branching

Workflow-Management-Systeme

mit denen Arbeitsabläufe modelliert und gesteuert werden können

Jupyter notebooks

Jupyter Notebooks beschreiben ein offenes Dokumentformat, in dem Text und Code-Bestandteile miteinander kombiniert werden können. Die Code-Teile können direkt ausgeführt, aber auch verändert werden. Damit können wissenschaftliche Workflows in einer dokumentierten und gleichzeitig ausführbaren Art und Weise gespeichert und zur Verfügung gestellt werden. Jupyter Notebooks können lokal installiert und ausgeführt oder auch auf einem zentralen Server (einem Jupyter Hub) hinterlegt werden.

Ein Jupyter Lab kann als interaktive Entwicklungsumgebung für Notebooks, Code und Daten verwendet werden.

Hier geh'ts zu einer ausführlichen Dokumentation

Hier geht's zu einem Tutorial für Forschende

Darüber hinaus vereinen Virtuelle Forschungsumgebungen (VFU) fachspezifische Tools, Toolsammlungen, Arbeitsumgebungen und Daten für eine ortsunabhängige Zusammenarbeit zwischen Wissenschaftlerinnen und Wissenschaftlern eines bestimmten Forschungsverbunds oder einer bestimmten Forschungscommunity.

Virtuelle Forschungsumgebungen (VFU) / Virtual Research Environments (VRE)

In der Verbundforschung ist der Austausch von Informationen notwendig. Dokumente und Daten müssen oft in einer kontrollierten und organisierten Art und Weise über mehrere Organisationen oder Forschungseinrichtungen verwaltet werden. Wird die Verwaltung vernachlässigt, kann dies viel zusätzliche Arbeit nach sich ziehen. Eine Lösung für diese Anforderungen bieten Virtuelle Forschungsumgebungen (VFU). Darunter versteht man Softwarelösungen oder webbasierte Plattformen, die Forschenden eine ortsunabhängige Zusammenarbeit ermöglichen.
In den letzten Jahren haben viele Hochschulen und/oder deren Serviceeinrichtungen sowie Forschungsverbände und Arbeitsgruppen Projekte zur Entwicklung Virtueller Forschungsumgebungen aufgesetzt bzw. bereits abgeschlossen.

Einige Beispiele für fachspezifische VFUs finden Sie auf der Länderseite von Baden-Württemberg, wo von 2016 bis 2019 mehrere Projekte gefördert wurden, oder unter den jeweiligen Wissenschaftsbereichen.

Hier geht’s zu einer thematischen Übersicht von Tools

Sie vermissen ein wichtiges Werkzeug? Nehmen Sie gerne mit uns Kontakt auf.