Big Data für die Forschung nutzbar machen: Empfehlungen und Gutachten vom RatSWD

Vor dem Hintergrund der zunehmenden wissenschaftlichen Bedeutung von Big Data-Quellen diskutiert der RatSWD die rechtlichen und strukturellen Herausforderungen ihrer Nutzung. Er leitet Empfehlungen an Forschende und Politik ab.

Aufbauend auf einem Rechtsgutachten der Forschungsstelle RobotRecht, das Teil des Positionspapiers ist, liegt ein Fokus auf Web Scraping-Verfahren.
Um die Interessen von Wissenschaft und Unternehmen zusammenzubringen, könnten unabhängige Treuhandstellen Forschenden einen verbesserten und nachhaltigen Datenzugang ermöglichen. Die Besonderheiten der Forschung mit (personenbezogenen) Big Data sollte in der Datenstrategie der Bundesregierung verankert werden.

Mit seinem aktuellen Bericht adressiert der Rat für Sozial- und Wirtschaftsdaten (RatSWD) Herausforderungen bei der Nutzung von Big Data in der Wissenschaft und veröffentlicht seine Empfehlungen an Forschende und (Wissenschafts-)Politik. In den Sozial-, Verhaltens- und Wirtschaftswissenschaften besteht ein zunehmendes Interesse an der Nutzung von Big Data, die insbesondere im Rahmen digitalisierter Kommunikation und des Konsumverhaltens zunehmend anfallen. Solche Daten zeichnen sich durch große Fallzahlen, nicht beeinflussende Erhebungsverfahren sowie die Möglichkeit zur Echtzeitanalyse und Beobachtung sozialer Interaktionen aus. Um ihr wissenschaftliches Potenzial erschließen zu können, müssen Forschende jedoch vielfältige rechtliche und strukturelle Herausforderungen beachten – soweit sie überhaupt einen Zugang zu den Daten erhalten.
 

Forschenden, denen individuell ein Zugang zu Big Data-Quellen von Unternehmen gewährt wurde, wird häufig der Zugang zu unternehmensstrategisch bedeutenden Variablen oder Beobachtungen verwehrt. Sie können die verwendeten Daten oftmals nicht an andere Forschende weitergeben und unterliegen dem Risiko, dass der Datenzugang vor Abschluss eines Forschungsprojekts einseitig aufgekündigt wird. Darüber hinaus können potenzielle Interessenskonflikte oder Einschränkungen in der Publizierbarkeit von Forschungsergebnissen resultieren; eine Datennachnutzung, z.B. für Replikationsstudien oder eigenständige Fragestellungen, wird zumeist verwehrt.
 

Viele Forschende nutzen Web Scraping-Verfahren, um selbst an Daten aus dem Internet zu gelangen. Hierbei werden vorhandene Software-Schnittstellen genutzt oder aber die für das menschliche Auge entwickelten Webseiten massenhaft ausgelesen. Da mit der Verwendung dieser Datenerhebungsmethoden häufig rechtliche Unklarheiten einhergehen, hat der RatSWD ein Rechtsgutachten bei der Forschungsstelle RobotRecht der Universität Würzburg eingeholt, das die einschlägigen Rechtsfragen des Datenzugangs, der Daten(nach)nutzung und Datenarchivierung aufarbeitet. Das Gutachten wird mit dem Bericht veröffentlicht.

Um das Problem fehlender Zugänge zu Big Data-Quellen systematisch und nachhaltig zu lösen, empfiehlt der RatSWD die Einrichtung von unabhängigen Treuhandstellen. Diese sollen zwischen den Interessen von Forschenden und Unternehmen, welche Big Data vorhalten, vermitteln. Hierzu nehmen Treuhandstellen Daten von Unternehmen entgegen und ermöglichen Forschenden anschließend deren unabhängige datenschutzkonforme Analyse. Der RatSWD begrüßt daher, dass das jüngst veröffentlichte Eckpunktepapier einer Datenstrategie der Bundesregierung  das Konzept der Treuhandstelle als Instrument aufgreift, um „das freiwillige Teilen von Daten zu verstärken“. Der RatSWD empfiehlt, bei der weiteren Ausarbeitung der Datenstrategie die Besonderheiten der Forschung mit (personenbezogenen) Big Data zu berücksichtigen.

Der vollständige Bericht samt Gutachten im Anhang steht auf der Webseite des RatSWD zum freien Download zur Verfügung.

-------------
Der Rat für Sozial- und Wirtschaftsdaten (RatSWD) berät seit 2004 die Bundesregierung und die Regierungen der Länder in Fragen der Forschungsdateninfrastruktur für die empirischen Sozial-, Verhaltens- und Wirtschaftswissenschaften. Im RatSWD arbeiten acht durch Wahl legitimierte Vertreterinnen und Vertreter der sozial-, verhaltens- und wirtschaftswissenschaftlichen Fachdisziplinen mit acht Vertreterinnen und Vertretern der wichtigsten Datenproduzenten zusammen. Er versteht sich als institutionalisiertes Forum des Dialoges zwischen Wissenschaft und Datenproduzenten und erarbeitet Empfehlungen und Stellungnahmen. Der RatSWD engagiert sich für eine Infrastruktur, die der Wissenschaft einen breiten, flexiblen und sicheren Datenzugang ermöglicht. Solche Daten werden von staatlichen, wissenschaftsgetragenen und privatwirtschaftlichen Akteuren bereitgestellt. Der RatSWD hat 34 Forschungsdatenzentren (FDZ) akkreditiert, deren Kooperationen er fördert.