Datenanalyse: Unsicherheit als Informationsquelle
Helmholtz-Gemeinschaft fördert ein 4-Millionen-Euro-Projekt, in dem Mathematiker und Anwender den Umgang mit Unsicherheiten in Datenmengen verbessern und so Datenkompetenzen stärken
Schnell wachsende Datenmengen eröffnen Möglichkeiten, Herausforderungen aus Gesellschaft, Wissenschaft und Wirtschaft zu lösen. Allerdings unterliegen Daten und Analysen in der Praxis Unsicherheiten. Geeignete wahrscheinlichkeitstheoretische Verfahren können aus Unsicherheiten aber eine Informationsquelle machen. Im Projekt „Uncertainty Quantification – From Data to Reliable Knowledge“ arbeiten Anwender und Mathematiker des Karlsruher Instituts für Technologie (KIT) und neun weiterer Institutionen nun zusammen, um zuverlässige Erkenntnisgewinne aus großen Datenmengen zu ermöglichen und anwendbare Werkzeuge zu entwickeln. Gefördert wird es von der Helmholtz-Gemeinschaft für die nächsten drei Jahre.
„Gerade bei Themen von öffentlichem Interesse wie Klimawandel, Energieversorgung und personalisierter Medizin ist eine Quantifizierung und verständliche Vermittlung von Wahrscheinlichkeiten, Chancen und Risiken unerlässlich“, sagt Professor Martin Frank vom KIT. Er ist Direktor des Steinbuch Centre for Computing (SCC) des KIT und Sprecher des KIT-Zentrums MathSEE (steht für Mathematics in Sciences, Engineering, and Economics). „Wir halten es für unverzichtbar, Unsicherheiten zu verstehen, und möchten mit unserem Projekt die Datenkompetenz von Forschenden stärken.“ Das Projekt „Uncertainty Quantification – From Data to Reliable Knowledge“ war nun im Rahmen des Helmholtz-Inkubators im Bereich Information & Data Science erfolgreich. Das Projekt kombiniert die Entwicklung von Methoden und Werkzeugen zum Umgang mit Unsicherheiten in Datenmengen mit deren Vermittlung.
Mit geeigneten probabilistischen, also wahrscheinlichkeitstheoretischen Verfahren der Data Science stellt Unsicherheit eine wertvolle Informationsquelle und Bereicherung von Blackbox-Ansätzen wie der Künstlichen Intelligenz dar. Um diese Vorteile zu nutzen, setzt das Projekt an der Schnittstelle von Anwendungen und Mathematik an. Ziel ist es, zuverlässige Erkenntnisgewinne aus Daten zu ermöglichen, indem breit anwendbare Werkzeuge und Methoden im Forschungsfeld Uncertainty Quantification (Deutsch etwa „Unsicherheitsbemessung oder Fehleranalyse“) anhand konkreter Anwendungsfälle entwickelt werden.
Data Science für Klima, Energie, Gesundheit und Information
Das Projekt vernetzt Forschende aus den vier Forschungsprogrammen Erde & Umwelt, Energie, Gesundheit und Information der Helmholtz-Gemeinschaft untereinander sowie mit Helmholtz-Datenwissenschaftlerinnen und -wissenschaftlern sowie externen Hochschulpartnern aus Mathematik und Ökonometrie. Ein Beispiel aus den künftigen Projektthemen sind etwa die erneuerbaren Energien mit ihrem schwankenden Beitrag zur Energieversorgung. Die Planung und Operation der zukünftigen Energiesysteme erfordert daher eine verlässliche Quantifizierung der Unsicherheiten der Beiträge. Ein weiteres Beispiel sind Klimaprojektionen, die auf komplexen Simulationsmodellen beruhen, in die fehlerbehaftete Messdaten eingespeist werden. Eine genaue Quantifizierung von Unsicherheiten erlaubt eine bessere Auseinandersetzung mit dem Klimawandel und der Kommunikation über ihn.
Mithilfe der entwickelten Werkzeuge und methodischen Ansätze werden Wissenschaftlerinnen und Wissenschaftler aus den Fachdisziplinen verlässliches Wissen aus Unsicherheit extrahieren können, wo traditionelle Ansätze und Software an den schnell wachsenden Datenmengen und deren hoher Variabilität scheitern. Das Projekt wird mit zwei Millionen Euro von der Helmholtz-Gemeinschaft gefördert, weitere zwei Millionen Euro bringen die beteiligten Institutionen ein. Professor Martin Frank vom KIT koordiniert es gemeinsam mit Professorin Christiane Fuchs, die an der Universität Bielefeld und dem Helmholtz-Zentrum München lehrt und forscht.
Helmholtz-Inkubator Information & Data Science
Der Helmholtz-Inkubator Information & Data Science ist ein langfristiger, gemeinschaftsweiter Bottom-up-Prozess und bringt die vielfältige Expertise der Helmholtz-Gemeinschaft im Bereich Information & Data Science zusammen. Er fördert Pilotprojekte, die innovative Ansätze zum Thema haben und dabei Forscherinnen und Forscher über die Grenzen der Helmholtz-Zentren und Forschungsbereiche hinweg verbinden. Information & Data Science umfasst Methoden und Technologien zur Gewinnung von Wissen aus Daten unter den Herausforderungen großer, komplexer, schnelllebiger oder schwach strukturierter Daten (Big Data) entlang der gesamten Daten-Wertschöpfungskette (Data-Lifecycle).
Weitere Informationen unter
http://www.kit.edu
Bildquelle / Lizenz: Im Forschungsfeld Uncertainty Quantification entstehen Werkzeuge für die Data Science, die Unsicherheit als Informationsquelle nutzen. (Foto: Markus Riecker, KIT)