Graphtechnologie schafft Kontext für ethische Standards
Dirk Möller, Area Director of Sales CEMEA, Neo4j, beschreibt, wie KI für mehr Transparenz in der medizinischen Forschung sorgen kann.
Algorithmen, KI und smarte Technologien sind in aller Munde – doch neue Möglichkeiten bringen eine neue Verantwortung mit sich. Um ethischen Standards in der Medizintechnik und der medizinischen Forschung gerecht zu werden, braucht es eine Technologie, die umfassenden Kontext liefert.
Ob beim autonomen Fahren, bei Chatbots im Internet oder Empfehlungen von Streamingdiensten – KI und smarte Algorithmen sind längst Teil unseres Alltags geworden. Damit rückt die Frage nach ethischen Standards als Rahmen für deren Einsatz in den Fokus.
Die EU-Kommission gab in ihrem Vorschlag von April 2021 die Richtung vor. Der Entwurf für den Artificial Intelligence Act (kurz: AIA), soll einen einheitlichen Rechtsrahmen insbesondere für die Entwicklung, Vermarktung und Verwendung künstlicher Intelligenz schaffen. Der AIA stellt hohe Anforderungen an Transparenz, Genauigkeit und Aufzeichnungspflicht. Es wäre die erste EU-Verordnung dieser Art zur Regulierung von Produkten basierend auf Künstlicher Intelligenz. Von ein paar Ausnahmen abgesehen, würde sie für die meisten KI-Systeme gelten, also auch im HealthCare und Life Science Bereich.
Um diese Standards zu erfüllen, sind Technologien notwendig. Insbesondere Machine Learning und Deep-Learning übernehmen hier eine wichtige Rolle. Sie ermöglichen es, hoch vernetzte Daten – wie sie in der Biowissenschaft sowie im Gesundheits- und Patientenwesen existieren – effektiv zu verarbeiten und zu analysieren.
Fehlender Kontext bedeutet Fehleinschätzungen
Damit künstliche Intelligenz gerade in einem so sensiblen Umfeld wie der Medizin menschenähnliche und situationsgerechte Entscheidungen treffen kann, muss sie den Kontext einbeziehen. Mit „Kontext“ sind alle verwandten und relevanten Informationen eines Entscheidungsprozesses gemeint – aus unterschiedlichen Quellen. Eine kontextgesteuerte KI trägt dazu bei, die Erklärbarkeit und Transparenz einer Entscheidung zu gewährleisten.
Dabei muss KI bestimmte Anforderungen erfüllen: Sie muss mit Ambiguität umgehen können. Sie braucht ein umfassendes Training, strenge und klar definierte Regeln und muss für spezifische Anwendungen konzipiert werden. Zudem sollten die Systeme auch auf neue Situationen angemessen und im Rahmen ihrer Konfigurationen reagieren können. Fehlt es an Kontext, so sind die Entscheidungen schlimmstenfalls sogar schädlich – zum Beispiel, wenn es zu voreingenommenen Empfehlungen oder schädlichen Interpretationen kommt.
Graphtechnologie für vernetzte Daten
Wie schafft man einen solchen Kontext? Hier kommt Graphtechnologie ins Spiel. Laut einer Prognose von Gartner werden bis 2025 bereits 80 Prozent aller Daten und Analysen darauf basieren. Graphdatenbanken räumen Beziehungen zwischen Daten denselben Stellenwert ein wie den Daten selbst. Daten und Beziehungen werden dabei realitätsnah abgebildet – in Knoten und Kanten. Im Graphen ist der Knoten „Patient“ zum Beispiel mit Ärzten, Medikamenten oder bestimmten Therapien verbunden. In der medizinischen Forschung werden Gene, Targets und Wirkstoffe als Knoten-Kanten-Konstrukt dargestellt. So lässt sich leicht erkennen, wie jede einzelne Entität mit anderen in Verbindung steht. Was hierbei entsteht, ist ein semantischer Kontext.
Fünf zentrale Faktoren für KI mit mehr Kontext
- Vertrauenswürdigkeit dank Transparenz
Weltweit sind 54% der Menschen bereit, sich im Rahmen der Gesundheitsversorgung auf KI und Robotik einzulassen. Das setzt jedoch umfassende Transparenz voraus. Von Assistenzsystemen berechnete Diagnosen und Therapievorschläge müssen möglichst leicht interpretierbar und nachvollziehbar sein. Andernfalls kommen schnell Zweifel auf. Hier gilt es auch, Ängste zu nehmen, Vorbehalte abzubauen und die Wissenskluft in der Gesellschaft zu schließen.
KI-Diagnosen umfassen Prozesse, die Krankheiten oder Symptome eines Patienten auf Grundlage von Daten erklären. Analysiert wird die Krankengeschichte des Patienten sowie Messwerte aus Tests und Untersuchungen (z. B. EEG, MRT). Während menschliche Diagnoseprozesse zeitaufwändig und anfällig für subjektive Interpretationen sind, bieten computergestützte Verfahren bei ausreichendem Kontext einen objektiven Blick auf die Daten. KI ersetzt damit keinesfalls die menschliche Erfahrung, Kompetenz und Empathie. Sie dient stattdessen als wichtige Ergänzung und steigert zudem den Automatisierungsgrad. Vor allem in überlasteten Gesundheitssystemen kann diese KI-Unterstützung Kosten einsparen und den Zugang zu Gesundheitsdiensten und Ärzten verbessern.
- Data Lineage sorgt für hohe Verlässlichkeit
Graphtechnologie eignet sich hervorragend für Data Lineage, also für Einblicke in die Herkunft bestimmter Daten. Im Graphen ist leicht erkennbar, wie Daten geändert wurden, wo sie Verwendung finden und wer auf sie zugreift. Insbesondere bei vertraulichen, hochsensiblen Daten über Patienten oder umfassenden Daten in der medizinischen Forschung garantiert dies eine hohe Datenintegrität. Das Verstehen und Überwachen der Datenherkunft schützt auch vor der Manipulation von Eingabedaten. Kontextbezogene Informationen helfen zudem, die eigentliche Ursache eines Problems zu erkennen, anstatt nur ein Symptom zu behandeln.
Anschaulich wird diese Eigenschaft von Graphen am Beispiel des Deutschen Zentrums für Diabetesforschung, kurz DZD. Dort wurde 2018 ein standortübergreifendes Knowledge Management auf Basis der Graphdatenbank Neo4j errichtet: DZD Connect. Wissenschaftler stellen Fragen in natürlicher Sprache und profitieren von Nachforschungen zu Metadaten: Wie viele Blutproben von männlichen Patienten unter 69 Jahren haben wir? Aus welchen Studien stammen die Proben? Wie alt sind die Studien? Die Mitarbeiter des DZDs nutzen Graphtechnologie in ihrer Forschungsarbeit für mehr Vergleichbarkeit, um den Weg der Daten nachvollziehen zu können und um Daten entsprechend ihren Forschungsfragen gewichten zu können.
- Fairness: Data Bias & Diskriminierung
Im Kontext vernetzter Daten aus unterschiedlichen Quellen wird schneller offenbar, ob sogenannter Data Bias innerhalb der vorhandenen Daten vorliegt. Die aus der intensiven Produktion und Verarbeitung von Daten entstandene Verzerrung kann erheblichen Schaden anrichten – vor allem, wenn entsprechende Systeme Entscheidungen über Menschen treffen. Falsche algorithmische Ergebnisse können so zu Diskriminierung führen und soziale Ungleichheiten verstärken. Dadurch wird auch die Art und Weise beeinflusst, wie neue Daten erhoben und KI-Modelle trainiert werden.
In der medizinischen Forschung stolpern Wissenschaftler zum Beispiel immer wieder über sogenannten Gender Bias in Datensätzen. Damit sind systematische Verzerrungseffekte gemeint, die durch geschlechterbezogene Stereotypisierungen und Vorurteile geprägt sind und sowohl Wahrnehmungen als auch Entscheidungen beeinflussen. Frauen sind besonders betroffen. Viele klinische Studien liefern nur Datensätze von streng limitierten Kohorten, die jedoch nicht immer repräsentativ für die gesamte Patientengruppe stehen. Graphdatenbanken sorgen hier für ein ganzheitliches Modell und können so präventiv dem Data Bias entgegenwirken.
- Situationelle Flexibilität & Angemessenheit
KI-gestützte Systeme müssen flexibel sein. Bei der Entwicklung von KI muss deshalb die Interaktion mit dem Benutzer für die Gestaltung und Umsetzung autonomer Entscheidungssysteme als essenziell wichtiger Aspekt angesehen werden. Das gilt sowohl für Ärzte, die mit KI-Assistenzsystem zusammenarbeiten, als auch für Personen, die sich über medizinische Portale im Internet (z. B. NetDoktor) informieren wollen.
Ein Chatbot beispielsweise agiert im Idealfall bei einer Interaktion mit einem 7-Jährigen anders als mit einem 30-Jährigen. Kontextbezogene Informationen helfen einer KI-Lösung, sich in neuen Situationen zurechtzufinden, für die sie nicht trainiert ist. Wie es nicht funktioniert, zeigte ein Chatbot, der auf die psychologische Beratung von Kindern spezialisiert war. In einem Fall konnte das KI-System eindeutige Hinweise auf sexuellen Missbrauch nicht erkennen.
- Bessere Vorhersagen – Prädiktive Analytik
Eine der größten Herausforderungen beim Training von KI-Modellen besteht darin, genügend relevante Daten zu sammeln. Graph-Algorithmen wurden speziell entwickelt, um die Topologie solcher stark vernetzten Daten abzufragen: Gemeinsamkeiten finden, einflussreiche Komponenten aufdecken und Muster und Strukturen ableiten. Prädikative Elemente lassen sich in Machine Learning-Verfahren überführen. Das erhöht die Modellgenauigkeit und Präzision von Analysen – und das auf Basis von bereits vorliegenden Daten.
Wie prädikative Analysen im Gesundheitssektor helfen, zeigt das Beispiel der Association for the Advancement of Artificial Intelligence in den USA. Dort erkannten Graph-Algorithmen Cluster in der Interaktion zwischen Patienten, Ärzten, Apotheken und Versicherungen und konnten verdächtige Aktivitäten bei verschreibungspflichtigen Opioid-Schmerzmitteln aufdecken. Die Analyse des Graphen ergab Anomalien – zum Beispiel Apotheken mit sehr hohen Betäubungsmitteleinnahmen bei gleichzeitig kleinem Kundenstamm.
Graphtechnologie schafft den Kontext, um Ethik-Leitlinien beim Einsatz von KI im HealthCare und Life Science Bereich zuverlässig nachzukommen. Je größer der Kontext, desto besser die Entscheidungen. Der Entscheidungsweg ist nachvollziehbar, transparent, flexibel anpassbar und fair. So lassen sich sowohl gesetzliche Rahmenbedingungen erfüllen als auch Vorbehalte im Umgang mit KI proaktiv in Angriff nehmen.
Über den Autor:
Dirk Möller ist seit über 20 Jahren in der IT-Branche unterwegs. Dank leitender Positionen bei Unternehmen wie Symantec, MongoDB und Couchbase entwickelte er detailliertes Fachwissen im Bereich NoSQL und Graphdatenbanken. Als Area Director of Sales CEMEA bei Neo4j unterstützt Dirk Möller Kunden, bestehende Datenbank-Lösungen zu ersetzen bzw. zu erweitern, Kosten einzusparen und mit der Graphdatenbank Neo4j echten Mehrwert aus Daten zu gewinnen.
LinkedIn: https://www.linkedin.com/in/dirkmoeller/
Twitter: https://mobile.twitter.com/dirk_1564
Creative Commons Lizenz CC BY-ND 4.0
Sie dürfen:
Teilen — das Material in jedwedem Format oder Medium vervielfältigen und weiterverbreiten und zwar für beliebige Zwecke, sogar kommerziell.
Der Lizenzgeber kann diese Freiheiten nicht widerrufen solange Sie sich an die Lizenzbedingungen halten.
Unter folgenden Bedingungen:
Namensnennung — Sie müssen angemessene Urheber- und Rechteangaben machen, einen Link zur Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden. Diese Angaben dürfen in jeder angemessenen Art und Weise gemacht werden, allerdings nicht so, dass der Eindruck entsteht, der Lizenzgeber unterstütze gerade Sie oder Ihre Nutzung besonders.
Keine Bearbeitungen — Wenn Sie das Material remixen, verändern oder darauf anderweitig direkt aufbauen, dürfen Sie die bearbeitete Fassung des Materials nicht verbreiten.