Dr. Roland Roller ist Forscher und Projektleiter in der Gruppe „Sprach- und Sprachtechnologie“ am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI). Am Standort Berlin konzentriert er sich auf Themen im Zusammenhang mit der Verarbeitung natürlicher Sprache und Maschinellem Lernen mit einem hohen Interesse am biomedizinischen und klinischen Bereich. #KI-Berlin hat mit Dr. Roller über seine Forschungsprojekte MACSS und BigMedilytics, die Zugänglichkeit von klinischen Daten und Texten sowie den Klinikbesuch der Zukunft gesprochen.
Sie sind Forscher und Projektmanager in der „Speech and Language Technology“-Gruppe am DFKI. An welchen Themenkomplexen und in welchen Anwendungsbereichen wird dort ganz konkret mit Machine Learning geforscht?
Generell arbeiten wir in unserer Gruppe an einer Vielzahl von Fragestellungen und Anwendungsbereichen, wobei Maschinelles Lernen immer ein Teilaspekt ist. Hauptsächlich haben diese jedoch einen Fokus auf Sprache, insbesondere geschriebene Sprache. Unsere Forschungsgruppe arbeitet hierbei an Themen wie Interaktion, Mobilität, Nachrichten/Medien und Gesundheit, wobei mein Hauptfokus das Thema Gesundheit ist.
Wir sind eine recht große Gruppe, insofern sind die Anwendungsbereiche sehr vielfältig. Beispielsweise arbeiten Leute mit Chatbots, an der Erkennung von hasserfüllten oder falschen Nachrichten (Stichwort: „Hate Speech“ und „Fake News“). Andere hingegen arbeiten im Bereich „einfache Sprache“, also dem Abbilden von komplexer Sprache in eine leichter verständliche Form oder dem Zusammenfassen von Informationen („Summarization“). Ich selbst und diverse meiner Kollegen auch, wir arbeiten im Bereich Informationsextraktion, also der Erkennung und Extraktion relevanter Informationen aus Texten aber auch deren Zusammenhänge. Hier gibt es eine Vielzahl von verschiedenen Techniken. Generell kann man mit diesen Methoden leichter auf Informationen in großen Datenmengen zugreifen und/oder damit Ontologien (Begriffsnetzwerke) und Wissensgraphen anreichern. So gibt es beispielsweise Ansätze, um aus medizinischen Publikationen oder auch aus sozialen Netzwerken mögliche Nebenwirkungen zu identifizieren.
Da Sprache sehr vielfältig ist, sind diese Anwendungsgebiete nicht unbedingt trivial. Ich persönlich arbeite ebenfalls an Modellen zur Identifizierung von Risikopatienten, um zum Beispiel ungewollte Hospitalisierungen frühzeitig zu erkennen. Hierbei spielen Textdaten zwar ebenfalls eine Rolle (z. B. klinische Notizen oder Arztbriefe), allerdings arbeiten wir hier auch mit einer Vielzahl anderer Informationen, die in einem Modell kombiniert werden.
Viele Forschungsgruppen, Startups und Unternehmen stellen große Anstrengungen im Bereich Natural Language Processing an. Wie sieht es mit dem Gesundheitsbereich aus? Wo kann die tägliche Arbeit dort durch neue Lösungen effizienter gestaltet werden?
Wenn sie konkret vom Gesundheitsbereich sprechen, fällt mir natürlich direkt die Anwendung in Krankenhäusern ein. Von meiner Einschätzung her, denke ich, dass sich innerhalb einer Klinik eine Vielzahl von Prozessen optimieren und sich somit Kosten reduzieren lassen. Hierbei spielt vermutlich eine verbesserte Infrastruktur, aber auch eine Vielzahl von Themengebieten aus der KI eine Rolle. Die natürliche Sprachverarbeitung (Natural Language Processing) wäre hier nur ein Teilaspekt. Ansonsten wurden durch die Digitalisierung über die letzten 10-20 Jahre Daten in den Krankenhäusern gesammelt. Hier besteht sehr viel Potential in vielerlei Hinsicht. Das Durchsuchen und Auffinden relevanter Informationen würde mir hier einfallen – kommerzielle Suchmaschinen haben ja keinen Zugriff auf diese Daten – um beispielsweise spezielle Sonderfälle zu finden. Aber auch das Ableiten von Wissen oder die Identifizierung von speziellen Mustern in den Daten ist sehr interessant. Auch in der Verwaltung gibt es Ansätze, durch Unterstützung von Fachpersonal, aber auch durch KI, für das Krankenhaus beispielsweise optimierte Abrechnungen durchzuführen. Hierbei ist das Ziel, all das abzurechnen, was auch bei der Behandlung durchgeführt wurde. Wird etwas vergessen, geht dem Krankenhaus Geld verloren.
Kommen wir zu Ihren Projekten: Mit Ihrem Team haben Sie in den vergangenen drei Jahren an der Entwicklung einer neuartigen, patientenzentrierten eHealth-Plattform gefeilt. Wie kann man sich das Projekt MACSS (Medical Allround-Care Service Solutions) genau vorstellen? Welche Ergebnisse gab es?
Das Ziel von MACSS war es, eine patientenzentrierte eHealth-Plattform zu schaffen, um hierbei die Mediziner am Transplantationszentrum der Charité mit ihren Patienten zu verknüpfen, aber auch mit anderen behandelnden Ärzten. Eines der Probleme der Mediziner liegt darin, dass die Patienten nur einmal pro Quartal zur Visite vorbeikommen. In der restlichen Zeit des Jahres wissen die Ärzte nicht immer, was gerade mit den Patienten passiert. Ob es beispielsweise zu Medikationsänderungen durch andere Mediziner kam oder möglicherweise andere Probleme aufgetreten sind. Davon abgesehen, können sich Patienten in der Visite dann auch häufig nicht mehr genau erinnern, was vielleicht vor zwei Monaten passiert ist. Die Mediziner der Charité haben immer wieder betont, dass die Therapietreue ein sehr relevanter Aspekt für den Erfolg einer Behandlung von chronisch kranken Patienten ist. Daher war das Hauptziel von MACSS eine Plattform zu schaffen, über die transplantierte Nierenpatienten ihre tägliche Medikamenteneinnahme sowie weitere Vitalparameter besser dokumentieren und mit ihren behandelnden Medizinern über einen sicheren Kanal teilen können. MACSS berücksichtigt auch eine Vielzahl weiterer Aspekte, wie beispielsweise den Austausch von Informationen über diese Plattform zwischen Fachärzten, falls dies der Patient wünscht. Auf diese Weise kann der Gesundheitszustand mithilfe zusätzlicher Informationen besser dokumentiert und bei Problemen schneller interveniert werden.
Im Rahmen von MACSS hat das DFKI, wie auch die Beuth Hochschule, im Bereich Informationsextraktion aus klinischen Texten gearbeitet. Da diese Technologien stark Domänen-abhängig sind und klinische Texte im Normalfall nicht so leicht zugänglich sind, gibt es zur Verarbeitung dieser Daten keine bestehenden Programme und Tools, die man hierbei verwenden kann – zumindest nicht für Deutsch. Im englischen Sprachraum gibt es bereits verschiedene Programme, die man hier verwenden kann. Im Rahmen von MACSS hat das DFKI Daten annotiert und grundlegende Modelle zur Informationsextraktion aus deutschen klinischen Texten bereitgestellt. Diese Modelle können nun in beispielsweise komplexeren Anwendungen integriert werden.
Momentan liegt die Schwierigkeit im deutschen Gesundheitssystem darin, dass Daten nicht zentral zusammengeführt werden. Wie kann eine Bündelung der Ressourcen gelingen – wie bei MACSS angestrebt – ohne, dass sensible Patientendaten gefährdet werden? Bedarf es da noch mehr Initiativen seitens der Politik?
Die Bündelung der Ressourcen ist ein Problem, aber es gibt viele Herausforderungen und Schwierigkeiten. Aus meiner Sicht als Wissenschaftler ist der Zugriff auf die Daten und die Datenqualität ein akuteres Problem. Viele Wissenschaftler, aber auch Firmen, arbeiten mit klinischen Daten und klinischen Texten. Allerdings arbeitet oft jede Forschungs-Gruppe für sich alleine. Gemeinsame Datensätze, wie sie in anderen Bereichen existieren, liegen kaum vor. Das hat natürlich einen guten Grund, allerdings hemmt dies die Entwicklung. Wenn Wissenschaftler ihre Methoden auf den gleichen Daten evaluieren und vergleichen können, so hat dies ein ganz anderes Gewicht, als wenn jeder auf seinen eigenen, unveröffentlichten Daten von tollen Ergebnissen berichtet. Die Vergleichbarkeit geht so verloren. Die Auswahl der Trainingsdaten, aber auch eine kleine Abwandlung des Problems selbst, kann einen großen Einfluss auf das Resultat haben. Im englischen Sprachraum gibt es den MIMIC-Datensatz (Medical Information Mart for Intensive Care), auf den man nach strengen Sicherheitshürden zugreifen kann, aber im deutschsprachigen Raum gibt es leider kein Äquivalent. Dies wäre aber ungemein wichtig, um die Entwicklung in unserem Sprachraum weiter zu fördern.
Die Bündelung der Daten ginge dann sogar noch einen Schritt weiter. Ich denke, es gibt bereits diverse Bestrebungen zur Bündelung von Ressourcen, auch Forschungsprojekte. Insofern gibt es hier vermutlich auch ein großes Interesse auf politischer Ebene und ohne Initiative seitens der Politik wird es nicht gehen.
Das MACSS-Projekt wurde als eine Blaupause für Ihr jetziges Projekt BigMedilytics verwendet, welches sich in 12 Pilotprojekten mit der Produktivitätssteigerung im Gesundheitssystem befasst. Worum geht es da im Detail?
Das Projekt BigMedilytics – Big Data for Medical Analytics ist ein relativ großes EU-Projekt, mit Philips als Konsortialführer. Es zielt darauf ab, die Produktivität im Gesundheitswesen durch die Anwendung von Big-Data-Technologien signifikant zu steigern und gleichzeitig die Kosten zu senken, die Heilungschancen der Patienten zu verbessern und den Zugang zu Gesundheitseinrichtungen zu steigern. Es gibt insgesamt 12 unterschiedliche Pilotprojekte, die sich alle mit unterschiedlichen Themen in diesem Bereich befassen. Zusammen mit der Charité, dem Hasso-Plattner-Institut (HPI), der AOK Nordost und dem Universitätsklinikum Essen arbeiten wir zusammen am „Kidney Pilot“. Unser Pilot basiert auf dem BMWi-geförderten Projekt MACSS. Im Rahmen von MACSS hatten wir drei Jahre Zeit, die Plattform hochzuziehen. Im Rahmen von BigMedilytics kann nun eine Evaluierung durchgeführt werden. Wir können beispielsweise untersuchen, ob die Plattform dazu beitragen kann, eine bessere Behandlung von Patienten zu gewährleisten. Also alleine, wenn wir uns die Therapietreue anschauen. Davon abgesehen arbeiten das DFKI und das HPI an zusätzlichen Methoden zur Analyse der Daten, wie beispielsweise der Identifizierung von Risikopatienten, um hierbei die Ärzte zu unterstützen.
Die Nutzung von Mustererkennung, Machine Learning und KI nimmt in Ländern wie etwa China teilweise Formen an, die Ängste gegenüber der Technologie in unserer Gesellschaft weiter schürt, obwohl es viele Gegenbeispiele einer Nutzung im Sinne aller gibt. Wie sehen Sie das Potential hier in Deutschland sowie im europäischen Kontext?
Wenn wir von KI sprechen, so habe ich das Gefühl, dass die Entwicklung derzeit recht rasant ist. Es passiert sehr viel in der Forschung; in einer Vielzahl von Bereichen. Aber auch die Industrie treibt das Thema voran. Mit dabei sind viele große internationale Unternehmen wie Google, Facebook, Uber aber auch Tencent oder Baidu. Vielleicht ist dies ein wenig vergleichbar mit der Industriellen Revolution am Anfang des 19. Jahrhunderts. Es herrscht eine Art Goldgräberstimmung und der Glaube an das Potential der Technologie ist enorm. Gerade in China scheint hier eine große Euphorie zu herrschen, zum Teil initiiert durch AlphaGo, die Regierung, aber vermutlich auch durch die vielen Menschen, die einer „neuen“ Technologie sehr offen gegenüberstehen.
Wenn Sie von „Ängsten gegenüber der Technologie in unserer Gesellschaft“ sprechen, denken Sie vermutlich an Möglichkeiten zur Überwachung und das „Social Scoring“ in China. Ja, ich vermute, dieses Potential wird ausgeschöpft. Bei uns in Deutschland sieht das glücklicherweise aber anders aus. Mit unserer Vergangenheit sehen viele Menschen dies sehr viel kritischer und lehnen den „Gläsernen Menschen“ ab. Auf der anderen Seite kann das Teilen und die Verfügbarkeit von Informationen auch sehr viel Nutzen für uns und unsere Gesellschaft haben – also den Überwachungsaspekt mal außer Acht gelassen. Ich persönlich denke, dass es hier viel Potential auf gesellschaftlicher, aber auch wirtschaftlicher Ebene gibt. Die Frage, die wir uns stellen müssen, ist, ob wir dies wollen. Dies sind Themen die von uns allen in der Gesellschaft diskutiert werden müssen und Datenschutz spielt hier mit Sicherheit eine wichtige Rolle. Nicht alles, was technisch möglich ist, sollte vielleicht auch realisiert werden.
In diesem Zusammenhang arbeiten wir auch beispielsweise ab Ende des Jahres an einem spannenden Projekt, zusammen mit der Friedrich-Alexander-Universität Erlangen-Nürnberg, der Leibniz-Universität Hannover und der Charité und erforschen ethische, soziale und rechtliche Aspekte der Künstlichen Intelligenz in der Medizin. Während wir in BigMedilytics an neuen Vorhersage- und Risikomodellen arbeiten, so müssen deren sichere Anwendung und klinische Nützlichkeit erst durch Studien belegt werden. Es muss sich die Frage gestellt werden, wie Patienten vor Übertherapie geschützt werden können, wenn ein Algorithmus, zum Beispiel, zu sensibel ist.
Werfen wir einen Blick in die Zukunft: Wie läuft ein Klinikbesuch im Jahre 2050 ab?
Ein Klinikbesuch im Jahre 2050? Wie eben bereits erwähnt, ist die Entwicklung zurzeit in Bezug auf Künstliche Intelligenz sehr rasant. Andererseits mahlen die Mühlen im Medizinbereich etwas langsamer. Neue Produkte müssen erst zertifiziert werden und das kann, zumindest in der Vergangenheit, manchmal auch etwas länger dauern. Aber vielleicht ändert sich dieser Prozess in der Zukunft auch. Wer weiß…
Krankheiten wird es im Jahre 2050 nach wie vor geben, aber ich denke, gewisse Prozesse werden effizienter gestaltet sein. Aufgrund des Mangels an Fachpersonal, müssen mehr Menschen mit weniger Personal behandelt werden. Insofern wird Effizienz hier mit Sicherheit eine große Rolle spielen. Hoffen wir, dass dies auch das Terminmanagement betrifft, um Wartezeiten beim Arzt zu reduzieren, aber auch einen effizienteren Informationsaustausch von Daten zwischen Arzt und Patient. Telemedizin wird hierbei ebenfalls ein wichtiger Aspekt im Jahre 2050 sein, um Prozesse effizienter und Fachkräftemangel, etwa in ländlichen Regionen, zu kompensieren.
Des Weiteren bin ich mir sicher, dass Methoden der KI verstärkt Einzug ins Krankenhaus gehalten haben. Dies muss nicht immer so offensichtlich sein, aber zumindest werden viele Geräte oder Programme entsprechende Methoden integrieren, sei es jetzt zur Analyse von Röntgenaufnahmen oder die Unterstützung des Arztes in der Klinik. Eine KI wird keinen Arzt so schnell ersetzen, aber kleine Programme werden hoffentlich den Mediziner dabei unterstützen, die bestmögliche Behandlung für den Patienten zu finden.
Vielen Dank für das Gespräch.