Machine Learning in der medizinischen Diagnostik

Einblicke in eine „Black Box“ am Beispiel der fetalen Überwachung

Beitrag von Prof. Dr. rer. nat. Martin Daumer, Lehrstuhl für Datenverarbeitung, TUM Trium, SLCMSR, Peter Hausamann, M.Eng, Doktorand, TU München, Dipl.-Inf. Christian Harböck, Trium Analysis Online, Ülkü Karaduman, Burakhan Koyuncu, Emre Mericboyu, Christian Widderich, Studenten der Vorlesung „Clinical Applications of Computational Medicine“

Seit den 1990er Jahren werden verstärkt sogenannte Expertensysteme entwickelt, die den Arzt bei der Diagnosefindung unterstützen. Es handelt sich dabei um regelbasierte Systeme, die auf Grundlage des ihnen zur Verfügung gestellten medizinischen Expertenwissens Befunde erstellen. Höhere Treffsicherheiten versprechen Machine Learning Methoden, die auf neuronalen Netzen basieren. Im folgenden Beitrag wird eine dieser Methoden vorgestellt, die zur Verbesserung des CTG Monitoring beitragen soll.

Geburtsmedizinische Überwachung durch CTG Monitoring

Ein Teilbereich der medizinischen Diagnostik, in dem sich Machine Learning (ML) als vielversprechend erweisen könnte, ist das sogenannte „CTG Monitoring“ (Cardio-Toko-Gramm oder Herzton-Wehenschreiber), bei dem der fetale Herzschlag und die Wehenstärke der werdenden Mutter kontinuierlich aufgezeichnet und angezeigt wird.

CTG Monitoring ist eines der Standarduntersuchungsverfahren während Schwangerschaft und Geburt durch gleichzeitige Messung der Herztöne des Föten per Ultraschall sowie der Wehen der Mutter mit Hilfe eines Druckmessers. Darüber hinaus können auch grob die Bewegungen des Kindes erfasst werden. Es gibt mehrere Systeme für eine sogenannte „zentrale Kreißsaal Überwachung“ am Markt.

Kritik am Cardio-Toko-Gramm Monitoring

CTG-Monitoring kommt heutzutage in Deutschland und vielen anderen Ländern in weit über 90 % aller Schwangerschaften zum Einsatz. Doch Belege für die tatsächliche Wirksamkeit und Sicherheit des Verfahrens halten dem kritischen Blick der evidenzbasierten Medizin nicht wirklich Stand: in den Meta-Analysen der Cochrane Collaboration [1, 2] (www.cochrane.de) konnte nicht die erhoffte Verbesserung des „Outcomes“ für Kind und Mutter belegt werden, wohl aber eine teils erhebliche Erhöhung der Kaiserschnittrate; in Deutschland derzeit in etwa bei einem Drittel aller Entbindungen, mit den entsprechenden Risiken für Kind und Mutter. Vermutlich spielen dabei Fehleinschätzungen bei der Beurteilung der einlaufenden CTG-Daten, die zu unnötigen Interventionen führen, eine wesentliche Rolle.

CTG Monitoring mit Unterstützung eines Expertensystems

Ein möglicher Ausweg, der selbst in den strengen Cochrane-Reviews aufgezeigt wird, besteht in der Verwendung von computergestützter Online-Auswertung des CTG Signals. Die weiteren Ausführungen werden am Beispiel des Systems „Trium CTG Online“ beschrieben, das von GE Healthcare vertrieben wird. “Trium CTG Online” ist ein System zur webbasierten Erfassung und Online-Analyse von CTG-Daten (siehe Abbildung 1).
 

Berechnung und Auswertung der Messdaten

Die einlaufenden Messdaten werden mit speziellen Methoden kontinuierlich von Ausreißern bereinigt, und es werden mit Mustererkennungsalgorithmen als Kernstück die sogenannte „Baseline“, und damit die „Dezelerationen“ (Absinken der fetalen Herzfrequenz), Akzelerationen (Beschleunigung der fetalen Herzfrequenz) und die Variabilität des Signals berechnet.

Die so berechneten Kenngrößen werden in ein regelbasiertes Expertensystem auf Basis internationaler Expertengremien (FIGO) eingespeist, aus dem dann online letztlich eine Handlungsempfehlung in Form einer Ampelfarbe ausgegeben wird: grün ist o.k., gelb ist die Vorwarnung und rot bedeutet ein Anzeichen für eine kritische Situation. Die Güte und teilweise Überlegenheit dieser computergestützten Klassifizierung des CTGs im Vergleich zu menschlichen Experten ist gut belegt.

Das Problem besteht aber in der immer noch hohen Rate an Fällen, bei denen die Ampel rot wird, obwohl es dem Fötus gut geht, und in Folge der unnötigen, teilweise operativen Eingriffe [4].

Verbessertes CTG Monitoring durch Machine Learning

Es sind verschiedene Verfahren getestet worden, um die Treffsicherheit der Algorithmen zu erhöhen. Die vielversprechendsten Ergebnisse lieferten dabei unserer Einschätzung nach bisher ML-Methoden, die auf neuronalen Netzen basieren. Diese Modelle erhalten verschiedene Eingangsdaten und werden darauf trainiert, signifikante, mit dem Wohlbefinden des Kindes zusammenhängende Parameter, wie z.B. eine schwere Azidose (pH-Wert des Nabelschnurbluts < 7,1) vorherzusagen.

Der Weg zur tatsächlichen Anwendung von ML-Verfahren im Kreißsaal ist allerdings noch lang. Das liegt einerseits daran, dass diese Algorithmen zunächst ausführlich in unabhängigen Studien weiter verfeinert und dann validiert werden müssen. Umfangreiche Datensätze, idealerweise mit einer großen demografischen Bandbreite von Schwangerschaften aus mehreren Kliniken verschiedenen Typs, aus verschiedenen Ländern, und mit einem Spektrum weiterer Details („BIG DETAIL“ zusätzlich zu „Big Data“) sind für Training und Validierung dieser Algorithmen unerlässlich.

Dazu kommt, dass die gelernte Modellierung in neuronalen Netzwerken eine „Black Box“ ist, die in gewisser Weise ohne „Einsicht“, also nicht ohne weiteres nachzuvollziehen ist. Die regulatorischen Hürden für die Zulassung und den Betrieb solcher Systeme durch das Medizinproduktegesetz sind hoch und werden weiter verschärft [5].

Fazit

Ähnlich wie beim autonomen Fahren [6] stellt sich auch in diesem Kontext die sehr schwierige Frage, ob die Gesellschaft bereit wäre, letztendlich von Computern getroffene Entscheidungen umzusetzen, die zwar im Mittel zu einer deutlichen Senkung der Gesamtmortalität führen könnten, aber eben nicht in jedem Einzelfall.

Derzeit arbeiten wir an einer Kooperation mit Partnern aus Deutschland, USA, Israel und Japan an einem „BIG CTG DATA“ Projekt, bei dem an gepoolten CTG- und Outcome-Daten verbesserte Algorithmen entwickelt und validiert werden sollen. Wir erhoffen uns dadurch zu einer (noch) „besseren Welt“ in der Geburtshilfe beitragen zu können – ohne unerwünschte Nebenwirkungen, wie sie etwa in dem lesenswerten und verstörenden Buch „Homo Deus“ von Yuval Noah Harari nachzulesen sind.

Literatur

[1] Alfirevic Z, Devane D, Gyte GML, Cuthbert A. Continuous cardiotocography (CTG) as a form of electronic fetal monitoring (EFM) for fetal assessment during labour. Cochrane Database of Systematic Reviews 2017, Issue 2. Art. No.: CD006066. DOI: 10.1002/ 14651858.CD006066.pub3
[2] Grivell RM, Alfirevic Z, Gyte GML, Devane D. Antenatal cardiotocography for fetal assessment. Cochrane Database of Systematic Reviews 2015, Issue 9. Art. No.: CD007863. DOI: 10.1002/14651858.CD007863.pub4
[3] Ayres-de-Campos, D., Spong, C. Y., Chandraharan, E. and FIGO Intrapartum Fetal Monitoring Expert Consensus Panel (2015), FIGO consensus guidelines on intrapartum fetal monitoring: Cardiotocography. International Journal of Gynecology & Obstetrics, 131: 13–24. doi:10.1016/j.ijgo.2
[4] Schiermeier S., Frisenda S., Reinhard J., Dagres T., Noé KG., Lobmaier S., Schneider KTM, Daumer M., Intrapartum Foetal Heart Rate Monitoring and Rate of Caesarean Section: A National Survey, Z. Geburtshilfe Neonatol 2018; DOI: 10.1055/s-0044-102227 (in press)
[5] Gesetz über Medizinprodukte (Medizinproduktegesetz – MPG)https://www.gesetze-im-internet.de/mpg/BJNR196300994.html
[6] Ethik Kommission, Automatisiertes und vernetztes Fahren. Bundesministerium für Verkehr und digitale Infrastruktur (BMVI), Juni 2017, https://www.bmvi.de/SharedDocs/DE/Publikationen/DG/bericht-der-ethik-kommission.pdf?__blob=publicationFile

Erstmals erschienen in: TiB Ausgabe 2018 Mai/Juni