Seit Langem nutzen Ärzte zur Diagnose von Erkrankungen des blutbildenden Systems das Lichtmikroskop. Die Auswertungen einzelner Blutzellen erfolgen hierbei zum großen Teil manuell. Jetzt erhalten sie digitale Unterstützung durch künstliche Intelligenz.
Bei der Diagnose von malignen Erkrankungen des blutbildenden Systems kommen unterschiedliche Laborverfahren zum Einsatz. Neben modernen immunologischen und molekulargenetischen Methoden spielt die morphologische Diagnostik von weißen Blutzellen am Lichtmikroskop auch über 170 Jahre nach ihrer Einführung durch den Pathologen Rudolf Virchow [1] eine wesentliche Rolle.
Zentral für die hämatologische Diagnostik: die Zytomorphologie
Anders als viele molekulare Methoden, bei denen schon seit langer Zeit Computer verwendet werden, beruht die morphologische Diagnostik noch immer auf der Beurteilung eines menschlichen Zytologen. Dabei werden Leukozyten aus dem peripheren Blut oder Knochenmark auf einen Objektträger aufgebracht, gefärbt und bei hoher optischer Vergrößerung manuell durchmustert und klassifiziert. Nach aktuellen Standards sollen dabei pro Patient mindestens 200 Zellen beurteilt werden [2], was das Verfahren sehr zeitaufwändig machen kann und die Zahl der verfügbaren Untersuchungen begrenzt. Außerdem sind die ermittelten Ergebnisse subjektiv gefärbt und von der Erfahrung des jeweiligen Untersuchers abhängig. Dies vermindert die Reproduzierbarkeit der morphologischen Diagnostik [3].
Unterstützung durch neuartige Software: Deep Learning zur Bildanalyse
In dieser Situation bietet es sich an, auf Fortschritte aus dem Bereich der automatisierten Bildanalyse zurückzugreifen. Auf diesem Gebiet ist es in den letzten Jahren mit Hilfe von künstlichen neuronalen Netzen und Methoden des sogenannten Deep Learning gelungen, das Leistungsniveau menschlicher Untersucher bei der Klassifikation von Bildinhalten zu erreichen [4]. Auch auf Daten aus dem Bereich der medizinischen Bildgebung werden diese Methoden zunehmend erfolgreich angewandt, so etwa in der Radiologie, Pathologie oder Dermatologie.
Ein wesentlicher Vorteil neuronaler Netze ist, dass die Software anhand der Trainingsdaten relevante Strukturelemente in Bildern selbst identifiziert. Eine explizite Vermessung etwa der Kerngröße oder Färbung des Zytoplasma sind nicht nötig.
Hohe Voraussetzungen an Datenqualität und -quantität
Entscheidend für den Erfolg neuronaler Netze in der Bildanalyse ist die Verfügbarkeit einer großen Menge von Bilddaten, die von Zytologen analog zur Routinediagnostik annotiert werden müssen. Unsere Arbeitsgruppe hat hierzu einen Datensatz erstellt, der über 18.000 Bilder einzelner Leukozyten von 100 Patienten mit Akuter Myeloischer Leukämie und 100 Kontrollpatienten beinhaltet. Die Präparate wurden bei 100-facher Objektivvergrößerung mit Hilfe eines Slide Scanners digitalisiert. Die Annotation der Bilddaten durch zwei zytologisch sehr erfahrene MTA erfolgte dann in Analogie zur Routinediagnostik nach einem hämatologischen Standardschema aus 15 Kategorien. So wurde es möglich, die Konsistenz der Annotationen aus zwei unabhängigen Quellen zu vergleichen [5].
Die Qualität von Bilddaten und Annotationen stellt eine wesentliche Voraussetzung für die Anwendung neuronaler Netze dar. Gerade für medizinische Bilddaten kann es schwierig sein, die Voraussetzungen für Datenqualität und -quantität zu erfüllen. Um als Ausgangspunkt für weitere Verbesserungen zu dienen wurde der Bilddatensatz daher von den Autoren auf der Plattform „The Cancer Imaging Archive“ des US-amerikanischen „National Cancer Institute“ veröffentlicht [6].
Zellerkennung auf menschlichem Leistungsniveau
Anhand des Bilddatensatzes konnten dann verschiedene neuronale Netze darauf trainiert werden, einzelne weiße Blutzellen in das diagnostische Standardschema mit 15 morphologischen Klassen einzuordnen. Außerdem können die Netze verwendet werden, um zwei für den weiteren Verlauf von Diagnostik und Therapie zentrale Fragen zu klären, nämlich (i) ob eine Zelle blastären Charakter besitzt, also zu den typischen Zellformen der AML gehört, und (ii) ob die Zelle im Falle eines Normalbefundes auf dem Präparat zu finden sein würde. Für diese beiden Fragen erreichte das neuronale Netz das Leistungsniveau menschlicher Annotatoren. Auch bei der direkten Klassifikation der Einzelzellen übertraf das neuronale Netzwerk andere Ansätze. Der Erfolg des Deep Learning lässt sich also auf die morphologische Untersuchung von Leukozyten übertragen.
Blicke in die „black box“
Abb. 1 Beispielbild aus dem Einzelzelldatensatz neben einer “saliency map”, die die Bedeutung einzelner Pixel für die Klassifikationsentscheidung des Netzwerks illlustriert. Je heller ein Pixel dargestellt ist desto höher ist seine Bedeutung für die Klassifikation.
Ein für die Anwendung im medizinischen Bereich potenziell problematischer Aspekt von neuronalen Netzen ist, dass sie zwar einerseits eine sehr genaue Klassifikation von Bilddaten ermöglichen, andererseits jedoch keine Erklärung für die einzelne Klassifikationsentscheidung liefern. Dies wird gelegentlich als „black box“-Charakter neuronaler Netze bezeichnet. Oft ist es jedoch wünschenswert, neben der reinen Klassifikation des Bildinhalts auch zu analysieren, wie diese zustande gekommen ist. Aus dieser Fragestellung hat sich in den letzten Jahren ein eigenes, aktives Forschungsgebiet entwickelt [7]. Bezogen auf die Klassifikation von Leukozyten berechneten wir so genannte „Saliency Maps“ [8], die es ermöglichen darzustellen, welche Pixel des Bildes für die Klassifikationsentscheidung des Netzwerks besonders relevant waren (Abb. 1). Hierbei zeigte sich, dass das Netzwerk gelernt hat, solche Bereiche der Bilder zu analysieren, die auch für menschliche Zytologen von Bedeutung sind, wie etwa die Struktur des Zellkerns und des Zytoplasma.
Fazit: Chancen und Herausforderungen
Bei der Klassifikation von Leukozyten zur Diagnose von Leukämien erreichen neuronale Netze ein sehr hohes Leistungsniveau bei der Beantwortung klinisch relevanter Fragen, etwa zum Vorliegen blastärer Zellen. Auch die Einordnung von Zellen in die morphologischen Standardkategorien gelingt mit hoher Genauigkeit. Analysen der Netzwerke legen nahe, dass die Klassifikation anhand von Bildstrukturen erfolgt, die auch für menschliche Befunder relevant sind.
Trotz dieser Erfolge bleiben jedoch Fehlermöglichkeiten bestehen. So stellt die Methode hohe Anforderungen an den Arbeitsablauf aus Präanalytik, Färbung und Digitalisierung, um etwa systematische Verzerrungen in den Trainingsdaten auszuschließen. Für viele dieser Aspekte sind in den vergangenen Jahren Schritte zu einer Standardisierung unternommen worden [9].
Auch bei sehr erfolgreichen Netzwerken bleiben Fehlklassifikationen möglich, so dass die Ergebnisse des Netzwerks immer im Kontext anderer Laborresultate und klinischer Parameter zu sehen sind. Bei Berücksichtigung dieser Aspekte haben neuronale Netze jedoch das Potenzial, eine wertvolle diagnostische Entscheidungshilfe zu liefern.
Danksagung
Die vorgestellten Arbeiten entstammen der Kooperation des Helmholtz Zentrums München und des Klinikums der Ludwig-Maximilian-Universität München (LMU) unter der Leitung von Dr. Carsten Marr und Dr. Christian Matek vom Institute of Computational Biology am Helmholtz Zentrum München sowie Prof. Dr. Karsten Spiekermann von der Medizinischen Klinik und Poliklinik III des Klinikums der LMU, Campus Großhadern.
________________________________________________________________________________________
Kategorie: Bioinformatik | Diagnostik
Literatur:
[1] Virchow R. (1845) Weisses Blut, Froriep’s Notizen, 36, 151-156
[2] Wei, A. H., Löwenberg, B., Bloomfield, C. D. (2017) Diagnosis and management of AML in adults: 2017 ELN recommendations from an international expert panel, Blood, 129, 424-447, DOI: 10.1182/blood-2016-08-733196
[3] Font, P. et al. (2013) Inter-observer variance with the diagnosis of myelodysplastic syndromes (MDS) following the 2008 WHO classification, Ann. Hematol., 92, 19-24, DOI: 10.1007/s00277-012-1565-4
[4] Goodfellow, I., Bengio, Y., Courville, A. (2016) Deep Learning, Cambridge, MA, MIT Press
[5] Matek C., Schwarz, S., Spiekermann, K., Marr C. (2019) Human-level recognition of blast cells in acute myeloid leukemia with convolutional neural networks, Nat. Mach. Intell. 1, 538-544, DOI: 10.1038/s42256-019-0101-9
[6] Matek, C., Schwarz, S., Spiekermann, K., Marr, C. A single-cell morphological dataset of leukocytes from AML patients and non-malignant controls (AML-Cytomorphology_LMU). The Cancer Imaging Archive, on the internet at: https://doi.org/10.7937/tcia.2019.36f5o9ld (as of Sep 20, 2020)
[7] Samek, W., Montavon, G., Vedaldi, A., Hansen, L. K., Müller, K. -R. (Eds.) (2019) Explainable AI: Interpreting, Explaining and Visualizing Deep Learning, Lecture Notes in Artificial Intelligence, 11700, Heidelberg, Springer
[8] Simonyan, K., Vedaldi, A., Zisserman, A. (2014) In “Deep inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps,” pp. 1–8, International Conference on Learning Representations (ICLR)
[9] Haroske, G., Zwönitzer, R., Hufnagl, P. et al. (2018) Leitfaden „Digitale Pathologie in der Diagnostik“, Pathologe, 39, 216-221, DOI: 10.1007/s00292-018-0433-y
Headerbild: iStock.com | Vertigo3d; single-cell data set: © C. Matek
Publikationsdatum:
12.11.2020