Dr. Moritz Schaefer
MedUni Wien RESEARCHER OF THE MONTH, Juli 2026
Die MedUni Wien verleiht die Auszeichnung für diesen Monat Dr. Moritz Schaefer aus Anlass der im Top-Journal Nature Biotechnology (IF 41.7) erschienenen Arbeit „Multimodal learning enables chat-based exploration of single-cell data” [1]. Diese AI-basierte Studie entstand während Dr. Schaefers Zeit als Postdoktorand am AI-Institut im Center for Medical Data Science (CEDAS) der Medizinischen Universität Wien in der Arbeitsgruppe von Univ.-Prof. Dr. Christoph Bock (Professor für Medizinische Informatik und Leiter des AI-Instituts, sowie Principal Investigator am CeMM Research Center for Molecular Medicine of the Austrian Academy of Sciences) in Zusammenarbeit mit Dr. Peter Peneder (St. Anna Children’s Cancer Research Institute) sowie weiteren Kolleg:innen am Ludwig-Boltzmann Institut für Netzwerkmedizin, an der Universität Wien und am CeMM.
CellWhisperer: Mit Zellen chatten – AI macht komplexe Datenanalyse zugänglich
Die Einzelzell-RNA-Sequenzierung (scRNA-seq) ist ein unverzichtbares Werkzeug der biomedizinischen Forschung und ermöglicht detaillierte Einblicke in die Funktionsweise einzelner Zellen auf molekularer Ebene. Die Auswertung dieser Daten erfordert jedoch spezialisierte Bioinformatik-Software und Programmierkenntnisse, was eine bedeutende Hürde für viele Forschende darstellt.
CellWhisperer ermöglicht erstmals eine sprachgestützte Analyse von Einzelzelldaten über eine intuitive Web-Oberfläche: Ein einfacher Befehl in natürlicher Sprache wie „Show me structural cells with immune functions” genügt, und die entsprechenden Zellen werden automatisch identifiziert und farbig markiert. Die Methode basiert auf modernen Artificial Intelligence (AI) Methoden und erlaubt es, Zelldaten über eine Chat-Funktion mit beliebigen Fragen zu analysieren – ganz ähnlich einem Gespräch mit einem/einer fachkundigen Bioinformatik-Kolleg:in.
Im Kern von CellWhisperer steckt ein multimodales AI Sprachmodell, welches darauf trainiert wurde, die Aktivitätsmuster von Genen mit ihren biologischen Beschreibungen zu verknüpfen. Dafür wurde das Modell mit über einer Million Genexpressionsprofilen aus mehr als 20.000 öffentlich verfügbaren Studien trainiert. Die Modellarchitektur implementiert dabei Mechanismen wie “contrastive learning” und “LLM instruction tuning”, welche die biologischen Daten und Sprache in einen gemeinsamen mathematischen Raum projizieren. Dies ermöglicht die Bewältigung vielfältiger Nutzeranfragen über diverse biologische Domänen hinweg.
CellWhisperer ist besonders geeignet für die erste Erkundung von Daten. In Vergleichen zeigte sich, dass Nutzer mit diesem Tool viermal schneller zu denselben Schlussfolgerungen kamen als mit konventionellen bioinformatischen Methoden. Darüber hinaus bewies die Software ihr Potenzial für die Forschung: Sie half dabei, die Organbildung in einem Atlas der menschlichen Entwicklung zeitlich zu kartieren und deckte neue Entwicklungsmarker für das Herz und andere Organe auf. Mit einfachen Suchanfragen wie „heart” oder „brain” identifizierte das Modell wesentliche Phasen und Gene bei der Entstehung menschlicher Organe.
CellWhisperer ist als Open-Source-Software frei verfügbar (https://cellwhisperer.bocklab.org) und wurde in den verbreiteten CELLxGENE-Browser für Einzelzellanalysen integriert. Die Studie zeigt, wie AI-Assistenten komplexe Datensätze zugänglich machen und die Hypothesenbildung fördern. Durch die Kombination aus visueller Exploration und Chat-basierter Analyse fungiert CellWhisperer als Partner in der biomedizinischen Forschung, der Expert:innen in ihrer Arbeit unterstützt und gleichzeitig die Interpretierbarkeit in menschlicher Kontrolle belässt.
Mit dieser Arbeit leistet Dr. Schaefer einen wichtigen Beitrag zur Vereinfachung der Einzelzellanalyse und demonstriert, wie AI-Modelle die interdisziplinäre Zusammenarbeit von Biologie, Medizin und Bioinformatik unterstützen können.
Wissenschaftliches Umfeld
Dr. Moritz Schaefer war zwischen Januar 2022 und Juni 2025 als Postdoktorand am AI-Institut im Center for Medical Data Science (CEDAS) der Medizinischen Universität Wien tätig und nahm am CeMM Pre-ERC Postdoc Programm teil. Sein Fokus lag auf der Entwicklung von AI-Methoden zur Analyse von biomedizinischen Daten, mit dem Ziel Forschenden einen direkteren Erkenntniszugang zu ihren Daten zu ermöglichen.
CellWhisperer wurde in der Arbeitsgruppe von Univ.-Prof. Dr. Christoph Bock entwickelt. Dr. Schaefer war verantwortlich für die Schnittstelle zwischen Bioinformatik und Biologie und entwickelte die Modellkonzeption sowie die Datenintegration. Co-Erstautor Dr. Peter Peneder forschte am St. Anna Children’s Cancer Research Institute (CCRI) und evaluierte CellWhisperer. Wesentliche Daten und Anwendungen wurden von Forschenden am Ludwig-Boltzmann Institut für Netzwerkmedizin und der Universität Wien beigetragen. CellWhisperer wurde auf dem Hochleistungs-Cluster der MedUni Wien trainiert und die Web-Applikation wird auf einem Server des CeMM betrieben. Die Zusammenarbeit im Kontext von CellWhisperer wird über gemeinsame Projekte aktiv weitergeführt.
Zur Person
Dr. Schaefer studierte von 2012 bis 2016 Informatik an der Technischen Universität Berlin mit Auslandssemestern an der Jiao Tong University in Shanghai (China) und der Universidad de La Laguna (Spanien). Er erhielt für seine akademischen Leistungen das Deutschlandstipendium. Sein Masterstudium in Informatik mit Schwerpunkt Künstliche Intelligenz (2016–2018) schloss er mit einer Diplomarbeit bei Bayer Pharma ab, die sein Interesse an der Anwendung von AI in der Biologie weckte.
2018 begann er seine PhD Studien im Systems Biology Programm der ETH Zürich, wo er experimentelle und bioinformatische Forschung betrieb. Nach Abschluss seiner Promotion kam er 2022 als Postdoktorand an die Medizinische Universität Wien und ans CeMM, wo er CellWhisperer entwickelte und als Dozent für Machine Learning im MSc-Programm “Molecular Precision Medicine” tätig war.
Seit 2025 setzt Dr. Schaefer seine Forschung an der Stanford University fort, betreut durch Prof. Jure Leskovec und Prof. Zinaida Good. Sein Forschungsschwerpunkt liegt auf einer Weiterentwicklung von CellWhisperer für die multimodale Analyse histopathologischer Bilddaten mit Sprachschnittstellen, um Gewebe- und Zellzustände aus Bild und Text gemeinsam zu erfassen. Ein Prototyp dieser Idee ist bereits als Preprint veröffentlicht [2].
Ausgewählte Literatur
- Schaefer, M.*, Peneder, P.*, Malzl, D., Lombardo, S. D., Peycheva, M., Burton, J., Hakobyan, A., Sharma, V., Krausgruber, T., Sin, C., Menche, J., Tomazou, E. M., & Bock, C. (2025). Multimodal learning enables chat-based exploration of single-cell data. Nature Biotechnology. https://doi.org/10.1038/s41587-025-02857-9
- Schaefer, M.*, Nonchev, K.*, Awasthi, A.*, Burton, J.*, Koelzer, V. H., Rätsch, G., & Bock, C. (2025). Molecularly informed analysis of histopathology images using natural language. bioRxiv. https://doi.org/10.1101/2025.07.14.664402
(* geteilte Erstautoren)