Skip to main content

Cluster Analyse

Unsupervised Learning

ME/CFS ist eine schwere Multisystem-Erkrankung mit bislang noch nicht ausreichend erforschter Ursache. Betroffene leiden an massiver, langanhaltender Erschöpfung, neurologischen sowie kognitiven Einschränkungen und einer veränderten Immunantwort. Durch die Ähnlichkeit der Symptome mit anderen Erkrankungen werden vermutlich bis zu 90% der Betroffenen anfänglich falsch diagnostiziert und behandelt. In diesem Projekt wollen wir gemeinsam mit PatientInnen die wichtigsten Diagnoseschritte und Behandlungen definieren.

Unsupervised learning – eine Art von machine learning, nutzt hoch komplexe Algorithmen, um Datensätze möglichst unvoreingenommen zu analysieren und zu ordnen. Auf diese Weise können versteckte Muster ohne menschliches Zutun entdeckt werden. Diese Technik ermöglicht es uns, mit einer Art künstlichen Intelligenz unseren Fragebogen zu analysieren, dessen Datensätze viel zu groß und zu kompliziert wären, als dass man sie manuell auswerten könnte.

Wie funktioniert das?

Die Antwortmöglichkeiten des Fragebogens sind an Werte zwischen null und zehn gekoppelt und zur Analyse anonymisiert. Wenn TeilnehmerInnen eine Antwort geben, werden diese im Hintergrund automatisch einer bestimmten Zahl zugewiesen. Anschließend wird eine entsprechende Distanzfunktion zur Bestimmung des Abstandes (Distanz) zweier Elemente verwendet. Die beantworteten Fragen werden zunächst einzeln verglichen. Aus der Distanz der einzelnen beantworteten Fragen wird dann eine Gesamtdistanz (Ähnlichkeit) berechnet. Daraus ergibt sich eine so genannte Proximität. Werden alle beantworteten Fragen miteinander verglichen, erhält man eine Proximitätsmatrix, in welcher zusammengehörige Gruppen (Cluster) durch Algorithmen erkannt werden können.