Praktische Übung
zu Grundlagen der Biostatistik
Lernziele
Darstellung von Messdaten
-Histogramme
-Median, Quartile, Boxplot
-Regression, Korrelation
Testen,Vertrauensintervalle
- Der t-Test zum Vergleich der Mittelwerte in unabhängigen Gruppen
- Der t-Test zum Paarvergleich von zwei
Mittelwerten
- Die Prüfung auf Vorliegen einer
Korrelation zw. zwei Messvariablen
1.
Medizinische Daten - Vom Fragebogen zum Datenbankausdruck
Die
Präsentation und Übungen für die Studierenden stehen über das Internet zur
Verfügung. Der Vortragende hat bei Ausfall des Internets eine CD zur Verfügung,
über die er am Demonstrationsrechner notfalls die Übung abhalten kann.
Unterschiedliche
Arten von Daten verlangen unterschiedliche Darstellungen und Auswertungen. Daher
sollen zunächst an einem vorliegenden Datenerhebungsbogen die unterschiedliche
Arten von medizinischen Daten erarbeitet werden (qualitativ – ordinal -
metrisch; diskret– kontinuierlich).
In diesem Zusammenhang soll auch die Gestaltung eines Datenerhebungsbogens
angesprochen werden (z.B. Identifikation der Patienten, Modularität des
Aufbaus, Prinzipen der Verschlüsselung).
Begriffe der Qualität von Daten (Vollständigkeit,
Richtigkeit, Genauigkeit, Reliabilität, Validität) sollten unter Hinweis auf
die Vorlesung diskutiert werden.
Die Haltung von Daten am Computer soll anhand des
auf dem Fragebogen basierenden Datensatzes erklärt werden (Einführung in SPSS,
Eingabemaske, Labelvergabe, Kodierung). Eine (geringe) Anzahl von Fragebögen
wird von den Studierenden in die Datenbank eingegeben.
Methoden der Qualitätssicherung (z.B. Source data
verification, Plausibilitätsprüfung, Double data entry) und des Datenschutzes
(z.B. Anonymisierung) sollen angeschnitten werden.
Das Ziel dieser Einheit besteht im Datenbankausdruck
des selbst erstellten Datensatzes.
Je nach verbleibender Zeit können noch einige
einfache Bearbeitungs- und Auswertungsschritte der Daten unter Hinweis auf die
Erklärungen in späteren Übungen durchgeführt werden (Sortieren,
Transformieren, Selektieren, Stabdiagramme, Scatterplots, usw.).
Für die folgenden Übungen soll ein Datensatz
verwendet werden, der über Internet verfügbar ist.
In diesem Zusammenhang ist zu überlegen, ob nicht SPSS zusätzlich auf den Übungsrechnern
für SSM2 standardmäßig installiert und der Datensatz zu Beginn in den
Rechnern lokal abgespeichert werden soll.
Der Begriff der absoluten und relativen Häufigkeit
soll anhand von qualitativen und ordinalen Merkmalen erläutert werden.
Die Vierfeldertafel zur Beschreibung des
Zusammenhangs zw. zwei dichotomen Merkmalen soll zusammen mit den verschiedenen
Prozentangaben verstanden und anhand von Beispielen erstellt werden. In diesem
Punkt soll bereits auf die statistische Aufgabe des späteren Vergleichs von
zwei Anteilen aus einer Vierfeldertafel hingewiesen werden (siehe Punkt 5). Die
Erweiterung der Häufigkeitstabellen auf Tafeln mit r Zeilen und c Spalten soll
ebenfalls an Beispielen des Datensatzes erarbeitet werden.
Die Probleme der Interpretation bei Häufigkeitstabellen
von Merkmalen mit Mehrfachnennungen werden anhand von Beispielen durch den Übungsleiter
aufgezeigt. Auch das wichtige Problem der Stichprobeneinheit (Patienten,
Aufnahmen auf die Intensivstation, Implantat) wird an Beispielen diskutiert.
Die Studierenden sollen Häufigkeitsdarstellungen
von qualitativen Daten in graphischer Form von Kreisdiagrammen anhand der
gleichen Beispiele erarbeiten.
Für ordinale Merkmale wird die graphische
Darstellung in Form von Stabdiagrammen erarbeitet. Dabei soll das Konzept auch
auf die simultane Darstellung von Stabdiagrammen relativer Häufigkeiten in
mehreren Gruppen erweitert werden.
Hinweise auf irreführende graphische Darstellungen
sollen gegeben werden („Achsenbruch“, graphische Darstellung ohne den
Nullpunkt, 3D-Darstellungen). Hier könnten auch Beispiele aus den Medien das
Interesse stimulieren.
Je nach verbleibender Zeit könnten Ausgestaltungen
der Graphiken (Stapelung, Farben) geübt werden.
3., 4. Darstellung von Messdaten
-
Histogramme
Die graphische Darstellung von Messvariablen mittels
Histogrammen wird durch die Erstellung einer Rangliste erarbeitet. Die Wahl der
Klassenbreite wird über die unterschiedliche Darstellung des gleichen
Datensatzes (mit unterschiedlichen Intervallgrenzen) diskutiert. Das Konzept
soll auf die Darstellung von Histogrammen relativer Häufigkeiten in mehreren
Gruppen erweitert werden. In diesem Punkt soll auf das Problem des späteren
Vergleichs von Mittelwerten zweier Gruppen verwiesen werden (siehe dazu Kapitel
6).
Statistische Lage- und Streuungsmaße werden für
das Beispiel von Mittelwert und der Standardabweichung berechnet. Neben der
formelmäßigen Darstellung werden die Maße erklärt (z.B. über den
Schwerpunkt und die durchschnittliche quadratische Abweichung) und an
verschiedenen Beispielen graphisch durch den Übungsleiter interpretiert. Auch
der Einfluss von Ausreißern (einzelne Werte, die stark von allen anderen
abweichen) auf die berechneten Mittelwerte und Standardabweichungen werden
anhand eines Datensatzes veranschaulicht.
Der ‚Standard Error of the mean’ (SEM) als
Streuungsmaß nicht für die Einzeldaten, sondern als Maß für die
„Unsicherheit“ für den Mittelwert selbst wird erklärt und an einem
Beispiel von den Studierenden errechnet. Es erfolgt ein Hinweis auf
Konfidenzintervalle als Schätzung eines Bereichs für den unbekannten
Mittelwert aus der Stichprobe.
Die Darstellung von Verlaufskurven über den
Mittelwert und SEM wird an einem Beispiel durch den Übungsleiter
veranschaulicht. Der Einfluss von systematisch fehlenden Werten auf die
Mittelung von Verlaufskurven wird diskutiert.
-
Median, Quartile, Boxplot
Am Beispiel des Medians wird über die Erstellung
einer Rangliste ein Lagemaß eingeführt, das robust gegenüber Ausreißern ist.
Zur Erklärung wird eine Stichprobe mit ungeradem Stichprobenumfang verwendet.
An Beispielen wird gezeigt, dass der Median unverändert bleibt, wenn einzelne
Werte weit von den anderen stark abweichen.
Durch einen kleinen Schritt der Verallgemeinerung
werden Quartile definiert. An Beispielen wird auch deren Robustheit gegenüber
einzelnen Ausreißern erarbeitet. Der Interquartilsabstand (IQR) wird als
Streuungsmaß eingeführt. Dieser charakterisiert die Breite eines Bereichs,
indem die zentralen 50 % der Daten liegen.
Median, Quartile, Minimum und Maximum bilden die
Basis für die graphische Darstellung in Form von Boxplots. Dieses Konzept wird
erklärt, von den Studierenden am Rechner umgesetzt und auf eine Gegenüberstellung
mehrerer Gruppen erweitert.
-
Regression, Korrelation
Das Problem der graphischen Darstellung von zwei an
einer Person gemessenen Variablen wird anhand eines Streudiagrammes eingeführt.
Der Korrelationskoeffizient als Maß für den
linearen Zusammenhang wird definiert und anhand verschiedener Beispiele zusammen
mit dem Streudiagramm von den Studierenden berechnet. Die Unabhängigkeit des
Korrelationskoeffizienten bzgl. der Messeinheit wird vom Übungsleiter anhand
von Beispielen erklärt. Der Einfluss von stark abweichenden einzelnen
Beobachtungen auf den Wert des Korrelationskoeffizienten wird anhand
verschiedener Beispiele dokumentiert. Schließlich wird auf das spätere Problem
der statistischen Prüfung eines zw. den Variablen bestehenden Zusammenhangs
verwiesen (siehe Kapitel 6).
Die Berechnung einer Regressionsgeraden zur
Bestimmung des Wertes einer Variablen aus dem Wert einer anderen Variablen wird
demonstriert. Die Regressionsgerade wird von den Studierenden anhand von
Beispielen berechnet und gezeichnet. Die Abhängigkeit des Wertes des
Regressionskoeffizienten von den Merkmalseinheiten und seine Interpretation
werden diskutiert.
An einem Beispiel wird demonstriert, wie durch die
Transformation eines Merkmales ein linearer Zusammenhang erreicht werden kann.
5. Der Vergleich von Häufigkeiten
-
Der c2-Test
Das Prinzip des Vergleichs von zwei Häufigkeiten
wird am Beispiel von Anteilen überlebender Patienten in zwei unterschiedlichen
Diagnosegruppen in Form einer Vierfeldertafel aus der 2. Übung erarbeitet.
Die „skeptische“ Ausgangshypothese
(Nullhypothese), die es zu widerlegen gilt, wird formuliert als: „Die
zugrundeliegenden Überlebenswahrscheinlichkeiten für die beiden Diagnosen sind
gleich“. Die (zweiseitige) Alternative ergibt sich als das Komplement, „Die
beiden Überlebenswahrscheinlichkeiten sind ungleich“.
Die unter der Gleichheitshypothese erwartete
Verteilung der Anzahl der verstorbenen Patienten auf die beiden Gruppen in
dieser Tafel soll erarbeitet werden. Es soll an dem Beispiel in heuristischer
Weise eine Größe erarbeitet werden, die eine Quantifizierung der Abweichung
zwischen den tatsächlich beobachteten Anzahlen und diesen erwarteten Anzahlen
erlaubt. Die Formel für diese als Summe aller quadrierten standardisierten
Abweichungen resultierende Prüfgröße (c2-Wert)
wird angegeben.
Das in der Vorlesung eingeführte Konzept des
kritischen Bereichs, in dem die Zweifel an der Gültigkeit der Nullhypothese zu
groß werden, wird für diese Prüfgröße
wiederholt. Die Entscheidungstafel des statistischen Tests wird gezeigt.
Die kritischen Grenzen für diesen c2-Wert
werden unter verschiedenen Vorgaben für das Signifikanzniveau a des Tests tabellarisch gegenübergestellt und diskutiert. Das Testergebnis
wird softwaremäßig berechnet und der gefundene p-Wert anhand der Tabelle der
kritischen Grenzen für den c2-Wert
diskutiert.
Ein Konfidenzintervall für den Unterschied der Überlebenswahrscheinlichkeiten
wird berechnet und pragmatisch interpretiert.
An einem theoretischen Beispiel mit gleichen
beobachteten Anteilen überlebender Patienten und steigendem Stichprobenumfang
wird das Problem der statistischen Power des
c2-Tests
pragmatisch erklärt.
Das Konzept des Vergleichs von zwei Häufigkeiten
wird auf den Vergleich von Häufigkeitsverteilungen in größeren rxc-Tafeln
verallgemeinert. Der analog zum Vierfeldertest gebildete c2-Wert wird für ein Beispiel softwaremäßig berechnet und das Ergebnis
zusammen mit den nun für die größere Tafel geänderten kritischen Grenzen
diskutiert.
-
Der t-Test zum Vergleich der Mittelwerte in unabhängigen Gruppen
-
Der t-Test zum Paarvergleich von zwei Mittelwerten
-
Die Prüfung auf Vorliegen einer Korrelation zwischen zwei Messvariablen
In Analogie zur 5. Übung werden die entsprechenden
(zweiseitigen) Hypothesen für die drei Probleme in verbaler Form definiert.
Die Teststatistiken für den t-Test werden gezeigt
und pragmatisch erklärt. An Beispielen werden die Tests softwaremäßig
umgesetzt. Dabei sollen die Ergebnisse in Verbindung mit den grafischen
Darstellungen (Histogramme aus der 3. Übung) der beobachteten Verteilungen
diskutiert werden.
Der Vergleich von Mittelwerten in mehreren unabhängigen
Gruppen wird eher im Black-Box-Verfahren an einem Beispiel umgesetzt.
Auch der Test des Korrelationskoeffizienten und,
nach Maßgabe der verbleibenden Zeit, ein Konfidenzintervall für den Anstieg
einer Regressionsgeraden werden ohne Hinweis auf den methodischen Hintergrund an
Beispielen berechnet. Allerdings werden auch dabei die Ergebnisse immer in
Verbindung mit den grafischen Darstellungen der beobachteten Werte
(Streudiagramm aus der 4. Übung) diskutiert.