Hinweise zur 14. Übung - KS-Test und MW-Vergleiche -
Die Aufgaben betreffen verschiedene Mittelwertvergleiche.
Bei abhängigen (gepaarten) Stichproben und
bei normalverteilten Merkmalen verwende man
Bei unabhängigen Stichproben und
bei normalverteilten Merkmalen verwende man
1.]
Laden Sie die Daten von Z:rheuma.sav.
Überprüfen Sie mit dem KS-Test, ob Li20 und Li20
normalverteilt sind.
Überprüfen Sie ebenfalls mit dem KS-Test, ob Li20 für Männer und
Frauen getrennt normalverteilt ist.
Anleitung: Daten zur Analyse aufteilen (GESCHL) - Test rechnen -
Datenaufteilung rückgängig machen! (Dies nie vergessen!)
In Nichtparametrische Tests,
KS-Test ist bei Optionen
Fallweiser Ausschluß anzuklicken. Damit soll
gesichert werden, daß nicht Datenzeilen mit fehlenden einzelnen
Werten den Test verfälschen und zwei gleich anzahlige Stichproben
betrachtet werden.
Die SPSS-Syntax ist:
NPAR TESTS /K-S(NORMAL)= li20_1 li20_4 /MISSING LISTWISE.Der KS-Test ergibt
- - - - - Kolmogorov - Smirnov Goodness of Fit Test LI20_1 LA-Kl. II-Ag, % positive Zellen Test distribution - Normal Mean: 14,966 Standard Deviation: 8,424 Cases: 61 Most extreme differences Absolute Positive Negative K-S Z 2-Tailed P ,15868 ,15868 -,12182 1,2393 ,0927 - - - - - Kolmogorov - Smirnov Goodness of Fit Test LI20_4 LA-Kl. II-Ag, % positive Zellen Test distribution - Normal Mean: 11,689 Standard Deviation: 7,791 Cases: 61 Most extreme differences Absolute Positive Negative K-S Z 2-Tailed P ,25867 ,25867 -,18604 2,0203 ,0006Der KS-Test ergibt also die beiden Werte (für 2-Tailed P ) von 0,09 und 0,006. Man gehe somit davon aus, daß keine Normalverteilung vorliegt, da die Forderung aus der KS-Faustregel von 0.4, mindestens aber 0.2, weit unterschritten ist.
Zur Aufteilung der Analyse auf einzelne Merkmale wie Geschlecht muß dies in Daten Daten aufteilen organisiert werden. Die Syntax dazu ist:
SORT CASES BY geschl . SPLIT FILE BY geschl .Die Test wird dann nur noch einmal mit der bisherigen Belegung verwendet.
NPAR TESTS /K-S(NORMAL)= li20_1 /MISSING LISTWISE.Da wir SPSS eine Datenaufteilung vorgeschrieben haben, wird der Test für jede Kategorie der Aufteilungsvariable Geschlecht einzeln gerechnet, hier also 2 mal.
GESCHL: 1 m"annlich - - - - - Kolmogorov - Smirnov Goodness of Fit Test LI20_1 LA-Kl. II-Ag, % positive Zellen Test distribution - Normal Mean: 11,736 Standard Deviation: 5,327 Cases: 14 Most extreme differences Absolute Positive Negative K-S Z 2-Tailed P ,20922 ,20922 -,12877 ,7828 ,5723 GESCHL: 2 weiblich - - - - - Kolmogorov - Smirnov Goodness of Fit Test LI20_1 LA-Kl. II-Ag, % positive Zellen Test distribution - Normal Mean: 15,091 Standard Deviation: 8,542 Cases: 58 Most extreme differences Absolute Positive Negative K-S Z 2-Tailed P ,16734 ,16734 -,13722 1,2744 ,0777Das Resultat im 2.Fall ist das zu erwartende, die Verteilung der Untergruppe "weiblich" von Li20 kann nicht als normalverteilt angesehen werden; aber im 1.Fall stellt sich unerwarteter Weise ein 2-Tailed P-Wert von 0,57 ein: Hier ist die Null-Hypothese einer Normalverteilung also nicht zurückweisbar. Ursache ist die geringe Fallanzahl von 14 Fällen. Damit kann man noch keine gute Trennung von "gut" und "böse" vornehmen.
SPLIT FILE OFF.
2.] Es soll nun geprüft
werden, ob die Merkmale für Li20 und Li20
Mittelwertunterschiede aufweisen.
Anleitung: Zuerst ist zu konstatieren, daß die Merkmale nicht beide
normalverteilt sind:
Für den Test verwende man deshalb den Nichtparametrischen Test für 2
verbundene Stichproben nach Wilcoxon.
Die Aufteilung der Daten nach Geschlecht in No1 muß
rückgängig gemacht sein!
Der Wilcoxon-Test verwendet Ränge der Differenzen von 2 Variablen
und . Da die Stichproben verbundene Stichproben sind, ist
die Anzahl von beiden gleich.
Die Option Fallweiser Ausschluß sichert, daß
bei einzelnen fehlenden Werten auch der Partner-Wert nicht
verwendet wird. Im Test ist vorausgesetzt. Die Differenzen
In Nichtparametrische Tests 2 verbundene Stichproben ist schon Wilcoxon voreingestellt. In Option ist wieder Fallweiser Ausschluß anzuklicken. Achtung: Damit wirklich gepaarte Variable verwendet werden, geht das Bewegen der Variablen in das Fenster zur Verarbeitung auch nur paarweise!
NPAR TEST /WILCOXON=li20_1 WITH li20_4 (PAIRED) /MISSING LISTWISE.Es ergibt sich folgendes Resultat:
- - - - - Wilcoxon Matched-Pairs Signed-Ranks Test LI20_1 LA-Kl. II-Ag, % positive Zellen with LI20_4 LA-Kl. II-Ag, % positive Zellen Mean Rank Cases 33,03 47 - Ranks (LI20_4 LT LI20_1) 24,18 14 + Ranks (LI20_4 GT LI20_1) 0 Ties (LI20_4 EQ LI20_1) -- 61 Total Z = -4,3599 2-Tailed P = ,0000Ties sind Bindungen und bedeuten Null-Differenzen ; diese kommen hier nicht vor, also ist und die Rangsummen sind , und es ist m(m+1)/2=1891 die Summe beider. Da die Rangsummen sehr verschieden sind, wird hier sehr groß, und es erscheint die "Signifikanz" Null. Also sind die Mittelwertunterschiede beider Messungen Li20 und Li20 wesentlich. (Sie waren 14,97 und 11,69. Wenn der Einfluß eines Medikamentes in der Zeit von 1 bis 4 getestet werden sollte, hat es also geholfen.)
3. ] Die Variable Li20 von rheuma.sav ist nicht normalverteilt. Prüfen Sie mit dem Rangtest von Mann-Whitney, ob sich Männer und Frauen (in der Population der ersten 30 Patienten) bezüglich Li20 unterscheiden. Die Antwort soll zu einem Signifikanzniveau =0.05 erfolgen.
Ähnlich wie bei Wilcoxon werden im Mann-Whitney Test wieder Ränge
verwendet (Voraussetzung: und ). Zwei
Stichproben eventuell unterschiedlicher Längen und werden
zusammen geordnet in aufsteigender Reihenfolge, und Ränge von 1 bis
vergeben. Die Rangsummen und werden dann
für die jeweiligen einzelnen Stichproben aufsummiert
Als Rechenkontrolle dient
.
Prüfgrößen sind
und
.
In die Test-Statistik geht ein das Minimum beider: U=min(,).
Es ist
und getestet wird wieder die Abweichung von 2U
gegen den Nullhypothesen-Wert :
Vor dem Test ist die spezielle Bedingung der Aufgabe zu beachten,
daß nur 30 Patienten aufgenommen werden sollen: Dies passiert
wieder in
Daten Fälle auswählen.
Man hat Falls Bedingung zutrifft anzuklicken, und kann dann
nach Anklicken des Bedingungs-Buttons diese in ein Fenster schreiben:
.
In Nichtparametrische Tests 2
unabh.Stichproben ist die Testvariable ins
Bearbeitungsfenster zu schieben. Weiterhin ist
die Gruppenvariable in ihr
Bearbeitungsfenster zu schieben und
Gruppe definieren anzuklicken und dann sind die
Gruppenwerte einzutragen (hier 1 und 2 für männlich und weiblich,
wie man der Datentabelle entnimmt. Der Test folgt der Syntax:
NPAR TESTS /M-W= li20_1 BY geschl(1 2) /MISSING LISTWISE.Er bringt das folgende Resultat hervor:
- - - - - Mann-Whitney U - Wilcoxon Rank Sum W Test LI20_1 LA-Kl. II-Ag, % positive Zellen by GESCHL Geschlecht Mean Rank Cases 9,00 6 GESCHL = 1 m"annlich 14,85 20 GESCHL = 2 weiblich -- 26 Total Exact Corrected for ties U W 2-Tailed P Z 2-Tailed P 33,0 54,0 ,1082 -1,6432 ,1003Im Mann-Whitney-Test für den Mittelwertvergleich von Li20 mit einer Teilung nach Geschlecht erhalten wir zwei mal eine 2-Tailed Sig(nifikanz): Eine "exact" und eine "corrected"; wobei die erstere nur für ausgegeben wird; und dann auch zu verwenden ist. Hier ist P über 10%, also kann die Nullhypothese (gleiche Mitterwerte beider Stichproben) nicht zurückgewiesen werden. Man beachte, daß die Mittelwerte selbst sehr verschieden sind: 11,74 für männlich und 15,09 für weiblich! Aber der kleine Umfang der ersteren Stichprobe macht wieder die Trennschärfe des Tests zunichte. Die Mittelwertunterschiede können noch zufällig sein.