Dr.Quapp: Statistik für Mathematiker mit SPSS

Hinweise zur 14. Übung - KS-Test und MW-Vergleiche -

Die Aufgaben betreffen verschiedene Mittelwertvergleiche.
Bei abhängigen (gepaarten) Stichproben und
bei normalverteilten Merkmalen verwende man

$\rightarrow$ Mittelwertvergleiche $\rightarrow$ gepaarter T-Test
bei nicht normalverteilten Merkmalen verwende man
$\rightarrow$ Nichtparametrige Tests $\rightarrow$ Wilcoxon Test

Bei unabhängigen Stichproben und
bei normalverteilten Merkmalen verwende man

$\rightarrow$ Mittelwertvergleiche $\rightarrow$ T-Test für unabhängige Stichproben
bei nicht normalverteilten Merkmalen verwende man
$\rightarrow$ Nichtparametrige Tests $\rightarrow$ Mann-Whitney Test

1.] Laden Sie die Daten von Z:$\backslash$rheuma.sav. Überprüfen Sie mit dem KS-Test, ob Li20$_1$ und Li20$_4$ normalverteilt sind.
Überprüfen Sie ebenfalls mit dem KS-Test, ob Li20$_1$ für Männer und Frauen getrennt normalverteilt ist.
Anleitung: Daten zur Analyse aufteilen (GESCHL) - Test rechnen - Datenaufteilung rückgängig machen! (Dies nie vergessen!)

In $\rightarrow$Nichtparametrische Tests, $\rightarrow$ KS-Test ist bei $\rightarrow$ Optionen $\rightarrow$ Fallweiser Ausschluß anzuklicken. Damit soll gesichert werden, daß nicht Datenzeilen mit fehlenden einzelnen Werten den Test verfälschen und zwei gleich anzahlige Stichproben betrachtet werden.
Die SPSS-Syntax ist:

 NPAR TESTS
   /K-S(NORMAL)= li20_1 li20_4
   /MISSING LISTWISE.
Der KS-Test ergibt
- - - - - Kolmogorov - Smirnov Goodness of Fit Test
   LI20_1    LA-Kl. II-Ag, % positive Zellen
   Test distribution  -  Normal                    Mean:  14,966
                                     Standard Deviation:   8,424
            Cases:  61
            Most extreme differences
     Absolute       Positive       Negative        K-S Z      2-Tailed P
       ,15868         ,15868        -,12182       1,2393          ,0927

- - - - - Kolmogorov - Smirnov Goodness of Fit Test
   LI20_4    LA-Kl. II-Ag, % positive Zellen
   Test distribution  -  Normal                    Mean:  11,689
                                     Standard Deviation:   7,791
            Cases:  61
            Most extreme differences
     Absolute       Positive       Negative        K-S Z      2-Tailed P
       ,25867         ,25867        -,18604       2,0203          ,0006
Der KS-Test ergibt also die beiden Werte (für 2-Tailed P ) von 0,09 und 0,006. Man gehe somit davon aus, daß keine Normalverteilung vorliegt, da die Forderung aus der KS-Faustregel von 0.4, mindestens aber 0.2, weit unterschritten ist.

Zur Aufteilung der Analyse auf einzelne Merkmale wie Geschlecht muß dies in $\rightarrow$ Daten $\rightarrow$ Daten aufteilen organisiert werden. Die Syntax dazu ist:

 SORT CASES BY geschl .
 SPLIT FILE
   BY geschl .
Die Test wird dann nur noch einmal mit der bisherigen Belegung verwendet.
 NPAR TESTS
   /K-S(NORMAL)= li20_1
   /MISSING LISTWISE.
Da wir SPSS eine Datenaufteilung vorgeschrieben haben, wird der Test für jede Kategorie der Aufteilungsvariable Geschlecht einzeln gerechnet, hier also 2 mal.
GESCHL:         1   m"annlich
- - - - - Kolmogorov - Smirnov Goodness of Fit Test
   LI20_1    LA-Kl. II-Ag, % positive Zellen
   Test distribution  -  Normal                    Mean:  11,736
                                     Standard Deviation:   5,327
            Cases:  14
            Most extreme differences
     Absolute       Positive       Negative        K-S Z      2-Tailed P
       ,20922         ,20922        -,12877        ,7828          ,5723

GESCHL:         2   weiblich
- - - - - Kolmogorov - Smirnov Goodness of Fit Test
   LI20_1    LA-Kl. II-Ag, % positive Zellen
   Test distribution  -  Normal                    Mean:  15,091
                                     Standard Deviation:   8,542
            Cases:  58
            Most extreme differences
     Absolute       Positive       Negative        K-S Z      2-Tailed P
       ,16734         ,16734        -,13722       1,2744          ,0777
Das Resultat im 2.Fall ist das zu erwartende, die Verteilung der Untergruppe "weiblich" von Li20$_1$ kann nicht als normalverteilt angesehen werden; aber im 1.Fall stellt sich unerwarteter Weise ein 2-Tailed P-Wert von 0,57 ein: Hier ist die Null-Hypothese einer Normalverteilung also nicht zurückweisbar. Ursache ist die geringe Fallanzahl von 14 Fällen. Damit kann man noch keine gute Trennung von "gut" und "böse" vornehmen.
Nach dieser Operation muß die Aufteilung der $\rightarrow$ Daten nach Geschlecht rückgängig gemacht werden:
 SPLIT FILE OFF.

2.] Es soll nun geprüft werden, ob die Merkmale für Li20$_1$ und Li20$_4$ Mittelwertunterschiede aufweisen.
Anleitung: Zuerst ist zu konstatieren, daß die Merkmale nicht beide normalverteilt sind: Für den Test verwende man deshalb den Nichtparametrischen Test für 2 verbundene Stichproben nach Wilcoxon.

Die Aufteilung der $\rightarrow$ Daten nach Geschlecht in No1 muß rückgängig gemacht sein!
Der Wilcoxon-Test verwendet Ränge der Differenzen von 2 Variablen $x_i$ und $y_i$. Da die Stichproben verbundene Stichproben sind, ist die Anzahl $i=1,...,n$ von beiden gleich. Die Option $\rightarrow$ Fallweiser Ausschluß sichert, daß bei einzelnen fehlenden Werten auch der Partner-Wert nicht verwendet wird. Im Test ist $n>6$ vorausgesetzt. Die Differenzen

\begin{displaymath}d_i = x_i - y_i
\end{displaymath}

werden nach zunehmenden Beträgen sortiert, wobei die $d_i$=0 weggelassen werden: dann sind nur noch $m\le n$ Fälle übrig. Danach werden diese Ränge getrennt für positive und negative $d_i$ aufsummiert, was die beiden Rangsummen $R\_$ und $R_+$ ergibt. Als Rechenkontrolle dient $R\_ + R_+ = m(m+1)/2 $. Wenn die Nullhypothese gleicher Mittelwerte erfüllt ist, sollten beide Rangsummen etwa gleich sein. In die Test-Statistik geht ein das Minimum beider: R=min($R\_$,$R_+$). Getestet wird die Abweichung von 2R vom Nullhypothesen-Wert $m(m+1)/2$:

\begin{displaymath}
Z= \frac{2R -m(m+1)/2}{\sqrt{m(m+1)/2}\,\sqrt{(2m+1)/3}} \ \
{\rm\ gegen \ \ eine \ \ N(0,1)-Verteilung. }
\end{displaymath}

Wenn $\vert Z\vert$ den kritischen Wert der Normalverteilung übersteigt, je nach festgelegter $\alpha$-Grenze, ist die Null-Hypothese abzulehnen.

In $\rightarrow$ Nichtparametrische Tests $\rightarrow$ 2 verbundene Stichproben ist schon $\rightarrow$ Wilcoxon voreingestellt. In Option ist wieder $\rightarrow$ Fallweiser Ausschluß anzuklicken. Achtung: Damit wirklich gepaarte Variable verwendet werden, geht das Bewegen der Variablen in das Fenster zur Verarbeitung auch nur paarweise!

 NPAR TEST
   /WILCOXON=li20_1  WITH li20_4 (PAIRED)
   /MISSING LISTWISE.
Es ergibt sich folgendes Resultat:
- - - - - Wilcoxon Matched-Pairs Signed-Ranks Test
     LI20_1    LA-Kl. II-Ag, % positive Zellen
with LI20_4    LA-Kl. II-Ag, % positive Zellen
     Mean Rank    Cases
         33,03       47  - Ranks (LI20_4 LT LI20_1)
         24,18       14  + Ranks (LI20_4 GT LI20_1)
                      0    Ties  (LI20_4 EQ LI20_1)
                     --
                     61    Total
         Z =   -4,3599            2-Tailed P =  ,0000
Ties sind Bindungen und bedeuten Null-Differenzen $d_i=0$; diese kommen hier nicht vor, also ist $m=n$ und die Rangsummen sind $R\_ =1552,5$ $R_+ =338,4$, und es ist m(m+1)/2=1891 die Summe beider. Da die Rangsummen sehr verschieden sind, wird $\vert Z\vert$ hier sehr groß, und es erscheint die "Signifikanz" Null. Also sind die Mittelwertunterschiede beider Messungen Li20$_1$ und Li20$_4$ wesentlich. (Sie waren 14,97 und 11,69. Wenn der Einfluß eines Medikamentes in der Zeit von 1 bis 4 getestet werden sollte, hat es also geholfen.)

3. ] Die Variable Li20$_1$ von rheuma.sav ist nicht normalverteilt. Prüfen Sie mit dem Rangtest von Mann-Whitney, ob sich Männer und Frauen (in der Population der ersten 30 Patienten) bezüglich Li20$_1$ unterscheiden. Die Antwort soll zu einem Signifikanzniveau $\alpha$=0.05 erfolgen.

Ähnlich wie bei Wilcoxon werden im Mann-Whitney Test wieder Ränge verwendet (Voraussetzung: $n_1>4$ und $n_2>4$). Zwei Stichproben eventuell unterschiedlicher Längen $n_1$ und $n_2$ werden zusammen geordnet in aufsteigender Reihenfolge, und Ränge von 1 bis $n=n_1 + n_2$ vergeben. Die Rangsummen $R_1$ und $R_2$ werden dann für die jeweiligen einzelnen Stichproben aufsummiert Als Rechenkontrolle dient $R_1 + R_2 = n(n+1)/2 $. Prüfgrößen sind $U_1 = R_2 - n_2(n_2+1)/2 $ und $U_2 = R_1 - n_1(n_1+1)/2 $. In die Test-Statistik geht ein das Minimum beider: U=min($U_1$,$U_2$). Es ist $U_1+U_2=n_1\,n_2$ und getestet wird wieder die Abweichung von 2U gegen den Nullhypothesen-Wert $n_1\,n_2$:

\begin{displaymath}
Z= \frac{2\,U -n_1\,n_2}{\sqrt{n_1\,n_2\,(n_1+n_2+1)/{3}}} \ \
{\rm\ gegen \ \ eine \ \ N(0,1)-Verteilung. }
\end{displaymath}

Wenn $\vert Z\vert$ den kritischen Wert der Normalverteilung übersteigt, je nach festgelegter $\alpha$-Grenze, ist die Null-Hypothese abzulehnen.

Vor dem Test ist die spezielle Bedingung der Aufgabe zu beachten, daß nur 30 Patienten aufgenommen werden sollen: Dies passiert wieder in $\rightarrow$ Daten $\rightarrow$ Fälle auswählen. Man hat $\bullet$ Falls Bedingung zutrifft anzuklicken, und kann dann nach Anklicken des Bedingungs-Buttons diese in ein Fenster schreiben: $ pat<=30 $.
In $\rightarrow$ Nichtparametrische Tests $\rightarrow$ 2 unabh.Stichproben ist $\rightarrow$ die Testvariable ins Bearbeitungsfenster zu schieben. Weiterhin ist die $\rightarrow$ Gruppenvariable in ihr Bearbeitungsfenster zu schieben und $\rightarrow$ Gruppe definieren anzuklicken und dann sind die Gruppenwerte einzutragen (hier 1 und 2 für männlich und weiblich, wie man der Datentabelle entnimmt. Der Test folgt der Syntax:

 NPAR TESTS
   /M-W= li20_1  BY geschl(1 2)
   /MISSING LISTWISE.
Er bringt das folgende Resultat hervor:
- - - - - Mann-Whitney U - Wilcoxon Rank Sum W Test
     LI20_1    LA-Kl. II-Ag, % positive Zellen
  by GESCHL    Geschlecht
     Mean Rank    Cases
          9,00        6  GESCHL = 1  m"annlich
         14,85       20  GESCHL = 2  weiblich
                     --
                     26  Total
                               Exact          Corrected for ties
      U             W      2-Tailed P           Z      2-Tailed P
     33,0          54,0       ,1082         -1,6432       ,1003
Im Mann-Whitney-Test für den Mittelwertvergleich von Li20$_1$ mit einer Teilung nach Geschlecht erhalten wir zwei mal eine 2-Tailed Sig(nifikanz): Eine "exact" und eine "corrected"; wobei die erstere nur für $n<30$ ausgegeben wird; und dann auch zu verwenden ist. Hier ist P über 10%, also kann die Nullhypothese (gleiche Mitterwerte beider Stichproben) nicht zurückgewiesen werden. Man beachte, daß die Mittelwerte selbst sehr verschieden sind: 11,74 für männlich und 15,09 für weiblich! Aber der kleine Umfang der ersteren Stichprobe macht wieder die Trennschärfe des Tests zunichte. Die Mittelwertunterschiede können noch zufällig sein.

Dr.Wolfgang Quapp 2005-01-25