Dr.Quapp: Statistik für Mathematiker mit SPSS

Hinweise zur 6. Übung - Spezielle Verteilungen

1.] a) Erzeugen Sie (je 200 Zeilen) von 10 Zufallsgrößen $X_i \sim N(0,1)$ mit i=1,...,10; und bilden Sie damit die neue Zufallsgröße

\begin{displaymath}
Y= \sum_{i=1}^{10} X_i^2  .
\end{displaymath}

b) Erzeugen Sie eine weitere Zufallsvariable $W$ (ebenfalls 200 Ausprägungen) nach der $\chi^2$-Verteilung mit 10 Freiheitsgraden.
Hinweis: nutzen Sie RV.CHISQ(10), und vergleichen Sie $Y$ und $W$ !
c) Erzeugen Sie zu einer Achsenvariablen $ A \in [0,30]$ die Werte der theoretischen Verteilungsfunktion der $\chi^2$-Verteilung mit 10 Freiheitsgraden $Wchi$ sowie die Werte der Dichtefunktion $Dchi$.
d) Bestimmen Sie Schiefe und Wölbung von $Dchi$! Hinweis: Die Achsenvariable ist unter Verwendung der Dichte clever zu wichten!

Die Verteilung von $Y$ entspricht der $\chi^2$-Verteilung mit 10 Freiheitsgraden. Verwendung findet diese in der Testtheorie.
zu a) Erzeugt werden kann die Reihe von Zufallsvariablen mit der Befehlsfolge:

DO REPEAT p=x1 to x10 .
COMPUTE p= RV.Normal(0,1) .
END REPEAT .
COMPUTE Y=0 .
DO REPEAT p=x1 to x10 .
COMPUTE Y=Y+p**2 .
END REPEAT .
EXECUTE .

zu c) Die Werte ergeben sich aus Wchi=CDF.CHISQ(a,10) im Fenster -$>$Berechnen. Die Ableitung davon, bzw.die Differenzenquotienten mit der Achseneinteilung von 1 sind dann Dchi=Wchi-LAG(Wchi) .
zu d) Da nur ein funktionaler Zusammenhang zwischen $A$ und $Dchi$ gegeben ist, aber keine zufällige Verteilung mit Häufigkeiten, so muß diese erst hergestellt werden. Der Trick ist, $Dchi$ als Gewichtsvariable für $A$ zu verwenden. Da aber Gewichte $>1$ sein sollten, kann man etwa $Gew=Dchi*3000$ verwenden. Es ergibt sich
EA=10.48, $\sigma$=4.44, Schiefe=0.82, Excess=-0.79.
Also ist die Dichte rechtsschief, und stumpfer als die Dichte der Normalverteilung mit gleichen Parametern. In einem Streuplot kann man beide Dichten noch vergleichen.

2.a) Ausgehed von 50, 100 oder 200 Ausprägungen von zwei Zufallsvariablen $X, Y$ mit Normalverteilung $RV.NORMAL(0,\sigma )$, z.B. $ \sigma _x= 3/2$, $ \sigma _y= 1$ berechnen Sie die neue Zufallsvariable

\begin{displaymath}
Z = a + \frac{X}{Y}  ,
\end{displaymath}

z.B. mit $a=2$.
b) Bestimmen Sie Mittelwert und Median von $Z$ ! Kann man $a$ rückwärts aus statistischen Kenngrößen von $Z$ bestimmen?
c) Vergleichen Sie damit eine Zufallsvariable $W \sim
RV.CAUCHY(a,\sigma)$. Was ist der Erwartungswert $E W$ ?
d) Stellen Sie einen Zusammenhang her zur HCN-Aufgabe 4.2 !

zu b) Es zeigt sich, daß der Mittelwert(Z) zufällig ausfällt, während der Median stabil um den approximativen Wert von $a=2$ schwankt. Also sollte man für eine Schätzung von $a$ nicht den Mittelwert von $Z$ verwenden.

zu c) Es gilt allgemein, wenn $X, Y$ Zufallsvariablen sind mit den Dichten $g(x)$ und $f(y)$, dann ist die Dichte der Zufallsvariablen $Z$ mit
$\bullet$ $Z=X+Y$ die Faltung $h(z)=\int_{-\infty}^{\infty} g(x)f(z-x)\vert 1\vert dx$
$\bullet$ $Z=X \cdot Y$ die Funktion $h(z)=\int_{-\infty}^{\infty} g(x)f(\displaystyle\frac{z}{x})
\vert\displaystyle\frac{1}{x}\vert dx$
$\bullet$ $Z=\displaystyle\frac{X}{Y}$ die Funktion $h(z)=\int_{-\infty}^{\infty} g(y z)f(y)\vert y\vert dy$.
Man kann sehen, wie die Formel arbeitet: $y=z-x$ im ersten Fall, $y=z/x$ im 2.Fall, und $x=y z$ im letzten Fall werden eingesetzt, und noch die Funktionaldeterminante der Transformation verwendet, siehe M.Fisz, Wahrscheinlichkeitsrechnung und Mathematische Statistik, 1966.

Hier ist für $Z=\displaystyle\frac{X}{Y}$ speziell

\begin{displaymath}
h(z)=\int_{-\infty}^{\infty} \frac{1}{2\pi\sigma_x\sigma_y}
...
... z)^2/2\sigma_x^2}
 e^{-(y)^2/2\sigma_y^2} \vert y\vert dy
\end{displaymath}


\begin{displaymath}
= \frac{1}{2\pi\sigma_x\sigma_y} 2 \int_{0}^{\infty}
e^{-y^2/2 (z^2/\sigma_x^2 + 1/\sigma_y^2)} y dy
\end{displaymath}

und der Integrant ist genau eine Ableitung nach $y$, also wird:

\begin{displaymath}
= \frac{1}{\pi\sigma_x \sigma_y} \frac{1}{(z^2/\sigma_x^2 +...
...}{\pi} \frac{\sigma_x/\sigma_y}{z^2 + (\sigma_x/\sigma_y)^2}
\end{displaymath}

setzt man W=a+Z, wie in der Aufgabe, dann ist

\begin{displaymath}
h(w)= \frac{1}{\pi}\frac{b}{(w-a)^2 +b^2}
\end{displaymath}

mit $b=\sigma_x/\sigma_y$.
Eine kleine Rechnung zeigt, daß das Integral für $E W$ nicht existiert.

zu d) Die Lorenzfunktion für eine Linie in Aufgabe 4.2 ist nach Normierung äquivalent zur mathematischen Dichte der Cauchy-Verteilung:

\begin{displaymath}
f(x) = \frac{1}{\pi } \frac{b}{b^2+(x-a)^2}
\end{displaymath}

mit den Parametern $a$ für die Mittel-Lage, und $b>0$ für die "Breite". Die zugehörige Verteilungsfunktion ist

\begin{displaymath}
F(x)= \frac{1}{2} + \frac{1}{\pi }  arctan( \frac{x-a}{b} )  .
\end{displaymath}

Ist $X$ normalverteilt mit $RV.NORMAL(0,\sigma )$, und $Y$ normalverteilt mit $RV.NORMAL(0,1 )$, so ist dann $Z$ Cauchy-verteilt mit den Parametern a und $b=\sigma $.




Quapp 2007-11-16