Formeln zur linearen Regression:

Definiert man die Summe der Fehlerquadrate einer besten Funktion
$z=a+b\,s$ zu

\begin{displaymath}
Q(a,b) = \sum_{i=1}^n (z_i - a - b\ s_i )^2
\end{displaymath}

so ergeben sich als partielle Ableitungen nach den Parametern der Gerade die linearen Gleichungen:

\begin{displaymath}
\frac{\partial{Q(a,b)}}{\partial{b}} = 2 \ \sum_{i=1}^n (z_i - a - b\ s_i )
\ ( -s_i ) = 0 \ ,
\end{displaymath}

und

\begin{displaymath}
\frac{\partial{Q(a,b)}}{\partial{a}} = 2 \ \sum_{i=1}^n (z_i -a - b\ s_i )
\ (-1) = 0 \ .
\end{displaymath}

Die Lösung ist

\begin{displaymath}
b=\frac{\displaystyle{n \sum_{i=1}^n s_i z_i - \left( \sum_{...
...{i=1}^n s_i^2 \right) -
\left( \sum_{i=1}^n s_i \right)^2 }}
\end{displaymath}

und

\begin{displaymath}
a=\frac{\displaystyle{ \left( \sum_{i=1}^n s_i^2 \right) \le...
...{i=1}^n s_i^2 \right) -
\left( \sum_{i=1}^n s_i \right)^2 }}
\end{displaymath}

Aus den Formeln ergibt sich noch der Korrelationskoeffizient:

\begin{displaymath}
r_{sz} = \frac{\displaystyle{ n \left( \sum_{i=1}^n s_i \ z_...
...\right) -
\left( \sum_{i=1}^n z_i \right)^2 \right)^{1/2} }}
\end{displaymath}

und die minimale Fehlerquadratsumme:

\begin{displaymath}
Q(a,b)=\left( \left(\sum_{i=1}^n z_i^2 \right) -
\frac{1}{...
...i=1}^n z_i \right)^2 \right)
\ \left( 1 - r_{sz}^2 \right) .
\end{displaymath}

Mit den Mittelwerten

\begin{displaymath}\bar{s}= \frac{1}{n} \ (\sum_{i=1}^n s_i)\end{displaymath}

und

\begin{displaymath}\bar{z}= \frac{1}{n} \ (\sum_{i=1}^n z_i)\end{displaymath}

wird daraus kürzer:

\begin{displaymath}
b= \left( \sum s_i\ z_i - n \ \bar{s} \ \bar{z} \right) /
\left( \ (\sum s_i^2 \ ) \ - \ n \ \bar{s} ^2 \right)
\end{displaymath}


\begin{displaymath}
a= \left( \ ( \sum s_i^2 ) \ \bar{z} - ( \sum s_i \ z_i \ ) ...
...ght) /
\left( \ ( \sum s_i^2 ) \ - \ n \ \bar{s}^2 \ \right)
\end{displaymath}

und

\begin{displaymath}
r_{sz} = \left( \ \sum s_i \ z_i \ - \ n \ \bar{s} \ \bar{z}...
...bar{s} ) \
( \sum z_i^2 \ - \ n \ \bar{z} ) \ \right)^{1/2}
\end{displaymath}

sowie

\begin{displaymath}
Q(a,b)= \left( \ \sum z_i^2 \ - \ n \ \bar{z} ^2 \ \right) \
\left( 1 - r_{sz}^2 \right)
\end{displaymath}

Der Punkt $( \ \bar{s},\, \bar{z} \ )$ ist der Schnittpunkt der Regressionsgraden $z=a+b\,s$ mit der invertierten Graden $z= c+d\,s$, die aus $s=A+B\,z$ entsteht: $ (s - A ) / B = z $, also $ c= - A / B $ und $d= 1 / B $.

Im Beispiel ist

a= -19.05, b= 5.07, A= 4.10, B = 0.19, also $c=-21.57, $ und $d=5.25 $
mit $( \ \bar{s},\, \bar{z} \ )$ = ( 14.2, 53.0 ) . Der Winkel zwischen den Graden ist

\begin{displaymath}
tan \ \alpha = \frac{m_2-m_1}{1+m_1\ m_2}
\end{displaymath}

mit den Anstiegen der beiden Graden als $m_1= 5.07$, und $ m_2=5.25$ ergibt sich

\begin{displaymath}\alpha = 0.37^o \ .
\end{displaymath}



Dr.Wolfgang Quapp 2003-05-27