User Tools

Site Tools


statistik

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

statistik [2014/03/08 17:12]
statistik [2019/02/23 16:34] (current)
Line 1: Line 1:
 +====== Statistik ======
 +
 +Gerade wenn es um die Beurteilung von Messwerten geht, kommen immer mal wieder verschiedene statistische Methoden zum Vorschein. Ich sammle hier in vielleicht etwas ungeordnete Weise Punkte, die an verschiedenen Stellen auf meiner Webseite relevant sind.
 +
 +===== Mittelwert und Standardabweichung =====
 +
 +Für eine Gruppe von $N$ Werten $w_i$ kann man immer einen **Mittelwert** $\overline w$ und eine **Standardabweichung** $\sigma$ angeben:
 +\[
 +\begin{align}
 +\overline w &= \frac{1}{N}\sum\limits_i^N w_i
 +\\
 +\sigma_N &= \sqrt{\frac{1}{N}\sum\limits_i^N \left(w_i - \overline w\right)^2}
 +\end{align}
 +\]
 +
 +Der Mittelwert ist so definiert, dass der mittlere quadratische Abstand der einzelnen Werte $w_i$ zum Mittelwert $\overline w$ minimal wird(( $\sum_i(w_i-\overline w)^2=$ minimal $\Rightarrow \frac{\mathrm{d}}{\mathrm{d}\overline w}\sum_i (w_i-\overline w)^2=0$ $\Rightarrow \sum_i 2(w_i-\overline w)(-1)=0$ $\Rightarrow -(\sum_i 2w_i) + 2N\overline w = 0$ $\Rightarrow \overline w = \frac{1}{N}\sum_i w_i$)). Die Standardabweichung gibt den quadratisch gemittelten Abstand der Einzelwerte $w_i$ zum Mittelwert $\overline w$ an.
 +
 +Bei der Standardabweichung gibt es verschiedene Varianten, diese zu berechnen, abhängig davon, welche Abweichung von welchem Wert man bestimmen will.
 +  * $\sigma_N=\sqrt{\frac{1}{N}\sum\limits_i^N \left(w_i - \overline w\right)^2}$\\ Standardabweichung der Einzelwerte - gibt an, wie stark die einzelnen Messwerte streuen. Verdoppelt man die Anzahl der Werte ändert sich die Standardabweichung nicht.\\ Beispiel: $\sigma_N\{1,​2,​3,​4,​5,​6\}=1,​708$,​ $\sigma_N\{1,​2,​3,​4,​5,​6,​1,​2,​3,​4,​5,​6\}=1,​708$,​ EXCEL: STABW.N
 +  * $\sigma_{N-1}=\sqrt{\frac{1}{N-1}\sum\limits_i^N \left(w_i - \overline w\right)^2} = \sqrt{\frac{N}{N-1}}\sigma_N>​\sigma_N$\\ Standardabweichung der Gruppe (Stichprobe). Diese Standardabweichung ist um einen "​Sicherheitsfaktor"​ größer als die Standardabweichung der Einzelwerte,​ da wegen der begrenzten Anzahl der Messwerte $N$ die tatsächliche Streuung nicht ermittelt werden kann. Diese Standardabweichung wird kleiner, je mehr Werte in der Gruppe enthalten sind. Wenn $N$ sehr groß wird, unterscheiden sich $\sigma_N$ und $\sigma_{N-1}$ kaum noch, die Stichprobe geht in eine Grundgesamtheit über. Das $N-1$ kann auch so interpretiert werden, dass ein Freiheitsgrad bereits für die Bildung des Mittelwerts aufgebraucht ist.
 +  * $\sigma_{N-2}=\sqrt{\frac{1}{N-2}\sum\limits_i^N \left(w_i - \overline w\right)^2}$\\ Analog, wenn beriets zwei Freiheitsgrade aufgebraucht sind, beispielsweise wenn die Streuung nicht in Bezug auf einen Mittelwert, sondern auf eine Gerade berechnet wird.\\ Beispiel: $\sigma_{N-1}\{1,​2,​3,​4,​5,​6\}=1,​871$,​ $\sigma_{N-1}\{1,​2,​3,​4,​5,​6,​1,​2,​3,​4,​5,​6\}=1,​784$,​ EXCEL: STABW.S
 +
 +Die **Standardabweichung des Mittelwerts**,​ auch mittlerer quadratischer Fehler genannt,
 +\[
 +  \sigma_\mathrm{MW} = \frac{\sigma}{\sqrt{N}}
 +\]
 +gibt an wie sich die statistische Streuung der Messwerte als Fehler auf den Mittelwert auswirkt. Die Standardabweichung des Mittelwerts ist deutlich kleiner als die Standardabweichung der Einzelwerte,​ da sich durch Mittelung über viele Messungen die Unsicherheit verringert.
 +
 +
 +===== Bionomialverteilung =====
 +
 +Die Binomialverteilung beschreibt die Wahrscheinlichkeitsverteilung bei Experimente,​ bei denen es genau zwei Ergebnisse gibt ("​bi"​). Das Ergebnis A tritt mit der Wahrscheinlichkeit $p$ ein, das Ereignis B demzufolge mit der Wahrscheinlichkeit $1-p$. ​
 +
 +Die Wahrscheinlichkeit bei $N$ Versuchen genau $a$ mal das Ereignis A zu erhalten und $N-a$ mal das Ereignis B beträgt:
 +\[
 +  p(a|N,p) = \binom{N}{a} p^a(1-p)^{N-a}
 +\]
 +Der Binomialkoeffizient $\binom{N}{a}=\frac{N!}{a!(N-a)!}$ gibt an, auf wie viele Arten man $a$ aus $N$ auswählen kann. Die Binomialkoeffizienten kann man auch aus dem [[wpde>​Pascalsches_Dreieck|Pascalschen Dreieck]] ablesen.
 +
 +===== Normalverteilung =====
 +
 +Wenn Werte um einen Mittelwert $\overline w$ mit der Streuung $\sigma$ normalverteilt sind, ist die Wahrscheinlichkeit einen Wert $w_i$ zu erhalten:
 +\[
 +  p(w_i) = \frac{1}{\sqrt{2\pi\sigma^2}}\mathrm{e}^{-\frac{(w_i-\overline w)^2}{2\sigma^2}}
 +\]
 +
 +==== Mittelwert und Standardabweichung ====
 +