4.2 Varianz und Standardabweichung

Es ist nun zu verstehen, dass ein einzelner Messwert nicht zur Beschreibung einer Größe (Länge, Kraft, Wahrscheinlichkeit ...) geeignet ist. Auch ein Mittelwert M vermittelt nur dann eine Vorstellung von einer Größe, wenn  neben ihm noch eine Angabe über den möglichen zufälligen Fehler gemacht wird.

Wie soll dies geschehen ?

Vielleicht kommen wir weiter, wenn wir uns an einem Messbeispiel ein Bild über die Häufigkeit bestimmter Fehler machen. Das folgende Experiment ist zu diesem Zweck empfehlenswert (siehe Abb. 1).

Abb. 1

Abb. 2

Ein 2000 Hz - Ton wird mit einem Mikrofon aufgenommen und nach Verstärkung des Signals auf ±1,5V mit Hilfe Rechners mit AD-Wandler (CASSY - E) registriert. Durch eine gegen das Messsignal wirkende konstante Gegenspannung erreicht man, dass die positiven Halbwellen nicht über 0,5 V hinausgehen (siehe Abb.2 ). So können die Höhen der Spannungsspitzen in den empfindlichen Messbereichen ±1V und ± 0,3 Volt gemessen werden, in denen die Schwankungen des Messsignals gut erkennbar sind. Je Sekunde werden 2000 Spannungsspitzen ausgemessen. Der Messbereich wird vom Rechner in 256 gleich große Intervalle aufgeteilt. Über jedem Intervall errichtet der Rechner auf seinem Bildschirm eine senkrechte Strecke, deren Länge proportional zur Zahl der Messwerte ist, die je Sekunde in dieses Intervall fallen (Zahl aller Messwerte im Intervall / Zeit der Messwertaufnahme).

In den Abb. 3 und 4 sind Ergebnisse dargestellt, die im Messbereich ±1V aufgenommen wurden. Deutlich ist zu sehen, wie die Diagramme mit zunehmender Anzahl von Messungen mehr und mehr eine Glockenform annehmen.

Abb. 3



Abb. 4

Eine mathematische Untersuchung soll nun an dem Diagramm in Abb. 5 durchgeführt werden. Diese Verteilungskurve zu 1000000 Messungen, welche die Spitzen der erwähnten, nicht mehr dargestellten senkrechten Strecken verbindet, wurde mit der Gegenspannung -1,374V in dem Messbereich ±0,3V aufgenommen. Die Kurve sieht so aus, als ob die Zahl der Messwerte f(x) in einem Intervall um einen Messwert x mit einer Exponentialfunktion f(x) = A·e-b·(x-W)^2 beschrieben werden könne. (x-W)^2 steht für (x-W)2. W ist der wahre Wert 0,126 V und (x-W) ist der Fehler f des Messwerts, seine Abweichung von W.


Abb. 5

Mit „Mathe.-Physik“ kann der Verteilungskurve ein Graf mit f(x) = 21,7 · e[-280·(x-0,126)^2] angepasst werden (siehe Abb. 6). Ein Term der Form A·e-b·f^2 beschreibt demnach die Zahl der Messwerte in dem Intervall des Fehlers f.

Es wird davon ausgegangen, dass eine exponentiellen Fehlerverteilung nach A·e-b·f^2 für jede Art von Messung gilt, weshalb es sinnvoll erscheint, an ihr ein geeignetes Maß für deren Ungenauigkeit zu suchen.

Abb. 6



Der neben dem quadratischen Term (x-0,126)2 = f2 stehende Faktor ist für die Breite der Glockenkurve maßgebend. Er ändert sich nicht, wenn der Messbereich feiner aufgeteilt wird, wenn z.B. statt 256 Intervallen 512 Intervalle gewählt werden, nur A würde in diesem Fall halbiert. Es liegt nahe, diesen Faktor als Maß für die Ungenauigkeit der Messwerte zu nehmen. Da diese Größe aber nicht veranschaulicht werden kann, sollte man einen anderen die Glockenkurve kennzeichnenden Wert suchen, welcher diesen Nachteil nicht hat. In Frage kommt der Abstand σ eines Wendepunkts vom wahren Wert W.

Wendepunkt: Übergang von einer Rechtskurve in eine Linkskurve bzw. einer Linkskurve in eine Rechtskurve. Die 1. Ableitung von f(x) hat an einem Wendepunkt ein Extremum.

Durch σ ist auch der Wert b genau bestimmt.

Es gilt: 1 = 2· b ·σ2 b = 1 / (σ2 ·2)

A·e-b·f^2 = A·e- 0,5 · f^2 /σ^2 = A·e- 0,5 · (f/ σ)^2

f/σ heißt standardisierter Zufallsfehler fs.


A·e-b·f^2 = A·e- 0,5 · (f/ σ)^2 = A·e- 0,5 · fs^2


σ kann nur dann als sinnvolles Maß für die Genauigkeit der Messwerte eingeführt werden, wenn mit einer zumutbaren Zahl von Messwerten ohne großen mathematischen Aufwand auf σ geschlossen werden kann. Dies ist möglich, denn es kann bewiesen werden, dass σ2 gleich dem Mittelwert aus den Quadraten der Fehler f ist.

σ2 = Mittelwert der f2

Bei den nachfolgenden Untersuchungen werden derart kleine Fehlerintervalle vorausgesetzt, dass die Differenzen zwischen den Fehlern eines Intervalls vernachlässigbar sind. Für die Summer S aller f2 innerhalb eines Intervalls um f können wir deshalb schreiben: S = f2·A·e-b·f^2 . Zur Bestimmung des Mittelwerts von f2 ist die Summe aller Produkte f2·A·e-b·f^2 durch die Zahl N aller Messwerte zu teilen. A·e-b·f^2 Messwerte gehören zu einem Intervall. N = ΣA·e-b·f^2 ist die Summe aller A·e-b·f^2 .

Mittelwert aus f2 = Σf2·A·e-b·f^2 / ΣA·e-b·f^2 = Σf2·e-b·f^2 / Σe-b·f^2 = (1/b) ·Σb·f2·e-b·f^2 / Σe-b·f^2

Zur Berechnung des Quotienten kann man sich wegen der Symmetrie der Glockenkurve auf die positiven Fehler beschränken. Für f·(b) schreiben wir z.

Mittelwert aus f2 = (1/b) · Σz2·e-z^2 / Σe-z^2

Σz2·e-z^2 / Σe-z^2 ist bei sehr schmalen Intervallen unabhängig von der Breite der gewählten Intervalle gleich 1/2.

Somit gilt: Mittelwert aus f2 = 1/(2·b) = σ2

Der Mittelwert von f2 = σ2 heißt Varianz und σ, die Wurzel aus diesem Mittelwert, trägt den Namen Standardabweichung.



Die Berechnung von Σz2·e-z^2 / Σe-z^2 mit Mathe.-Physik geschieht wie folgt:

Der Wertebereich von z zwischen 0 und 5 wird in Intervalle der Breite 0,0005 geteilt und dementsprechend im Tabellenfenster eine Spalte mit den Werten 0,0005; 0,001; 0,0015 …. 5 angelegt. Diese Spalte wird zunächst mit S+a^2·exp(-a^2) und dann mit S+exp(-a^2) ausgewertet (a = z). S muss anfangs im Variablenfeld auf 0 gesetzt werden !


Σz2·e-z^2 / Σe-z^2 = (letzter Wert der 2. Spalte) / (letzter Wert der 3. Spalte) = 0,5


Eine Beschränkung auf den Bereich 0 bis 5 ist angebracht, da eine Bereichserweiterung zu keiner nennenswerten Änderung des oben genannten Quotienten führt.

Die Tabellenspalte 0,0005; 0,001; 0,0015 …. 5 wird wie folgt angelegt: Nach Wahl von Tabelle bearbeiten_Anlegen einer Tabelle_Von der Einfügemarke an wird eine neue Tabelle mit Trennungsstrichen vorbereitet“ werden 10000 Zeilen mit einem Trennungsstrich versehen. Hiernach kann mit dem Term S+1/2000 die gewünschte Tabellenspalte erzeugt werden.



Wie groß ist die Wahrscheinlichkeit P(|f|F) für einen Fehler f, dessen Betrag nicht größer ist als ein bestimmter Wert F z.B. F = σ ?

Die Wahrscheinlichkeit p, mit der ein Messwert mit einem Fehler f aus einem bestimmten Intervall behaftet ist, erhält man, indem man die Zahl der zu diesem Intervall gehörenden Messwerte durch die Zahl aller Messwerte teilt.

p = A · e-(1/2)· fs^2 / ΣA · e-(1/2)· fs^2 = e-(1/2)· fs^2 / Σe-(1/2)· (fs)^2

p = e-(1/2)· fs^2 / Σe-(1/2)· fs^2

Zur Berechnung von P(|f| F) = P(|fs| ≤ F/σ) muss die Summe der zu den Intervallen mit |fs| ≤ F/ σ gehörenden Werte e-(1/2)· fs^2 durch Σe-(1/2)· fs^2 geteilt werden. Hierbei kann man sich wieder auf die positiven fs beschränken.



Ergebnis:

Bei sehr vielen Messwerten fallen 68% der Werte in den Bereich W± σ. Das heißt ein Messwert M hat mit der Wahrscheinlichkeit 0,68 einen Fehler f mit einem Betrag ≤ σ. 95% aller Messwerte fallen in den Bereich W± 1,96· σ. Dies gilt allgemein bei einer Fehlerverteilung nach f(fs) = A · e-(1/2)· fs^2 .

Die Berechnung mit Mathe.-Physik geschieht wie folgt:

Die fs -Werte im Bereich von 0 bis 5 – außerhalb dieses Bereichs liegen fast keine fs- werden Intervallen der Breite 0,01 zugeordnet. Dementsprechend wird im Tabellenfenster eine Spalte mit den Werten 0,01; 0,02; 0,03 …. 5 angelegt (siehe Abb.7). Diese Spalte wird zunächst mit S+exp(0,5*a^2) ausgewertet ( a steht für fs). S muss anfangs auf 0 gesetzt werden !

Hierbei entsteht eine Spalte mit Werten b; sie endet mit der Summe 124,83. Anschließend erfolgt eine Auswertung der 2. Spalte mit b/124,83 = P(|f| a).

In der dritten Spalte kann man die zu den verschiedenen a = F/σ gehörenden Wahrscheinlichkeiten ablesen. So ist an der Abb.2 zu erkennen, dass Fehler mit |fs|0,08 mit der Wahrscheinlichkeit 0,064 und solche mit |fs| 1 |f|/σ1 |f|≤ σ mit der Wahrscheinlichkeit 0,68 auftreten.





Abb.7



Der mittlere Fehler des Mittelwerts

Eine Größe wird normalerweise mit einem Mittelwert aus mehreren Einzelwerten beschrieben. Da die Mittelwerte weniger schwanken als die Einzelwerte, ist die Standardabweichung σM der Mittelwerte das angemessene Fehlermaß.

Die Varianz σM2 der Mittelwerte nimmt mit der Zahl n der Werte ab, die zur Bildung des Mittelwerts genommen werden.

Vermutung: σM2 = σ2/n

n ist die Zahl der Messwerte, aus denen ein Mittelwert gebildet wird, σ2 ist die Varianz der Einzelwerte

Beweis:

Werden n Werte mit den Fehlern f1 , f2........fn gemittelt, dann ist das zum Mittelwert gehörende Fehlerquadrat = [(f1+f2......+fn)/ n]2.

[(f1+f2......+fn)/ n]2 = [f12 + f22 + f32 ….+ fn2 + 2·(f1·f2 + f1·f3 + f1·f4 ..+ f2·f3 + f2·f4 + f2·f5 …..)]/ n2

Bei der Mittelwertbildung heben sich die Produkte aus verschiedenen Fehlern gegenseitig auf, da z.B. das Produkt f1·f2 ebenso wahrscheinlich ist wie das Produkt f1·(-f2). Deshalb stimmen die Mittelwert von [(f1+f2......+fn)/ n]2 und (f12 + f22 + f32.+ fn2) / n2 überein.

Mittelwert von (f12 + f22 + f32.+ fn2) / n2 = (σ12 + σ22 + σ32.....+ σn2)/ n2

  σ1 = σ2 = σ3.....= σn = σ

Mittelwert von (f12 + f22 + f32.+ fn2) / n2 = σM2 = n·σ2/n2 = σ2/n


In der Regel ist der „wahre Wert“ nicht bekannt.  Wie soll  σ  in einem solchen Fall bestimmt werden ?

Der Mittelwert  aus vielen Messwerten wird statt des „wahren Wertes“ zur Berechnung der quadratischen Abweichungen genommen. Je mehr Einzelwerte verwertet werden, desto geringer ist der Unterschied zwischen den Abweichungen vom wahren Wert und den Abweichungen vom Mittelwert. Die Differenz zwischen der Varianz σ2 in Bezug auf den wahren Wert und der Varianz σ'2 in Bezug auf den Mittelwert nimmt mit steigender Varianz σMdes Mittelwerts zu.

Vermutung: σ2 - σ'2 = σM

Aus dieser Vermutung, die noch zu beweisen ist, können wichtige Schlüsse gezogen werden:

σ2 = σ'2 + σM2  →    σ2 = σ'2 + σ2 / n   →    σ2 · (1 – 1/n) = σ'2   →    σ2 = σ'2 · [n / (n-1)]

σ'2 = (f12 + f22 + f32...... + fn2 )/n

σ2 = σ'2 · [n / (n-1)] = (f12 + f22 + f32...... + fn2 )/(n-1)

Für die Varianz σM2 des Mittelwerts von Messwerten gilt somit:

σM2 = (f12 + f22 + f32...... + fn2 )/[(n-1) · n ]

σM = {(f12 + f22 + f32...... + fn2 )/[(n-1) · n ]}

Ein Messergebnis wird in der Form „Mittelwert ± σMangegeben. σM heißt auch mittlerer Fehler des Mittelwerts


Beweis der Vermutung σ2 - σ'2 = σM2 :

f ist die Abweichung eines Messwertes vom wahren Wert und f' ist die Abweichung von einem aus n Messwerten gebildeten Mittelwert.

Es gilt: f = f' + d ; d : Differenz zwischen dem Mittelwert und dem wahren Wert

f2 = f '2 + 2·d·f' + d2

Für alle n Messwerte mit den Fehlern f1, f2 ,f3 gilt somit:

f12 +f22 +f32 +f42….= f '12 +f '22 +f '32 +f '42 +... 2·d·( f '1 +f '2 +f '3 +f '4......) + n·d2

( f '1 +f '2 +f '3 +f '4......) = 0

(f12 +f22 +f32 +f42…)/n = (f '12 +f '22 +f '32 +f '42 +... )/n + d2    →    σ2 = σ'2 + d2

Es werden nun m derartige Mittelwerte gebildet. Sie haben die Abweichungen d1 , d2 , d3 …... vom wahren Wert.

σ12 = σ'12 + d12,   σ22 = σ'22 + d22,   σ32 = σ'32 + d32........

(σ12 + σ22+ σ32 +.....)/ m = ( σ'12 + σ'2 + σ'32 + …...)/m + (d12 + d22 + d32 + …..)/m

(d12 + d22 + d32 + …..)/m = σM2

Werden viele Werte zur Bildung der Mittelwerte genommen, dann weichen die σ12 , σ22 , σ32 ... und die σ'12, σ'22 , σ'32 … kaum voneinander ab.

σ12 = σ22 = σ32 = σ2 , σ'12 = σ'22 = σ'32 = σ'2

Somit können wir schreiben: σ2 = σ'2 + σM2