Binomialverteilung (m|k)·pk ·(1- p)(m-k)



Aus einem Beutel mit 30 weißen und 70 roten Würfeln wird ein Würfel gegriffen und nach Notieren der gezogenen Farbe mit r oder w wieder zurückgelegt. Dies geschieht 10 mal hintereinander. Als Ergebnis dieses Vorgangs liegt dann eine Reihe wie z.B. r r w r w w r r r w vor.

Es stellt sich die Frage: Wie groß ist die Wahrscheinlichkeit, dass wie in diesem Fall 4 weiße und 6 rote Würfel aus dem Beutel gezogen werden ?

Die Wahrscheinlichkeit für das Ziehen eines weißen Würfels ist p = 3/10, die Gegenwahrscheinlichkeit q = 1-p zum roten Würfel ist 7/10 .

Die Wahrscheinlichkeit, dass sich eine Reihenfolge wie „r r w r w w r r r“ einstellt ist p4 · q6 . Die Wahrscheinlichkeit, dass genau 4 weiße und 6 rote Würfel gezogen werden, ist erheblich größer, da verschiedene Reihenfolgen von 4 weißen und 6 roten Würfeln möglich sind.

Wie viele Reihenfolgen j gibt es ?

Es ist oft hilfreich, zunächst eine eine ähnliche aber leichtere Aufgabe zu lösen.  Statt der gegebenen Reihenfolge aus w und r wird die Reihenfolge a, b, c , d , e , f, g , h , i , j gewählt. Die Zahl der möglichen Anordnungen kann in diesem Fall schnell gefunden werden. Wir beschränken uns zunächst auf die zwei Buchstaben a und b. Es gibt die beiden Anordnungen a, b und b, a.  Bei drei Buchstaben a, b , c  kann man die möglichen Anordnungen gliedern in 2 mit a, 2 mit b und 2 mit c am Anfang.  Es sind insgesamt 2·3 = 6 Möglichkeiten.   Zum Verständnis dieser Angabe sei darauf hingewiesen, dass wir die Zahl der Anordnungen mit a am Anfang dadurch erhalten, indem wir von den anderen Buchstaben alle möglichen Anordnungen bilden und jeweils ein a davor setzen.  Nach Einteilung der Anordnungen von vier Buchstaben a, b, c, d nach deren Anfangsbuchstaben fallen vier Gruppen mit je 2·3 = 6 verschiedenen Folgen an.  Es sind insgesamt 2·3·4 = 24 Möglichkeiten.

Für n verschiedene Buchstaben gibt es 1·2·3·4.......· n Möglichkeiten.

Für das Produkt 1·2·3·4.......· n aus den ganzen Zahlen von 1 bis n schreiben wir n! (sprich n Fakultät).

Fakultät = Möglichkeit !

Wir wenden uns nun wieder der Reihenfolge aus den Buchstaben r und w und zu. Wenn wir die Buchstaben w und r durch Anhängen von Zahlen unterscheidbar machen, dann können wir durch Vertauschen der Buchstaben w und r aus jeder der aus 4 w und 6 r gebildeten Anordnungen 4! · 6! verschiedenen Reihenfolgen erzeugen und erhalten somit die Gesamtheit aller möglichen Anordnungen aus 10 verschiedenen Zeichen.

Demnach gilt: j · 4! · 6! = 10! → j = 10! / (4! · 6!) = 10! / (4! · (10 - 4)!).

Für die Wahrscheinlichkeit 4 weiße und 6 = 10 - 4 rote Würfel zu ziehen gilt:

w = [10! / (4! · (10 – 4)!)] · p4 · q6 = [10! / (4! · (10 – 4 )!)] · p4 · (1- p)6 , p = 3/10

Bei m Buchstaben mit k Buchstaben w erhält man entsprechend: w = [m! / [k! · (m - k)!]) ] · pk · (1 - p)(m-k).

p ist die Wahrscheinlichkeit dafür, dass ein weißer Würfel gezogen wird.

Für (m! / [k! · (m - k)!]) wird geschrieben.

Sprich k aus m oder m über k !

In diesem Artikel steht (m|k) für .


Beispiel: m =14, p = 0,5

Zugehörendes Programm: y=m! / (k!*(m-k)!)*0,5^m; x=k; k=k+1; l=x

Abb. 1

In der Abb. 2 ist dem die Binomialverteilung anzeigenden Diagramm der Graph (rot) der Funktion y=0,21*e-0,135*(x-m/2)^2 angepasst. Dies geschah mit dem Programm: x=x+0,01; k=int(x); u=k; v=14!/(k!*(14-k)!)*0,5^14; y=0,21*exp(-0,135*(x-7)^2); l=x

Abb.2

Besteht eine Abhängigkeit zwischen dem Faktor vor der Exponentialfunktion und dem Faktor vor dem Exponenten x^2 ?

Ist im Fall y=a*exp(-b*(x-c)^2) der Wert b anhand des Faktors a bestimmbar ?

Der Flächeninhalt unter dem Graphen der Exponentialfunktion gleicht dem Flächeninhalt aller in der Abb. 2 sichtbaren Rechtecke. Der Flächeninhalt eines solchen Rechtecks über x = k ist nach der Größe gleich der Wahrscheinlichkeit des zu k gehörenden Ereignisses. Da die Summe aller Wahrscheinlichkeiten gleich 1 ist, folgt: Der Flächeninhalt A unter der Exponentialfunktion muss den Wert 1 haben.

Abb. 3

Die Graphen in der Abb. 3 wurden mit dem folgenden Programm angelegt:

u=k+0,5; x=x+0,01; k=int(x);v=14!/(k!*(14-k)!)*0,5^14; y=0,21*exp(-0,135*(x-7)^2); l=x

Der Flächeninhalt A unter y= a*exp(-b*(x-c)^2) unterscheidet sich nicht von dem unter y= a*exp(-b*x^2), denn c bewirkt nur eine Verschiebung des Graphen entlang der x -Achse. Der Flächeninhalt A unter y= a*exp(-b*x^2) unterscheidet sich von dem unter y= exp(-b*x^2) durch den Faktor a.

Wie wirkt sich b auf den Flächeninhalt aus ?

Um eine Antwort zu finden, werden die Inhalte der Flächen unter y= exp(-x^2) , y= exp(-2*x^2) und y= exp(-4*x^2) bestimmt. Dies geschieht mit dem Programm „y=y+2*exp(-b*(x+0,00025)^2)*0,0005; x=x+0,0005;“ im Fenster des folgenden Rechenprogramms.



Wir läuft die Rechnung ab?

Der rechts von der y-Achse unter dem Graphen von y= exp(-b*x^2) liegende Abschnitt der x-Achse ist gedanklich in Intervalle der Länge 0,00005 eingeteilt. Zu den Abschnitten werden die Produkte 2*exp(-b*(x+0,00025)^2)*0,0005 (Flächen über den Abschnitten der Breite 0,00005) gebildet und summiert. Mit dem Faktor 2 vor exp(-b*(x+0,00025)^2) werden die Werte zu den Abschnitten links von der y-Achse mitgezählt. Die Ergebnisse sind in der folgenden Tabelle zusammengestellt.

b

A=y

A^2

b*A^2

1

1,7724

3,1415

3,1415

2

1,2533

1,5707

3,1414

4

0,8862

0,7853

3,1412

Die Tabelle lässt folgenden Schluss zu: b*A2 = π      b = π/A2,   A = √( π/b)

Die Flächeninhalt a*√( π/b) der Fläche unter y= a*exp(-b*(x-c)^2) (die Summe aller Wahrscheinlichkeiten) ist 1.

a*√( π/b) = 1  →   a= 1/√( π/b)   →   a2 = 1/( π/b)   →   π/b =1 / a2   →   b = π ·a2

a hängt der Größe nach von m ab. Diese Abhängigkeit soll nun auch experimentell untersucht werden. Es werden die Höchstwerte von y=m!/(k!*(m-k)!)*0,5^m für m= 30, 40 und 50 ( k =m/2) mit dem schon genannten Rechenprogramm bestimmt. In der nächsten Tabelle ist a zu den genannten Werten von m eingetragen.

m

a

a^2

m*a^2

30

0,1446

0,02105

0,630

40

0,1253

0,01562

0,625

50

0,1123

0,0126

0,63

Die Tabelle lässt folgenden Schluss zu: m·a2 = 0,63     a = √ (0,63/m) = 1/√(1,587·m)

1,587 sieht nach 1/2· π aus.

Vermutlich gilt: a = 1/√(1/2· π·m) und somit b = π ·a2 = 1/(1/2·m)

y= 1/wrz(0,5*pi*m)*exp(-0,5/m*(x-m/2)^2)

Mit dem folgenden Programm können die letzten Aussagen zu verschiedenen Werten m auf ihre Richtigkeit geprüft werden.

x=x+0,01; k=int(x); u=k; v=m!/(k!*(m-k)!)*0,5^m; y= 1/wrz(0,5*pi*m)*exp(-1/(0,5*m)*(x-1/2*m)^2); l=x

Binomialverteilungen und die zu ihrer Beschreibung dienende Exponentialfunktionen werden damit zum Vergleich dargestellt. Für den Fall m = 50 erhält man die in der Abb. 4 sichtbaren Graphen.

Abb. 4



Welche Werte müssen für a,b und c gewählt werden, wenn p≠ 0,5 ist ?

Der Term für a muss so beschaffen sein , dass er bei p = 0,5 den Wert 1/√(1/2· π·m) annimmt . Die gilt für a = 1/√(2·p·(1-p)· π·m). Diese Vermutung kann mit dem nachfolgenden Programm auf seine Richtigkeit geprüft werden.

x=x+0,01; k=int(x); u=k; v=m!/(k!*(m-k)!)*p^k*(1-p)^(m-k); y= 1/wrz(2*p*(1-p)*pi*m)*exp(-1/(2*p*(1-p)*m)*(x-p*m)^2); l=x

Die Binomialverteilung hat ihr Maximum über p*m, dem Mittelwert von k !

In der Abb.5 ist eine Binomialverteilung mit m = 50 und p = 0,02 (Anfangswert von x = 1) dargestellt. Es ist erkennbar, dass bei kleinem p die Exponentialfunktion (rot) erheblich von der Binomialverteilung abweicht.

Abb.5

Wenn p sehr klein ist, dann passt zur Binomialverteilung eine von dem Mathematiker Poisson vorgeschlagene Annäherungsformel .

m! / [k! · (m – k)!] = m · (m-1) · (m-2).....· (m-k) / k!

Bei einem im Vergleich zu m sehr kleinem k kann geschrieben werden: m · (m-1) · (m-2).....· (m-k) mk   →   m! / [k! · (m – k)!] mk / k!

Wahrscheinlichkeit w(k) [mk / k! ]· pk ·(1-p)m-k[mk / k! ]· pk ·(1-p)m

k im Exponent m – k kann gestrichen werden, weil k im Vergleich mit m vernachlässigbar ist.

Für den Mittelwert von k gilt: Mk= p · m     ↔     p = Mk/m

Wahrscheinlichkeit w(k) [mk / k! ]· pk ·(1-p)m = [mk / k! ]· pk ·{ [(1-Mk/m)](m/Mk) }Mk

(1-Mk/m)](m / Mk) nimmt mit großen Werten von m den Wert 0,3678776 an.

Es handelt sich um den Kehrwert der Zahl e.

Somit kann geschrieben werden: w(k) [mk / k! ]· pk ·e- Mk = [(m· p)k / k! ] ·e- Mk = [(Mk)k / k! ] ·e- Mk

Mit dem folgenden Programm wird der Graph zur Binomialverteilung z= (50|x)·0,02x ·(1- 0,02)(100-x) mit der dazu passenden Graphen der Funktion y = ( (p·m)x / x!) · e (-p · m) verglichen. Es sind kaum Abweichungen voneinander zu erkennen (siehe Abb. 6),

x=x+1; y=(((p*m)^x )/ x!)*e^(-p*m); z=m!/(x!*(m-x)!)*(p^x)*(1-p)^(m-x)

Abb.6



Einstellungen zu den Programmen



Abb. 7



Über die Verteilung von Messfehlern

Wir gehen davon aus, dass Messfehler f Summen aus m sehr kleinen mit der Wahrscheinlichkeit p = 0 ,5 auftretenden Fehlern fe und fe' sind. fe vergrößert einen Messwert und fe' verkleinert ihn (er ist negativ). f ist demnach gleich einer Summe aus fe und fe'. Die Zahl m dieser kleinen Fehler sei bei einer Messung so groß, dass diese Summe sich kaum ändert, wenn fe und fe' durch deren Mittelwerte h und h' ersetzt werden. Es wird angenommen, dass die Beträge von h und h' gleich sind. Bei vielen Messungen mit m Fehlern h und h' wird sich eine Binomialverteilung der fe und fe' einstellen. Setzt sich ein Fehler f aus k Werten der Größe h und m-k Werten der Größe h' zusammen, dann gilt:

f = h·k + (m-k)·h' = h·k – (m-k)·h = 2 · h·k - m·h → k = f /(2·h)+ m/2.

Die Wahrscheinlichkeit von f ist demnach W(f) = 1/√(p· π·m)·e-[1/(p·m)]·(k-m/2)^2 = 1/√(p· π·m)·e-[1/(p·m)]·[f/(2·h)]^2

Die Fehler f die einem bestimmten k zugeordnet sind, bilden ein Intervall der Breite 2·h, denn wenn sich k um 1 ändert, dann ändert sich der zugehörende Fehler f um 2·h.

W(f) = [1/√(p· π·m)]·e-[1/(p·m)]·[f/(2·h)]^2 ist die Wahrscheinlichkeit, mit der ein Fehler f in ein Intervall der Breite 2·h fällt.

w(f) = [1/√(p· π·m) ]· e - [1 / (p·m)]·[f/(2·h)]^2 /( 2·h ) = [1/√(p· π·m· 4· h2 )] · e -[1 / (p·m· 4· h^2 )]· f^2 / ( 2·h ) heißt Wahrscheinlichkeitsdichte.

1 / (p·m· 4· h^2 )] = b w(f) = √(b / π) · e- b·f^2


Experimentelle Untersuchung der Fehlerverteilung

Ein 2000 Hz - Ton wird mit einem Mikrofon aufgenommen und nach Verstärkung des Signals auf ±1,5V mit Hilfe Rechners mit AD-Wandler (CASSY - E) registriert (siehe Abb. 8). Durch eine gegen das Messsignal wirkende konstante Gegenspannung erreicht man, dass die positiven Halbwellen höchstens 0,5 V erreichen (siehe Abb.9 ). So können die Höhen der Spannungsspitzen in den empfindlichen Messbereichen ±1V und ± 0,3 Volt gemessen werden, in denen die Schwankungen des Messsignals gut erkennbar sind. Je Sekunde werden 2000 Spannungsspitzen ausgemessen. Der Messbereich wird vom Rechner in 256 gleich große Intervalle aufgeteilt. Über jedem Intervall errichtet der Computer auf seinem Bildschirm eine senkrechte Strecke, deren Länge proportional zur Zahl der Messwerte ist, die je Sekunde in dieses Intervall fallen (Zahl aller Messwerte im Intervall / Zeit der Messwertaufnahme).

Abb. 8

Abb. 9

In den Abb. 10 und 11 sind Ergebnisse dargestellt, die im Messbereich ±1V aufgenommen wurden. Deutlich ist zu sehen, wie die Diagramme mit zunehmender Anzahl von Messungen mehr und mehr eine Glockenform annehmen.

Abb. 10



Abb. 11