Excel-Formeln für das Geburtstagsparadoxon

Eingestellt: 24.09.2010
Letzte Änderung: 24.09.2010


 

Einleitung

Im vorliegenden Artikel möchten wir Ihnen gerne Excel-Formeln zur Lösung des Geburtstagsparadoxons vorstellen. Beim Geburtstagsparadoxon (auch: Geburtstagsproblem) wird die Wahrscheinlichkeit gesucht, dass in einer Gruppe von n Personen mindestens zwei Personen dieser Gruppe am selben Tag Geburtstag haben, wobei der Jahrgang nicht berücksichtigt wird.

 

Annahmen

  1. Ein Jahr hat 365 Tage.[1]
  2. Die Geburtstage der n Personen sind unabhängig identisch verteilte Zufallsvariablen einer diskreten Gleichverteilung.[2] 

 

Formeln

Die gesuchte Wahrscheinlichkeit lässt sich berechnen mit

(#1)

und durch Umformen erhält man

. (#2)

Alternativ kann die Wahrscheinlichkeit in Abhängigkeit von n über ein Vektorfeld definiert werden

. (#3)

Ferner finden sich in der Literatur Approximationen für das vorliegende Problem, auf die an dieser Stelle bewusst verzichtet wird.

 

Excel-Formeln

In Excel steht keine Arbeitsblattfunktion zur Berechnung der gesuchten Wahrscheinlichkeit zur Verfügung, so dass auf Excel-Formeln ausgewichen werden muss. Eine Excel-Formel nach Formel #1 (bzw. #2) lässt sich mit Hilfe der Excel-Funktion VARIATIONEN (bzw. KOMBINATIONEN) schreiben. Für Formel #3 wird eine Arrayformel mit der Excel-Funktion PRODUKT verwendet. Die drei Excel-Formeln für das Geburtstagsparadoxon können Sie der Abbildung 1 entnehmen.


Formeln in der Tabelle:
B2:=1-VARIATIONEN(365;A2)/365^A2
C2:=1-FAKULTÄT(A2)*KOMBINATIONEN(365;A2)/365^A2
D2:{=1-PRODUKT((365-ZEILE(INDIREKT("1:"&A2))+1)/365)}
Formeln nach unten kopieren

Abbildung 1: Excel-Formeln für das Geburtstagsparadoxon.

Abgesehen von der Rechengenauigkeit in Excel ergibt sich bei den verwendeten Excel-Formeln #1 und #2 das Problem der Limitation der größten zulässigen Zahl in Excel. Im betrachteten Beispiel wird diese Zahl durch den Ausdruck 365^n überschritten und greift ab n=121, so dass beide Excel-Formeln für n>120 den Fehlerwert #Zahl! liefern. Darüber hinaus besteht bei der Excel-Formel #2 eine weitere Limitation, die jedoch auf Grund der ersteren in diesem Fall nicht ersichtlich ist. Bei der Excel-Funktion FAKULTÄT ist das Argument Zahl auf den Wert 170 nach oben beschränkt und liefert somit für n>170 ebenfalls den Fehlerwert #ZAHL!. Demgegenüber ist Excel-Formel #3 von den beiden Einschränkungen nicht betroffen.

 

Schematische Darstellung

Abbildung 2 zeigt den Verlauf der gesuchten Wahrscheinlichkeit (blau) und den Verlauf der Gegenwahrscheinlichkeit (rot), dass alle n Personen an verschiedenen Tagen Geburtstag haben, in Abhängigkeit der ersten 100 Personen in einem Punkt(XY)-Diagramm.

Abbildung 2: Schematische Darstellung des Geburtstagsparadoxons.

Ab 23 Personen ist die Wahrscheinlichkeit, dass mindestens zwei Personen am selben Tag Geburtstag haben, größer als 50%. Angedeutet wird dies in Abbildung 2 durch die gestrichelten, schwarzen Linien.

 

[1] Da der 29. Februar vernachlässigt wird, impliziert dies zugleich, dass keiner der n Personen an einem Schalttag Geburtstag haben soll.

[2] Diese Annahme wird bspw. dann nicht erfüllt, wenn sich Mehrlinge unter den betrachteten Personen befinden.

 

Haben Sie Fragen oder Anregungen zu diesem Artikel?

Dann senden Sie einfach eine Nachricht an:

E-Mail:

 

Lesen Sie auch:
___________________________________________________________________

Variationen mit Zurücklegen