Wahrscheinlichkeit, dass die Anzahl der Köpfe die Summe der Würfelwürfe überschreitet

user239903

2020-08-26 04:08:59 UTC

view on stackexchange narkive permalink

Lassen Sie $ X $ span> die Summe der Punkte bezeichnen, die wir in $ 100 $ span> Würfelwürfeln sehen, und lassen Sie $ Y $ span> bezeichnet die Anzahl der Köpfe in $ 600 $ span> Münzwürfen.Wie kann ich $ P (X > Y) berechnen? $ Span>

Intuitiv glaube ich nicht, dass es eine gute Möglichkeit gibt, die Wahrscheinlichkeit zu berechnen.Ich denke jedoch, dass wir $ P (X > Y) \ ca. 1 $ span> sagen können, da $ E (X) =350 $ span>, $ E (Y) = 300 $ span>, $ \ text {Var} (X) \ca. 292 $ span>, $ \ text {Var} (Y) = 150 $ span>, was bedeutet, dass die Standardabweichungen ziemlich klein sind.

Gibt es einen besseren Weg, um dieses Problem anzugehen?Meine Erklärung scheint ziemlich wellig zu sein, und ich würde gerne einen besseren Ansatz verstehen.

Eine Möglichkeit wäre, normale Annäherungen an $ X $ und $ Y zu verwenden, dann unabhängig von $ X-Y $

Ich würde nur eine normale Annäherung verwenden, wenn ich keine genaue Antwort benötige.

Ihre Erklärung * ist * handgewellt, und das ist ein großartiger Ansatz.Mit solchen schnellen und einfachen Berechnungen auf der Rückseite des Umschlags können Sie überprüfen, ob eine andere komplizierte Berechnung oder Modellanpassung überhaupt Sinn macht.Sie sind im Wesentlichen das Wahrscheinlichkeitsäquivalent von [Fermi-Problemen] (https://en.wikipedia.org/wiki/Fermi_problem).Wenn ich Sie interviewen würde, würde ich mich sehr über Ihre Ideen freuen.(Noch glücklicher, wenn Sie sich auch andere Ansätze ausgedacht haben, wie eine Simulation in einem Softwarepaket.)

Könnten Sie Ihren Inquisitor bitten, realistischer zu sein? "Jeder kennt" die Summe der Punkte, die wir in 100 Würfeln sehen sollten, und das wird nicht passieren.Der halbe Grund, warum Würfelspiele existieren. Als ich ungefähr 12 Jahre alt war, brachte ein Lehrer die Klasse dazu, Hunderte von Würfeln zu werfen, und das Ergebnis war sehr klar. Die Nummern zwei und fünf waren doppelt so wahrscheinlich wie die Statistiken es vorgaben.Bevor Sie das leugnen, versuchen Sie es! Warten Sie aber ... Nr. Zwei und fünf?Kennst du nicht mehrere Würfelspiele, die von sieben abhängen?Ist das nicht zu zweit oder zu fünft zu sagen?

rollt <-100 dreht <-600 um ddice <-rep (1/6, 6) für (n in 2: Rollen) { Würfel <- (c (0, Würfel, 0,0,0,0,0) + c (0,0, Würfel, 0,0,0,0) + c (0,0,0, Würfel, 0,0,0) + c (0,0,0,0, Würfel, 0,0) + c (0,0,0,0,0, Würfel, 0) + c (0,0,0,0,0,0, Würfel)) / 6} sum (ddice * (1-pbinom (1: flips, flips, 1/2)) # Wahrscheinlichkeitsmünzen mehr # 0.00809003 sum (ddice * dbinom (1: flips, flips, 1/2)) # Wahrscheinlichkeitsgleichheit # 0.00111972 sum (ddice * pbinom (0: (flips-1), flips, 1/2)) # Wahrscheinlichkeitswürfel mehr # 0.99079025

set.seed (825) d = replizieren (10 ^ 6, Summe (Probe (1: 6.100, rep = T)) - rbinom (1.600, .5)) Mittelwert (d > 0) [1] 0,990736 2 * sd (d > 0) / 1000 [1] 0,0001916057 # aprx 95% Marge des Simulationsfehlers

importiere numpy als np c = np.random.randint (0, 2, Größe = (10000, 100, 6)). Summe (Achse = -1) d = np.random.randint (1, 7, Größe = (10000, 100)) (d.sum (Achse = -1) > c.sum (Achse = -1)). sum () --> 9923

aus Sammlungen importieren defaultdict # Definieren Sie die Verteilungen einer einzelnen Münze und sterben Sie Münze = Tupel ((i, 1/2) für i in (0, 1)) die = Tupel ((i, 1/6) für i in (1, 2, 3, 4, 5, 6)) # eine einfache Funktion zum Berechnen der Summe zweier Zufallsvariablen def add_rv (a, b): sum = defaultdict (float) für i, p in a: für j, q in b: Summe [i + j] + = p * q Rückgabetupel (sum.items ()) # Berechnen Sie die Summe von 600 Münzen und 100 Würfeln coin_sum = dice_sum = ((0, 1),) für _ im Bereich (600): coin_sum = add_rv (coin_sum, coin) für _ im Bereich (100): dice_sum = add_rv (dice_sum, die) # Berechnen Sie die Wahrscheinlichkeit, dass die Würfelsumme höher ist prob = 0 für i, p in dice_sum: für j, q in coin_sum: wenn i > j: prob + = p * q print ("Wahrscheinlichkeit, dass 100 Würfel zu mehr als 600 Münzen summieren =% .10f"% prob)

# Speichern Sie die PMFs von Variablen als Datenrahmen mit den Spalten "value" und "prob". # Wichtig, dass die Werte fortlaufend sind und aus Gründen der Konsistenz beim Falten aufsteigen. # also bei Bedarf Zwischenwerte mit der Wahrscheinlichkeit 0 einschließen! # Funktion zum Überprüfen, ob der Datenrahmen der obigen Definition von PMF entspricht # Verwenden Sie message_intro, um zu erklären, welche Prüfung fehlschlägt is.pmf <- Funktion (x, message_intro = "") { if (! is.data.frame (x)) {stop (paste0 (message_intro, "Kein Datenrahmen"))} if (! nrow (x) > 0) {stop (paste0 (message_intro, "Dataframe hat keine Zeilen"))} if (! "value"% in% colnames (x)) {stop (paste0 (message_intro, "No 'value' column"))} if (! "prob"% in% colnames (x)) {stop (paste0 (message_intro, "No 'prob' column"))} if (! is.numeric (x $ value)) {stop (paste0 (message_intro, Spalte '' value 'nicht numerisch ")}) if (! all (is.finite (x $ span> value))) {stop (paste0 (message_intro, "Enthält 'value' NA, Inf, NaN usw.?")}) if (! all (diff (x $ value) == 1)) {stop (paste0 (message_intro, "'value' nicht fortlaufend und aufsteigend")} if (! is.numeric (x $ span> prob)) {stop (paste0 (message_intro, "'prob' Spalte nicht numerisch"))} if (! all (is.finite (x $ prob))) {stop (paste0 (message_intro, "Enthält 'prob' NA, Inf, NaN usw.?")}) if (! all.equal (sum (x $ span> prob), 1)) {stop (paste0 (message_intro, Spalte '' prob 'summiert sich nicht zu 1 ")}) return (TRUE) }} # Funktion zum Falten von PMFs von x und y # Beachten Sie, dass wir den zweiten Vektor umkehren müssen, um uns in R zu falten # name1 und name2 werden in der Fehlerberichterstattung für die beiden Eingaben verwendet convolve.pmf <- Funktion (x, y, name1 = "x", name2 = "y") { is.pmf (x, message_intro = paste0 ("Prüfen", Name1, "ist gültige PMF:")) is.pmf (y, message_intro = paste0 ("Prüfen", Name2, "ist gültige PMF:")) x_plus_y <- data.frame ( value = seq (from = min (x $ value) + min (y $ span> value), to = max (x $ value) + max (y $ span> value), durch = 1), prob = convolve (x $ prob, rev (y $ span> prob), type = "open") ) return (x_plus_y) }} # Sei x_i die Punktzahl beim einzelnen Würfelwurf i # Hinweis Die PMF von x_i ist für jedes i = 1 bis i = 100 gleich.) x_i <- data.frame ( Wert = 1: 6, prob = rep (1/6, 6) ) # Sei t_i die Summe von x_1, x_2, ..., x_i # Wir speichern die PMFs von t_1, t_2 ... in einer Liste t_i <- list () t_i [[1]] <- x_i # t_1 ist nur x_1 und hat dieselbe PMF # PMF von t_i ist die Faltung von PMFs von t_ (i-1) und x_i für (i in 2: 100) { t_i [[i]] <-convolve.pmf (t_i [[i-1]], x_i, name1 = paste0 ("t_i [[", i-1, "]]"), name2 = "x_i") }} # Sei x die Summe der Punkte aller 100 unabhängigen Würfelwürfe x <-t_i [[100]] is.pmf (x, message_intro = "Überprüfen, ob x gültig ist PMF:") # Sei y die Anzahl der Köpfe in 600 Münzwürfen, ebenso die Binomialverteilung (600, 0,5): y <- data.frame (Wert = 0: 600) y $ prob <-dbinom (y $ span> -Wert, Größe = 600, Prob = 0,5) is.pmf (y, message_intro = "Überprüfen, ob y PMF gültig ist:") # Sei z das Negativ von y (beachte, dass wir die Reihenfolge umkehren, um die Werte aufsteigend zu halten) z <- data.frame (Wert = -rev (y $ value), prob = rev (y $ span> prob)) is.pmf (z, message_intro = "Überprüfen, ob z eine gültige PMF ist:") # Sei d die Differenz, d = x - y = x + z d <-convolve.pmf (x, z, name1 = "x", name2 = "z") is.pmf (d, message_intro = "Überprüfen, ob d eine gültige PMF ist:") # Prob (X > Y) = Prob (D > 0) Summe (d [d $ Wert > 0, "prob"]) # [1] 0,9907902