Todennäköisyys, että päiden lukumäärä ylittää muottien rullien summan

user239903

2020-08-26 04:08:59 UTC

view on stackexchange narkive permalink

Merkitään $ X $ pisteiden summaa, jonka näemme $ 100 $ -rullaissa, ja anna $ Y $ merkitsee kolojen läppien 600 $ $ päämääriä.Kuinka voin laskea $ P (X > Y)? $

Intuitiivisesti, mielestäni ei ole mukavaa tapaa laskea todennäköisyys;Luulen kuitenkin, että voimme sanoa $ P (X > Y) \ noin 1 $ , koska $ E (X) =350 $ , $ E (Y) = 300 $ , $ \ text {Var} (X) \noin 292 $ , $ \ text {Var} (Y) = 150 $ , mikä tarkoittaa, että keskihajonta on melko pieni.

Onko olemassa parempi tapa lähestyä tätä ongelmaa?Selitykseni näyttää melko käsin aaltoilevalta, ja haluaisin ymmärtää paremman lähestymistavan.

Yksi tapa olisi käyttää normaaleja likiarvoja $ X $: iin ja $ Y: ään, $ sitten itsenäisyyden mukaan arvoon $ X-Y $

Käytän vain normaalia likiarvoa, ellei tarvitsisi tarkkaa vastausta.

Selityksesi * on * aaltoileva, ja se on loistava lähestymistapa.Tällaiset nopeat ja yksinkertaiset kirjekuoren takaosan laskelmat mahdollistavat mielenterveyden tarkistamisen, onko jollakin muulla monimutkaisella laskutoimituksella tai mallin sopivuudella edes järkevää.Ne ovat lähinnä [Fermi-ongelmien] todennäköisyysekvivalentteja (https://fi.wikipedia.org/wiki/Fermi_problem).Jos haastattelisin sinua, olisin todella tyytyväinen ideoihisi.(Vielä onnellisempi, jos keksit myös muita lähestymistapoja, kuten simulaation missä tahansa ohjelmistopaketissa.)

Voisitko pyytää inkvisiittoriasi olemaan realistisempi? "Kaikki tietävät" niiden pisteiden summan, jotka meidän pitäisi nähdä sadassa nopparulla, eikä sitä tapahdu;puolet syystä noppapeleistä. Kun olin noin 12-vuotias, opettaja sai luokan heittämään satoja noppia ja tulos oli hyvin selvä. Numerot kaksi ja viisi olivat kaksi kertaa todennäköisempiä kuin tilastojen mukaan niiden pitäisi olla.Kokeile sitä ennen kuin kieltää sen! Odota kuitenkin ... Ei kahta ja viittä?Etkö tiedä useita noppapelejä, jotka riippuvat seitsemästä?Eikö niin sanota kahdella tai viidellä?

rullaa <- 100 kääntää <- 600 ddice <- rep (1/6, 6) varten (n 2: rullaa) { ddice <- (c (0, ddice, 0,0,0,0,0) + c (0,0, ddice, 0,0,0,0) + c (0,0,0, ddice, 0,0,0) + c (0,0,0,0, ddice, 0,0) + c (0,0,0,0,0, ddice, 0) + c (0,0,0,0,0,0, ddice)) / 6} summa (ddice * (1-pbinom (1: flips, flips, 1/2))) # todennäköisyyskolikot lisää # 0.00809003 summa (ddice * dbinom (1: kääntö, kääntö, 1/2)) # todennäköisyyden yhtälö # 0.00111972 summa (ddice * pbinom (0: (flips-1), flips, 1/2)) # todennäköisyysnoppa lisää # 0.99079025

set.seed (825) d = kopio (10 ^ 6, summa (näyte (1: 6,100, rep = T)) - rbinom (1600, .5)) keskiarvo (d > 0) [1] 0,990736 2 * sd (d > 0) / 1000 [1] 0,0001916057 # aprx 95% simulointivirhemarginaali

tuo numerotiedosto np: ksi c = np.random.randint (0, 2, koko = (10000, 100, 6)). summa (akseli = -1) d = np.random.randint (1, 7, koko = (10000, 100)) (d.sum (akseli = -1) > c.sum (akseli = -1)). summa () --> 9923

kokoelmien tuonnista defaultdict # määritä yhden kolikon jakaumat ja kuole kolikko = kaksinkertainen ((i, 1/2) i: lle (0, 1)) kuolla = kaksinkertainen ((i, 1/6) i: lle (1, 2, 3, 4, 5, 6)) # yksinkertainen funktio kahden satunnaismuuttujan summan laskemiseksi def add_rv (a, b): summa = defaultdict (kelluva) i: lle, p in a: j: lle, q b: ssä: summa [i + j] + = p * q return tuple (summa. kohteet ()) # Laske 600 kolikon ja 100 noppan summat kolikon_summa = nopan_summa = ((0, 1),) _ alueella (600): kolikon summa = add_rv (kolikon summa, kolikko) _ alueella (100): noppasumma = add_rv (noppasumma, kuolla) # laske todennäköisyys, että nopan summa on suurempi prob = 0 i: lle, p dice_sum: j: lle, q kolikkosummassa: jos i > j: prob + = p * q tulosta ("todennäköisyys, että 100 noppaa summautuu yli 600 kolikkoon =% .10f"% prob)

# Tallenna muuttujien PMF: t datakehyksinä sarakkeisiin "arvo" ja "prob". # Tärkeää, että arvot ovat peräkkäisiä ja nousevat johdonmukaisuuden suhteen kääntämällä, # sisällytä tarvittaessa väliarvot todennäköisyydellä 0! # Toiminto, jolla tarkistetaan, onko datakehys PMF: n määritelmän mukainen # Selitä viesti_intro avulla, mikä tarkistus epäonnistuu is.pmf <- funktio (x, message_intro = "") { if (! is.data.frame (x)) {stop (paste0 (message_intro, "Not a dataframe"))}} if (! nrow (x) > 0) {stop (liitä0 (viesti_intro, "Tietokehyksessä ei ole rivejä"))} if (! "value"%% colnames (x)) {stop (paste0 (message_intro, "No 'value' column"))}} jos (! "prob"% prosentteina colnames (x)) {stop (liitä0 (viesti_intro, "Ei 'prob' -saraketta"))} if (! is.numeric (x $ value)) {stop (liitä0 (message_intro, "arvo" -sarake ei numeerinen ")}} if (! all (is.finite (x $ value))) {stop (paste0 (message_intro, "Sisältääkö 'arvo' NA, Inf, NaN jne.?))} if (! all (diff (x $ value) == 1)) {stop (liitä0 (message_intro, "'arvo' ei ole peräkkäinen ja nouseva"))} if (! is.numeric (x $ prob)) {stop (paste0 (message_intro, "prob" -sarake ei numeerinen "))} if (! all (is.finite (x $ prob))) {stop (paste0 (message_intro, "Sisältääkö 'prob' NA: ta, Inf, NaN jne."))} jos (! all.equal (summa (x $ prob), 1)) {stop (liitä0 (message_intro, "prob" -sarake ei ole summa 1 "))} paluu (TOSI) } # Toiminto yhdistää x: n ja y: n PMF: t # Huomaa, että R: n kääntymiseksi meidän on käännettävä toinen vektori # name1 ja name2 käytetään kahden syötteen virheraportoinnissa convolve.pmf <- funktio (x, y, nimi1 = "x", nimi2 = "y") { is.pmf (x, message_intro = paste0 ("Tarkistetaan", nimi1, "on kelvollinen PMF:")) is.pmf (y, message_intro = paste0 ("Tarkistetaan", nimi2, "on kelvollinen PMF:")) x_plus_y <- data.frame ( arvo = seq (alkaen = min (x $ arvo) + min (y $ arvo), arvoon = max (x $ arvo) + max (y $ arvo), = 1), prob = convolve (x $ prob, rev (y $ prob), type = "open") ) paluu (x_plus_y) } # Olkoon x_i yksittäisten noppaheittojen pistemäärä i # Huomaa, että x_i: n PMF on sama jokaiselle i = 1 - i = 100) x_i <- data.frame ( arvo = 1: 6, prob = rep (1/6, 6) ) # Olkoon t_i x_1, x_2, ..., x_i summa # Tallennamme t_1, t_2 ... PMF: t luetteloon t_i <- luettelo () t_i [[1]] <- x_i # t_1 on vain x_1, joten sillä on sama PMF T_i: n PMF on t_ (i-1): n ja x_i: n PMF: ien konvoluutio (i in 2: 100) { t_i [[i]] <- sekoittaa.pmf (t_i [[i-1]], x_i, nimi1 = liitä0 ("t_i [[", i-1, "]]"), nimi2 = "x_i") } # Olkoon x kaikkien 100 itsenäisen nopparullan pisteiden summa x <- t_i [[100]] is.pmf (x, message_intro = "Tarkistetaan, että x on kelvollinen PMF:") # Olkoon y kolikkopään lukumäärä 600 kolikkolevyssä, joten Binomial (600, 0,5) -jakauma on sama: y <- data.frame (arvo = 0: 600) y $ prob <- dbinom (y $ arvo, koko = 600, prob = 0,5) is.pmf (y, message_intro = "Tarkistetaan, onko y kelvollinen PMF:") # Olkoon z negatiivinen arvosta y (huomaa, että käännämme järjestyksen, jotta arvot pysyvät nousevina) z <- data.frame (arvo = -rev (y $ arvo), prob = rev (y $ prob)) is.pmf (z, message_intro = "Tarkistetaan, onko z kelvollinen PMF:") # Olkoon d ero, d = x - y = x + z d <- muodostaa.pmf (x, z, nimi1 = "x", nimi2 = "z") is.pmf (d, message_intro = "Tarkistetaan d on kelvollinen PMF:") # Prob (X > Y) = Prob (D > 0) summa (d [d $ arvo > 0, "prob"]) # [1] 0,9907902