Kysymys:
Mitä eroa on luottamusvälillä ja uskottavalla aikavälillä?
Matt Parker
2010-09-01 18:53:07 UTC
view on stackexchange narkive permalink

Jorisin ja Srikantin vaihto täällä sai minut taas miettimään (olivatko sisäiset selitykseni luottamusvälien ja uskottavien aikavälien eroista oikeat. Kuinka selität eron?

Yhdeksän vastused:
#1
+355
Keith Winstein
2010-09-01 23:46:23 UTC
view on stackexchange narkive permalink

Olen täysin samaa mieltä Srikantin selityksestä. Heuristisemman pyörähdyksen antaminen:

Klassiset lähestymistavat ovat yleensä sitä mieltä, että maailma on yksi tapa (esim. Parametrilla on yksi tietty todellinen arvo), ja yritä suorittaa kokeita, joiden johtopäätös - ei väliä parametrin todellinen arvo - on oikea ainakin pienimmällä todennäköisyydellä.

Tämän seurauksena ilmaisemaan epävarmuutta tietämyksessämme kokeilun jälkeen, gyakoristinen lähestymistapa käyttää "luottamusväliä" - arvoalue, joka on suunniteltu sisällyttämään parametrin todellinen arvo pienimmällä todennäköisyydellä, esimerkiksi 95%. Yleinen asiantuntija suunnittelee kokeen ja 95%: n luottamusvälimenettelyn siten, että jokaisesta 100 suoritetusta kokeesta alkaa loppua, vähintään 95 tuloksena olevasta luottamusvälistä odotetaan sisältävän parametrin todellisen arvon. Viisi muuta saattavat olla hieman väärässä tai ne voivat olla täysin hölynpölyä - muodollisesti se on ok lähestymistavan kannalta, kunhan 95 sadasta päätelmästä on oikein. (Tietenkin haluaisimme heidän olevan hieman väärässä, ei täysin hölynpölyä.)

Bayesilaiset lähestymistavat muotoilevat ongelman eri tavalla. Sen sijaan, että sanottaisiin, että parametrilla on vain yksi (tuntematon) todellinen arvo, Bayesin menetelmä kertoo, että parametrin arvo on kiinteä, mutta se on valittu joistakin todennäköisyysjakaumasta - joka tunnetaan nimellä aikaisempi todennäköisyysjakauma. (Toinen tapa sanoa, että ennen mittausten tekemistä Bayesin osallistuja määrittelee todennäköisyysjakauman, jota he kutsuvat vakaumustilaksi, parametrin todellisesta arvosta.) Tämä "priori" saattaa olla tiedossa (kuvittele yrittävän kuorma-auton koon arvioimiseksi, jos tiedämme kuorma-autojen koon kokonaisjakauman DMV: stä) tai se voi olla tyhjästä lähtevä oletus. Bayesin päätelmä on yksinkertaisempi - keräämme joitain tietoja ja laskemme sitten parametrin GIVEN data eri arvojen todennäköisyyden. Tätä uutta todennäköisyysjakaumaa kutsutaan "posteriori-todennäköisyydeksi" tai yksinkertaisesti "posterioriseksi". Bayesilaiset lähestymistavat voivat tiivistää epävarmuutensa antamalla taka-alueelle todennäköisyysjakauman arvon, joka sisältää 95% todennäköisyydestä - tätä kutsutaan "95%: n uskottavuusväliksi".

Bayesilainen partisaani saattaa kritisoida tällainen usein esiintyvä luottamusväli: "Entä jos 95 sadasta kokeesta tuottaa luottamusvälin, joka sisältää todellisen arvon? En välitä 99 kokeesta, joita en tehnyt; välitän tästä kokeesta. TEIN Sääntösi sallii viiden 100: sta olla täysin hölynpölyä [negatiiviset arvot, mahdottomat arvot], kunhan muut 95 ovat oikeita; se on naurettavaa. "

Yleisurheilija voi kritisoida Bayesin uskottavuusväliä näin: "Entä jos 95% taka-todennäköisyydestä sisältyy tähän alueeseen? Entä jos todellinen arvo on esimerkiksi 0,37? Jos on, niin sinun menetelmä, suorita alusta loppuun, on VÄÄRIN 75% ajasta. Vastauksesi on: "No, se on ok, koska priorin mukaan on hyvin harvinaista, että arvo on 0,37", ja se voi olla niin, mutta haluan menetelmä, joka toimii MITÄÄN parametrin mahdollisella arvolla. En välitä parametrin 99 arvosta, jota sillä EI ole; välitän vain yhdestä todellisesta arvosta, joka sillä on. Voi, muuten, vastauksesi ovat oikeita vain, jos priori on oikea. Jos vedät sen vain tyhjästä, koska se tuntuu oikealta, voit olla kaukana. "

Molemmissa partisaaneissa on tietyssä mielessä oikea kritiikki toistensa menetelmiä, mutta kehotan teitä ajattelemaan matemaattisesti eroa - kuten Srikant selittää.


Tässä on laajennettu esimerkki tästä puheesta, joka osoittaa ero täsmälleen erillisessä esimerkissä.

Kun olin lapsi, äitini yllättää minut toisinaan tilaamalla purkin suklaakeksejä postitse. Jakeluyhtiö varastoi neljä erilaista evästepurkkia - tyyppi A, tyyppi B, tyyppi C ja tyyppi D, ja ne kaikki olivat samalla kuorma-autolla, etkä ollut koskaan varma, minkä tyyppisen saat. Jokaisessa purkissa oli täsmälleen 100 evästettä, mutta ominaisuus, joka erottaa eri evästepurkit, oli niiden jakautuneet suklaalastut evästettä kohden. Jos saavutit purkkiin ja otit yhden evästeen tasaisesti satunnaisesti, nämä ovat todennäköisyysjakaumat, jotka saisit pelimerkkien määrälle:

alt text

Esimerkiksi A-tyypin evästepurkissa on 70 keksiä, joissa kussakin on kaksi sirua, eikä evästeitä, joissa on vähintään neljä sirua! D-tyypin evästepurkissa on 70 evästettä yhdellä sirulla. Huomaa, kuinka kukin pystysarakkeessa on todennäköisyysmassafunktio - saamiesi pelimerkkien ehdollinen todennäköisyys, kun otetaan huomioon, että jar = A, B tai C, tai D ja jokainen sarake on 100.

Minulla oli tapana rakastaa pelata peliä heti, kun toimittaja pudotti uuden evästepurkini. Vedin yhden yksittäisen evästeen satunnaisesti purkista, laskin sirut evästeelle ja yritin ilmaista epävarmuuteni - 70%: n tasolla - joista purkit se voisi olla. Siten purkin identiteetti (A, B, C tai D) on arvioitavan parametrin arvo . Pelimerkkien lukumäärä (0, 1, 2, 3 tai 4) on tulos tai havainto tai näyte.

Alun perin pelasin tätä peliä 70%: lla. luottamusväli. Tällaisen aikavälin on varmistettava, että riippumatta parametrin todellisesta arvosta, eli riippumatta siitä, minkä evästepurkin sain, intervalli peittäisi todellisen arvon vähintään 70 prosentin todennäköisyydellä.

Intervalli on tietysti toiminto, joka liittää lopputuloksen (rivi) parametrin arvojoukkoon (sarakejoukko). Mutta rakentaa luottamusväli ja taata 70% peitto, meidän on työskenneltävä "vertikaalisesti" - tarkastelemalla kutakin saraketta vuorotellen ja varmistamalla, että 70% todennäköisyysmassafunktiosta on peitetty 70% ajasta kyseisen sarakkeen identiteetti on osa tulosta. Muista, että pystysarakkeet muodostavat pmf: n.

Joten tämän toimenpiteen tekemisen jälkeen päädyin näihin väleihin:

enter image description here

Jos esimerkiksi piirtämäni evästeen pelimerkkien lukumäärä on 1, luottamusvälini on {B, C, D}. Jos luku on 4, luottamusvälini on {B, C}. Huomaa, että koska kukin sarake on vähintään 70%, riippumatta siitä, missä sarakkeessa olemme todella (riippumatta siitä, missä purkissa toimittaja putosi), tämän menettelyn tuloksena oleva väli sisältää oikean purkin vähintään 70% todennäköisyydellä.

Huomaa myös, että menettelyllä, jota noudatin intervallien muodostamisessa, oli jonkin verran harkintavaltaa. Tyypin B sarakkeessa olisin voinut yhtä helposti varmistaa, että B: n sisältävät intervallit olisivat 0,1,2,3 1,2,3,4: n sijaan. Tämä olisi johtanut B-tyypin purkkeihin (12 + 19 + 24 + 20) 75 prosentin peittävyyteen, mikä olisi silti saavuttanut 70 prosentin alarajan.

Siskoni Bayesia piti tätä lähestymistapaa kuitenkin hulluna. "Sinun on pidettävä jakelijaa osana järjestelmää", hän sanoi. "Käsitellään purkin identiteettiä itse satunnaismuuttujana, ja oletetaan oletetaan , että toimittaja valitsee joukon yhtenäisesti - mikä tarkoittaa, että hänellä on kaikki neljä rekassaan, ja kun hän saavuttaa talomme, hän poimii yhden satunnaisesti, kullakin yhtenäinen todennäköisyys. "

" Tarkastellaan tällä oletuksella nyt koko tapahtuman yhteisiä todennäköisyyksiä - purkityyppi ja pelimerkit, jotka otat ensimmäisestä evästeestäsi ", hän sanoi piirtäen seuraavan taulukon:

enter image description here

Huomaa, että koko taulukko on nyt todennäköisyysmassafunktio - eli koko taulukon summa on 100%.

"Okei, sanoin," minne olet menossa tämän kanssa? "

" Olet tarkastellut ehdollista todennäköisyyttä pelimerkkejä, kun otetaan huomioon purkki ", sanoi Bayesia. "Se on kaikki väärin! Se, mitä todella välität, on ehdollinen todennäköisyys, mikä purkki se on, kun otetaan huomioon evästeessä olevien sirujen määrä! 70%: n välein tulisi yksinkertaisesti sisältää luettelopurkit, joiden todennäköisyys olla yhteensä 70% totta purkki. Eikö se ole paljon yksinkertaisempaa ja intuitiivisempaa? "

"Toki, mutta miten se lasketaan?" Kysyin.

"Oletetaan, että tiedämme , että sinulla on 3 pelimerkkiä. Sitten voimme jättää huomiotta kaikki muut taulukon rivit ja yksinkertaisesti käsitellä sitä riviä todennäköisyysmassafunktiona "Meidän on suurennettava todennäköisyyksiä suhteellisesti, joten jokainen rivi on kuitenkin 100." Hän teki:

enter image description here

"Huomaa, kuinka kukin rivi on nyt pmf, ja summa on 100%. Olemme kääntäneet ehdollisen todennäköisyyden siitä, mistä aloitit - nyt on todennäköistä, että mies pudottaa tietyn purkin, kun otetaan huomioon ensimmäisen evästeen sirujen määrä. "

" Mielenkiintoista ", sanoin. "Joten nyt ympyröimme vain tarpeeksi purkkeja kullekin riville saadaksemme jopa 70%: n todennäköisyyden?" Teimme juuri niin, tekemällä nämä uskottavuusvälit:

enter image description here

Jokainen väli sisältää joukon purkkeja, jotka a posteriori ovat 70% todennäköisyys olla todellinen purkki.

"No, pidä kiinni", sanoin. "En ole vakuuttunut. Laitetaan nämä kaksi erilaista aikaväliä vierekkäin ja verrataan niiden kattavuutta ja olettaen, että toimittaja poimii jokaisen purkin saman todennäköisyydellä, uskottavuudella."

Täällä ne ovat:

Luottamusvälit:

enter image description here

Luotettavuusvälit:

enter image description here

"Katso kuinka hulluja luottamusvälisi ovat?" sanoi Bayesia. "Sinulla ei ole edes järkevää vastausta, kun piirrät evästeen, jossa ei ole pelimerkkejä! Sanot vain, että väli on tyhjä. Mutta se on tietysti väärin - sen on oltava yksi neljästä purkkityypistä. Kuinka voit elää itse, ilmoittaen päivän lopun välein, kun tiedät, että väli on väärä? Ja sama kun vedät 3 sirulla evästeen - aikaväli on oikea vain 41% ajasta. tämä '70%' luottamusväli on paskaa. "

"No, hei", vastasin. "Se on oikein 70% ajasta, riippumatta siitä, minkä purkin toimittaja pudotti. Se on paljon enemmän kuin voit sanoa uskottavuusvälistäsi. Entä jos purkki on B-tyyppiä? Silloin aikaväli on väärä 80% ajasta , ja korjaa vain 20% ajasta! "

" Tämä näyttää suurelta ongelmalta, "jatkoin," koska virheesi korreloivat purkityypin kanssa. Jos lähetät 100 'Bayesiania 'robotit arvioimaan minkä tyyppistä purkkia sinulla on, kukin robotti ottaa näytteen yhdestä evästeestä, sanot minulle, että tyypin B päivinä odotat 80 robotista saavan väärän vastauksen, joista jokaisella on> 73% uskoa väärä johtopäätös! Se on hankalaa, varsinkin jos haluat useimpien robottien sopivan oikeasta vastauksesta. "

" PLUS meidän oli tehtävä tämä oletus, että toimittaja käyttäytyy tasaisesti ja valitsee jokaisen purkityypin satunnaisesti. ," Sanoin. "Mistä se tuli? Entä jos se on väärin? Et ole puhunut hänen kanssaan; et ole haastatellut häntä. Silti kaikki lausuntosi a posteriori todennäköisyydestä perustuvat tähän lausuntoon hänen käyttäytymisestään. Minun ei tarvinnut tehdä mitään tällaisia ​​oletuksia, ja intervallini täyttää sen kriteerin jopa pahimmassa tapauksessa. "

" On totta, että uskottavuusvälini toimii huonosti B-tyypin purkkeilla ", Bayesia sanoi . "Mutta mitä sitten? B-tyypin purkkeja esiintyy vain 25% ajasta. Sitä tasapainottaa hyvä kattavuus A-, C- ja D-astioille. Enkä koskaan julkaise hölynpölyä."

"Se on totta että luottamusvälini toimii huonosti, kun olen piirtänyt evästeen, jolla ei ole pelimerkkejä ", sanoin. "Mutta mitä sitten? Pipettömiä evästeitä tapahtuu korkeintaan 27% ajasta pahimmassa tapauksessa (D-tyypin purkki). Minulla on varaa antaa hölynpölyä tästä lopputuloksesta, koska EI PURKEA johtaa väärään vastaukseen yli 30 % ajasta. "

" Sarakkeen summilla on merkitystä ", sanoin.

" Rivillä on merkitystä ", Bayesia sanoi.

"Näen, että olemme umpikujassa", sanoin. "Olemme molemmat oikeassa tekemissämme matemaattisissa lausunnoissa, mutta olemme eri mieltä sopivasta tavasta epävarmuuden kvantifioimiseksi."

"Se on totta", sisareni sanoi. "Haluatko evästeen?"

Hyvä vastaus - vain yksi pieni piste, sanot ".... Sen sijaan, että sanoisit, että parametrilla on yksi tosi arvo, Bayesin menetelmä sanoo, että arvo valitaan jostakin todennäköisyysjakaumasta ....." Tämä ei ole totta. Bayesilainen sopii todennäköisyysjakaumaan ilmaisemaan epävarmuutta todellisesta, tuntemattomasta, kiinteästä arvosta. Tämä kertoo mitkä arvot ovat uskottavia, kun otetaan huomioon se, mikä tiedettiin ennen tietojen tarkkailua. Todellinen todennäköisyyslauseke on $ Pr [\ theta_0 \ in (\ theta, \ theta + d \ theta) | I] $, jossa $ \ theta_0 $ on todellinen arvo ja $ \ theta $ oletettu, tietojen perusteella $ I $.
... jatkuu ... mutta on paljon helpompaa kirjoittaa vain $ p (\ theta) $, ymmärtämällä mitä se tarkoittaa "taustalla". Tämä voi selvästi aiheuttaa paljon sekaannusta.
anteeksi tämän super vanhan viestin elvyttämisestä, mutta nopea kysymys, osastossasi, jossa usein esiintyvä asiantuntija kritisoi Bayesin lähestymistapaa, sanot: "Entä jos todellinen arvo on esimerkiksi 0,37? Jos se on, niin sinun menetelmäsi, suorita alku loppuun, tulee olemaan VÄÄRIN 75% ajasta. " Kuinka sait nuo numerot? miten 0,37 vastaa 75% väärää? Onko tämä pois jonkin tyyppisestä todennäköisyyskäyrästä? Kiitos
Upea kuva! Kuinka suklaa-sirumallin luottamusvälit ja uskottavuusvälit mukautettaisiin, jos voimme ottaa näytteestä n evästettä purkista? Ja voimmeko arvioida näiden kahden lähestymistavan tarkkuuden keräämällä tietoja suhteellisesta taajuudesta. toimitetuista purkeista? Oletan, että Bayesin lähestymistapa antaa parempia ennusteita, kun olemme melko varmoja aikaisemmasta jakelusta (sanotaan ~ 30 toimituksen jälkeen?). Mutta jos edellinen dbn muuttuisi äkillisesti (sanotaan, että uusi toimittaja ottaa tehtävän), niin freententistisellä lähestymistavalla olisi etu.
@BYS2, kun kirjoittaja sanoo, että "" Entä jos todellinen arvo on, esimerkiksi, 0,37? Jos se on, niin menetelmäsi, suorita alusta loppuun, on VÄÄRIN 75% ajasta ", he vain antavat esimerkkinumeroitakeksitty.Tässä nimenomaisessa tapauksessa ne viittaavat johonkin aikaisempaan jakaumaan, jonka arvo oli erittäin matala, 0,37, ja suurin osa sen todennäköisyystiheydestä muualla.Ja oletamme, että esimerkkijakaumamme toimisi hyvin huonosti, kun parametrin todellinen arvo sattuu olemaan 0,37, samalla tavalla kuin Bayesian uskottavuusvälit epäonnistuivat, kun purkki sattui olemaan tyyppi B.
Kirjoittaja sanoo "" odotat 80 robotin saavan väärän vastauksen, joista jokaisella on> 73% uskoa sen virheelliseen johtopäätökseen! ", Mutta tämän olisi pitänyt olla> 72%: n uskoa, koska 72% on vähimmäisvaatimususkottavuus luotettavuusvälien taulukossa.
#2
+39
user28
2010-09-01 21:01:43 UTC
view on stackexchange narkive permalink

Käsitykseni on seuraava:

Tausta

Oletetaan, että sinulla on joitain tietoja $ x $ ja yrität arvioida $ \ theta $ . Sinulla on tietojen tuottamisprosessi, joka kuvaa, kuinka $ x $ luodaan ehdolla $ \ theta $. Toisin sanoen tiedät $ x $: n (esimerkiksi $ f (x | \ theta) $) jakauman.

Päätösongelma

Päätösongelmasi on: Mitkä $ \ theta $ -arvot ovat kohtuullisia, kun otetaan huomioon havaitut tiedot $ x $?

Luottamusvälit

Luottamusvälit ovat klassinen vastaus Yllä oleva ongelma. Oletat, että tässä lähestymistavassa on tosi, kiinteä arvo $ \ theta $. Tämän oletuksen perusteella voit käyttää arvoa $ x $ saadaksesi arvion $ \ theta $ (esimerkiksi $ \ hat {\ theta} $). Kun olet saanut arvion, haluat arvioida, missä todellinen arvo on suhteessa arvioosi.

Huomaa, että tässä lähestymistavassa todellinen arvo on ei satunnainen muuttuja. Se on kiinteä mutta tuntematon määrä. Sitä vastoin arvio on satunnaismuuttuja, koska se riippuu tiedoistasi $ x $, joka on luotu tiedoistasi Näin ollen huomaat, että saat erilaisia ​​arvioita joka kerta, kun toistat tutkimuksen.

Yllä oleva ymmärrys johtaa seuraavaan menetelmään arvioidaksesi, missä todellinen parametri on suhteessa arvioosi. Määritä intervalli $ I \ equiv [lb (x), ub (x)] $ seuraavalla ominaisuudella:

$ P (\ theta \ in I) = 0,95 $

Edellä mainitulla tavalla muodostettua aikaväliä kutsutaan luottamusväliksi. Koska todellinen arvo on tuntematon, mutta kiinteä, todellinen arvo on joko aikavälillä tai sen ulkopuolella. Luottamusväli on tällöin lausunto todennäköisyydestä, että saamallamme aikavälillä on todellinen parametriarvo. Todennäköisyyslauseke koskee siis intervallia (ts. Todennäköisyyttä, jolla intervallilla on todellinen arvo tai ei) eikä todellisen parametriarvon sijaintia.

Tässä paradigmassa on merkityksetöntä puhua todennäköisyydestä, että todellinen arvo on pienempi tai suurempi kuin jokin arvo, koska todellinen arvo ei ole satunnaismuuttuja.

Luotettavat intervallit

Päinvastoin kuin perinteisessä lähestymistavassa, oletamme bayesilaisessa lähestymistavassa, että todellinen arvo on satunnaismuuttuja. Siksi sieppaamme epävarmuutemme todellisen parametriarvon suhteen asettamalla edellisen jakauman tosi parametrivektorille (esimerkiksi $ f (\ theta) $).

Rakentamalla takareunan lauseen takaosan jakauma parametrivektorille sekoittamalla priori ja meillä olevat tiedot (lyhyesti takana on $ f (\ theta | -) \ propto f (\ theta) f (x | \ theta) $).

Saavumme sitten piste-estimaattiin käyttämällä takajakaumaa (esimerkiksi käytä takajakauman keskiarvoa). Koska tässä paradigmassa todellinen parametrivektori on satunnainen muuttuja, haluamme myös tietää pisteestimaatissamme olevan epävarmuuden laajuuden. Siksi rakennetaan väli, jolla on seuraavat ehdot:

$ P (l (\ theta) \ le {\ theta} \ le ub (\ theta)) = 0,95 $

Yllä oleva on uskottava väli.

  • Yhteenveto

    Luotettavat välit keräävät nykyisen epävarmuutemme parametriarvojen sijainnissa ja voidaan siten tulkita todennäköisyydelliseksi lausunnoksi parametrista.

    Sen sijaan luottamusvälit kaappaavat epävarmuuden saamastamme intervallista (ts. sisältääkö se todellisen arvon vai ei). Siksi niitä ei voida tulkita todennäköisyyslausekkeena todellisista parametriarvoista.

  • 95 prosentin luottamusväli määritelmän mukaan kattaa todellisen parametriarvon 95 prosentissa tapauksista, kuten oikein ilmoitit. Siten mahdollisuus, että aikaväli kattaa todellisen parametriarvon, on 95%. Voit joskus sanoa jotain mahdollisuudesta, että parametri on suurempi tai pienempi kuin mikä tahansa raja, perustuen oletuksiin, jotka teet aikaväliä muodostettaessa (melko usein arvion normaalijakauma). Voit laskea P (theta> ub) tai P (ub
    Joris, en voi olla samaa mieltä. Kyllä, millä tahansa parametrin arvolla on> 95% todennäköisyys, että tuloksena oleva intervalli peittää todellisen arvon. Tämä ei tarkoita sitä, että tietyn havainnon tekemisen ja intervallin laskemisen jälkeen ehdollinen todennäköisyys on edelleen 95%, kun otetaan huomioon, että THAT-väli kattaa todellisen arvon.Kuten sanoin alla, muodollisesti olisi täysin hyväksyttävää, että luottamusväli sylkeä ulos [0, 1] 95% ajasta ja tyhjä joukko loput 5%. Jos sinulla on tyhjä joukko intervallina, totta arvo ei ole 95%!
    @ Keith: Näen mielipiteesi, vaikka tyhjä joukko ei olekaan määritelmän mukainen väli. Luottamusvälin todennäköisyys ei myöskään ole ehdollinen tiedoille, päinvastoin. Jokainen luottamusväli tulee eri satunnaisotoksesta, joten mahdollisuus, että otos vedetään siten, että 95%: n luottamusväli, johon se perustuu, ei kata todellista parametriarvoa, on vain 5% tiedoista riippumatta.
    Joris, käytin "data" synonyyminä "näyte", joten luulen, että olemme samaa mieltä. Huomautukseni on, että otoksen ottamisen jälkeen on mahdollista olla tilanteissa, joissa voit todistaa ehdottomasti, että aikaväli on väärä - että se ei kata todellista arvoa. Tämä ei tarkoita, että se ei ole kelvollinen 95%: n luottamusväli. Joten et voi sanoa, että luotettavuusparametri (95%) kertoo sinulle tietyn aikavälin kattavuuden todennäköisyydestä kokeilun jälkeen ja sain välin. Vain a posteriori -todennäköisyys, jonka ennalta ilmoittanut, voi puhua siitä.
    @ Keith: Näen mielesi. Joten Bayesin lähestymistavassa otan diffuusin ennen saman intervallin muodostamista ja kutsun sitä uskottavaksi intervalliksi. Jos voin todeta frekvenssiläisessä lähestymistavassa, että voin todistaa täysin varmuudella, että väli on väärä, olen joko rikkonut oletuksia tai tiedän todellisen arvon. Kummassakin tapauksessa 95%: n luottamusväli ei ole enää voimassa. Mukana olevat olettamukset viittaavat hajautettuun prioriin eli täydelliseen tiedon puutteeseen todellisesta parametrista. Jos minulla on ennakkotietoa, en pitäisi laskea luottamusväliä.
    Ei, pelkään, ettet ole vieläkään saanut sitä. Kummassakaan tapauksessa ei vaadita "diffuusioprioriteettia". Luottamusvälin laskeminen on hienoa, onko sinulla ennakkotietoa vai ei - asia on, että luottamusväli ei välitä. Luottamusväli takaa sen kattavuuden todennäköisyyden ehdottomasti, jopa pahimmassa tapauksessa. Se ei ole "sama aikaväli" kuin uskottavuusväli, jonka edunsaaja on ilmoittanut, ainakaan yleensä.
    Ja kuten sanoin, muodollisesti on täysin hyväksyttävää, että kokeesi lopussa saavutat tietyn luottamusvälin, jonka pystyt osoittamaan, että se ei kata todellista arvoa. Tämä EI tarkoita, että aikaväli oli virheellinen tai että se ei ole 95%: n luottamusväli. Tietysti, jos teet saman kokeen uudelleen 100 kertaa, sinun on odotettava saavan tällainen hölynpölyä vähemmän kuin viisi kertaa, mutta se tosiasia, että saat todistettavaa hölynpölyä 5% ajoista, on muodollisesti okei niin kauan kuin luottamusväli kattaa arvostaa muita 95% tuloksista.
    Ja transponointi on totta uskottavuusvälillä - on täysin hyväksyttävää, että parametrin arvot tuottavat aina väärän uskottavuusvälin! Kuvittele pussi, joka sisältää biljoonaa painotettua kolikkoa - joista yhden pään todennäköisyys on 10%, ja loput ovat kohtuullisia kolikoita. Kokeilusi on: vedä kolikko tästä jakaumasta, käännä se kymmenen kertaa, laske erillinen päiden määrä ja ilmoita sitten 95%: n uskottava väli pään probissa. Jos saat "10%" kolikon, väli epäonnistuu aina. Jälleen, ei tee siitä virheellistä.
    Eräässä Jaynesin julkaisuistahttp: //bayes.wustl.edu/etj/articles/confidence.pdfHän rakentaa luottamusvälin ja osoittaa sitten, että tietylle näytteelle voit olla 100% varma, että todellinen arvo ei ole "luottamus" väli ". Tämä ei tarkoita sitä, että luottoluokituslaitos on "väärä", vaan vain, että taajuusmuuttajan luottamusväli ei ole vastaus kysymykseen "mikä on väli, joka sisältää tilastojen todellisen arvon todennäköisyydellä 95%". Valitettavasti tämä on kysymys, jonka haluamme kysyä, minkä vuoksi luottoluokitusta tulkitaan usein ikään kuin se olisi vastaus kysymykseen. :-(
    @Keith: En saa sitä. Jos tarkoitat, että 10% kolikko antaa pään vain 1 10 kertaa, ja päädyt 0 päähän, et voi laskea luottamusväliä. Jos sinulla on yksi pää kymmenestä kertaa, intervallisi ei todellakaan kata 50%. Mutta en koskaan väittänyt, että se olisi katettu. Väitin ​​vain, että on epätodennäköistä, että se ei kata. En tiedä todellista arvoa. Lisäksi kaikilla CI: llä (Wald, pisteet, Pearson, ...) on huono kattavuus todennäköisyysavaruuden reunoilla, ehdottomasti vain 10 tapausta. Joten en sanoisi mitään kyseisen CI: n perusteella. Voisin käyttää johtopäätöstä todennäköisyyslaskennalla. Kuten Bayes teki.
    @Keith: mutta sain mielipiteesi - todellinen arvo ei ole satunnainen muuttuja - olen samaa mieltä. Minun mokani.
    Joris, viimeinen kommenttini koski "95% uskottavaa väliä" - ei luottamusväliä! Jos sinulla on pussi yhden biljoonan reilun kolikon ja yhden 10%: n päähän kolikon kanssa, ja kokeesi on vedä kolikko tasaisesti satunnaisesti pussista, käännä se kymmenen kertaa ja ilmoita sitten uskottavuusväli pään todennäköisyydessä, uskottavuusväli on aina [0,5, 0,5] riippumatta siitä. Joten jos satut piirtämään epäreilua kolikkoa, uskottavuusväli on aina väärä.
    En myöskään voi olla samaa mieltä siitä, että "kaikilla CI: llä" on huono peitto reunoilla. Tarkka CI ja jotkut likimääräiset CI: t takaavat, että peitto on aina suurempi kuin luotettavuusparametri (esim. 95%), jopa pahimmassa tapauksessa. Tämä pätee Blyth-Still-Casella- ja Clopper-Pearson-väleihin osittain.
    -1
    @svadalli - Bayesin lähestymistapa ei ole sitä mieltä, että $ \ theta $ * on satunnainen *. Jakelu ei ole $ \ theta $ ($ \ theta $ on kiinteä, mutta tuntematon), se on * epävarmuus * $ \ theta $ *: sta, joka on jaettu, riippuen tietämyksestä * $ \ theta $. Todellinen todennäköisyyslauseke, jonka $ f (\ theta) $ sieppaa, on $ Pr (\ theta \ text {on aikavälillä} (\ theta, \ theta + d \ theta) | I) = f (\ theta) d \ theta $. Itse asiassa täsmälleen sama argumentti pätee dollariin $ X, myös sitä voidaan pitää kiinteänä, mutta tuntemattomana.
    #3
    +13
    Thylacoleo
    2010-09-04 15:22:20 UTC
    view on stackexchange narkive permalink

    En ole samaa mieltä Srikantin vastauksen kanssa yhdestä peruskysymyksestä. Srikant totesi tämän:

    "Päätösongelma: Päätösongelmasi on: Mitkä values: n arvot ovat kohtuullisia, kun otetaan huomioon havaitut tiedot x?"

    Itse asiassa tämä on BAYESIAN INFERENCE-ONGELMA. Bayesin tilastoissa pyrimme laskemaan P (θ | x), ts. Parametriarvon todennäköisyyden, kun havaitut tiedot (näyte) annetaan. LUOTETTAVA VÄLI on interval-väli, jolla on 95% mahdollisuus (tai muu) sisällyttää the: n todellinen arvo, kun otetaan huomioon monet ongelman taustalla olevat oletukset.

    TAAJUUSTIEDOTEEN LIITTYVÄ ONGELMA on tämä:

    Ovatko havaitut tiedot x kohtuulliset, kun otetaan huomioon oletetut of-arvot?

    Yleisön tilastotieteellisissä tilastoissa pyrimme laskemaan P (x | θ), ts. todennäköisyyden tarkkailla tietoja (otos) oletettujen parametriarvojen perusteella. LUOTTAMUKSEN INTERVALTI (ehkä väärä nimi) tulkitaan seuraavasti: jos satunnaisotoksen x tuottanut koe toistettaisiin monta kertaa, 95% (tai muu) näistä satunnaisotoksista muodostetuista väleistä sisältäisi parametrin todellisen arvon.

    sotkea päätäsi? Se on usein esiintyvien tilastojen ongelma ja tärkein asia Bayesin tilastoissa.

    Kuten Sikrant huomauttaa, P (θ | x) ja P (x | θ) liittyvät toisiinsa seuraavasti:

    P (θ | x) = P (θ) P (x | θ)

    Missä P (θ) on aikaisempi todennäköisyytemme; P (x | θ) on datan todennäköisyys, joka on ehdollinen kyseiselle priorille, ja P (θ | x) on takimmainen todennäköisyys. Aikaisempi P (θ) on luonnostaan ​​subjektiivinen, mutta se on maailmankaikkeutta koskevan tiedon hinta - hyvin syvällisessä mielessä.

    Sekä Sikrantin että Keithin vastaukset ovat erinomaisia.

    Teknisesti olet oikeassa, mutta huomaa, että luottamusväli antaa joukon parametriarvoja, joille nollahypoteesi on totta. Siten "ovatko havaitut tiedot x kohtuulliset, kun otetaan huomioon hypoteesi teetasta?" voidaan muotoilla uudelleen seuraavasti: "Mitkä todelliset teeta-arvot olisivat yhteensopiva hypoteesi, kun otetaan huomioon havaitut tiedot x?" Huomaa, että uudelleen muotoiltu kysymys ei välttämättä tarkoita, että teeta oletetaan olevan satunnaismuuttuja. Uudelleen muotoiltu kysymys hyödyntää sitä, että teemme nollahypoteesitestejä tarkastamalla, putoako oletettu arvo luottamusväliin.
    @svadali - luottamusvälit arvioivat * tietoja * kiinteälle hypoteesille. Jos siis muutat yhtälön "kiinteää" osaa, jos et ota huomioon hypoteesin todennäköisyyttä ennen tietojesi tarkkailua, sinun on ehdottomasti keksittävä epäjohdonmukaisuuksia ja epäjohdonmukaisia ​​tuloksia. Ehdollista todennäköisyyttä ei "rajoiteta" olosuhteita muutettaessa (esim. Muuttamalla ehtoja voit muuttaa ehdollisen todennäköisyyden 0: sta 1: een). Aikaisempi todennäköisyys ottaa huomioon tämän mielivaltaisuuden. Ehdollistaminen X: lle tapahtuu, koska olemme varmoja, että X on tapahtunut - havaitsimme X: n!
    #4
    +13
    suncoolsu
    2010-09-16 14:35:44 UTC
    view on stackexchange narkive permalink

    Aiemmin annetut vastaukset ovat erittäin hyödyllisiä ja yksityiskohtaisia. Tässä on 0,25 dollaria.

    Luottamusväli (CI) on käsite, joka perustuu todennäköisyyden klassiseen määritelmään (jota kutsutaan myös "Frequentist-määritelmäksi"), että todennäköisyys on kuin suhde ja perustuu Kolmogrovin aksiomaattiseen järjestelmään. (ja muut).

    Uskottavien intervallien (korkein takimmainen tiheys, HPD) voidaan katsoa johtuvan päätöksentekoteoriasta, joka perustuu Waldin ja de Finettin töihin (ja joita muut ovat laajentaneet paljon). p> Koska tämän säikeen ihmiset ovat tehneet hienoa työtä esimerkkien ja hypoteesien erojen esittämisessä Bayesin ja usein esiintyvässä tapauksessa, korostan vain muutamia tärkeitä seikkoja.

    1. CI: t perustuvat siihen, että päätelmä on tehtävä kaikista kokeiden mahdollisista toistoista, jotka voidaan nähdä ja EI vain havainnoiduista tiedoista, joissa asHPD: t perustuvat TÄYDELLISESTI havaittuihin tietoihin (ja obv. Aikaisempiin oletuksiimme).

    2. CI: t eivät yleensä ole johdonmukaisia ​​(selitetään myöhemmin), missä HPD: t ovat johdonmukaisia ​​(johtuen juuristaan ​​päätöksentekoteoriassa). Johdonmukaisuus (kuten selitän isoäidilleni) tarkoittaa sitä, että parametriarvolle on annettu vedonlyöntiongelma, jos klassinen tilastotieteilijä (kanta-asiakas) lyö vetoa CI: stä ja bayesiläinen veto HPD: stä, taajuusmies ON KIINNITETTÄVÄ menettää (lukuun ottamatta triviaalia tapausta) kun HPD = CI). Lyhyesti sanottuna, jos haluat tiivistää kokeesi havainnot todennäköisyydeksi tietojen perusteella, todennäköisyyden PITÄÄ olla posteriorinen todennäköisyys (perustuu aikaisempaan). On olemassa lause (vrt. Heath and Sudderth, Annals of Statistics, 1978), joka (karkeasti) sanoo: Todennäköisyyden määrittäminen tietojen perusteella $ \ theta $ ei tee varma häviäjä vain ja vain, jos se saadaan bayesiläisellä tavalla.

    3. Koska luottoluokituslaitokset eivät ole riippuvaisia ​​havaitusta tiedosta (jota kutsutaan myös nimellä "ehdollisuuden periaate" CP), voi olla paradoksaalisia esimerkkejä. Fisher oli suuri CP: n kannattaja ja löysi myös paljon paradoksaalisia esimerkkejä, kun tätä EI noudatettu (kuten CI: n tapauksessa). Tästä syystä hän käytti p-arvoja päättelyyn, toisin kuin CI. Hänen mielestään p-arvot perustuivat havaittuihin tietoihin (paljon voidaan sanoa p-arvoista, mutta tässä ei ole kyse painopisteestä). Kaksi hyvin tunnettua paradoksaalista esimerkkiä ovat: (4 ja 5)

    4. Coxin esimerkki (Annals of Math. Stat., 1958): $ X_i \ sim \ mathcal {N} (\ mu, \ sigma ^ 2) $ (iid) kohteelle $ i \ muodossa \ {1, \ pisteet, n \} $ ja haluamme arvioida $ \ mu $ . $ n $ EI OLE kiinteä ja valitaan heittämällä kolikkoa. Jos kolikonheiton tuloksena on H, valitaan 2, muuten valitaan 1000. "Terveen järjen" arvio - otoskeskiarvo on puolueeton arvio, jonka varianssi on $ 0,5 \ sigma ^ 2 + 0,0005 \ sigma ^ 2 $ . Mitä käytämme otoksen keskiarvona, kun $ n = 1000 $ ? Eikö ole parempi (tai järkevämpää) käyttää otoksen keskiarvon estimaattorin varianssia $ 0,001 \ sigma ^ 2 $ (ehdollinen varianssi) estimaattorin todellisen varianssin sijaan , mikä on valtava! ( $ 0.5 \ sigma ^ 2 + 0.0005 \ sigma ^ 2 $ ). Tämä on yksinkertainen kuvaus CP: stä, kun käytämme varianssia $ 0,001 \ sigma ^ 2 $ , kun $ n = 1000 $ . $ n $ itsenäisellä ei ole merkitystä tai ei ole tietoja $ \ mu $ ja $ \ sigma $ (ts. $ n $ on heille liitännäinen), mutta ANTI arvonsa, tiedät paljon" laadusta " ". Tämä liittyy suoraan CI: hen, koska niihin liittyy varianssi, jota ei pitäisi ehdollistaa $ n $ : lla, eli käytämme suurempaa varianssia, siis yli konservatiivisen.

    5. Welchin esimerkki: Tämä esimerkki toimii kaikilla $ n $ -malleilla, mutta otamme $ n = 2 $ yksinkertaisuuden vuoksi. $ X_1, X_2 \ sim \ mathcal {U} (\ theta - 1/2, \ theta +1/2) $ (iid), $ \ theta $ kuuluu Real-riviin. Tämä tarkoittaa $ X_1 - \ theta \ sim \ mathcal {U} (- 1/2, 1/2) $ (iid). $ \ frac {1} {2} (X_1 + X_2) {\ bar x} - \ theta $ (huomaa, että tämä EI ole tilasto) on jakelusta riippumaton / $ \ theta $ . Voimme valita $ c > 0 $ s.t. $ \ text {Prob} _ \ theta (-c < = {\ bar x} - \ theta < = c) = 1- \ alfa (\ noin 99 \%) $ , mikä tarkoittaa, että $ ({\ bar x} - c, {\ bar x} + c) $ on $ \ theta $ . Tämän CI: n tulkinta on: jos otamme toistuvasti näytteitä, saamme eri $ {\ bar x} $ ja 99% (ainakin) kertaa sen sisältävän true span class = "math-container"> $ \ theta $ , MUTTA (huoneessa oleva norsu) annetuille tiedoille, emme tiedä todennäköisyyttä, että CI sisältää true $ \ theta $ . Harkitse nyt seuraavia tietoja: $ X_1 = 0 $ ja $ X_2 = 1 $ , kuten $ | X_1 - X_2 | = 1 $ , tiedämme varmasti, että väli $ (X_1, X_2) $ sisältää $ \ theta $ (yksi mahdollinen kritiikki, $ \ text {Prob} (| X_1 - X_2 | = 1) = 0 $ , mutta voimme hoitaa sen matemaattisesti, enkä keskustele siitä). Tämä esimerkki kuvaa myös koherenssin käsitettä kauniisti. Jos olet klassinen tilastotieteilijä, lyöt varmasti vetoa 99%: n luottamusvälistä tarkastelematta $ | X_1 - X_2 | $ arvoa (olettaen, että olet uskollinen ammatti). Bayesilainen lyö vetoa CI: stä vain, jos $ | X_1 - X_2 | $ arvo on lähellä arvoa 1. Jos ehtomme $ | X_1 - X_2 | $ , väli on johdonmukainen, eikä pelaaja enää ole varma häviäjä (samanlainen kuin Heathin ja Sudderthin lause).

    6. Fisherilla oli suositus tällaisiin ongelmiin - käytä CP: tä. Welchin esimerkkinä Fisher ehdotti ehtona $ X_2-X_1 $ . Kuten näemme, $ X_2-X_1 $ on liitännäinen $ \ theta $ : lle, mutta se antaa tietoja teeta. Jos $ X_2-X_1 $ on Pieni, $ \ theta $ : sta ei ole paljon tietoa tiedot. Jos $ X_2-X_1 $ on SUURI, kohdassa $ \ theta $ on paljon tietoa tiedot. Fisher laajensi aputilaston ehdollistamisstrategiaa yleiseen teoriaan nimeltä Fiducial Inference (kutsutaan myös hänen suurimmaksi epäonnistumiseksi, vrt. Zabell, Stat. Sci. 1992), mutta siitä ei tullut suosittua yleisyyden ja joustavuuden puute. Fisher yritti löytää tavan, joka poikkeaa sekä klassisesta tilastosta (Neyman-koulusta) että bayesilaisesta koulusta (tästä kuuluisa sanonta Savagelta: "Fisher halusi tehdä Bayesin munakas (ts. Käyttäen CP) rikkomatta Bayesin munia") . Folklore (ei todisteita) sanoo: Fisher hyökkäsi keskusteluissa Neymaniin (tyypin I ja II virheiden ja CI: n vuoksi) kutsumalla häntä laadunvalvontamieheksi eikä tutkijaksi , Koska Neymanin menetelmät eivät olleet riippuvaisia ​​havaitusta tiedosta, tarkasteltiin sen sijaan kaikkia mahdollisia toistoja.

    7. Tilastotieteilijät haluavat käyttää CP: n lisäksi myös riittävyysperiaatetta (SP). Mutta SP ja CP tarkoittavat yhdessä todennäköisyyden periaatetta (vrt. Birnbaum, JASA, 1962) eli kun otetaan huomioon CP ja SP, on jätettävä huomiotta näytetila ja tarkasteltava vain todennäköisyysfunktiota. Siksi meidän on tarkasteltava vain annettuja tietoja ja EI koko näytetilaa (koko näytetilan tarkastelu on tavallaan samanlainen kuin toistuva näytteenotto). Tämä on johtanut sellaiseen käsitteeseen kuin Observed Fisher Information (vrt. Efron ja Hinkley, AS, 1978), jotka mittaavat dataa koskevia tietoja gyakorismin näkökulmasta. Tietojen tietomäärä on Bayesin käsite (ja liittyy siten HPD: hen) CI: n sijaan.

    8. Kiefer teki jonkin verran perustyötä CI: n suhteen 1970-luvun lopulla, mutta hänen laajennuksistaan ​​ei ole tullut suosittuja. Hyvä lähde on Berger ("Voisiko Fisher, Neyman ja Jeffreys sopia hypoteesien testaamisesta", Stat Sci, 2003).


    Yhteenveto:

    (Kuten Srikant ja muut huomauttavat)
    CI: itä ei voida tulkita todennäköisyydeksi, eivätkä ne kerro mitään tuntemattomasta parametrista ANNA havaitut tiedot. CI: t ovat lausuntoja toistuvista kokeista.

    HPD ovat todennäköisyyksien välejä, jotka perustuvat tuntemattoman parametrin takajakaumaan, ja niillä on todennäköisyyksiin perustuva tulkinta annettujen tietojen perusteella.

    Frequentist-ominaisuus (toistuva näytteenotto) on toivottava ominaisuus, ja molemmilla on myös HPD: t (sopivilla prioreilla) ja CI: llä. HPD: n ehdot täyttävät annetut tiedot myös vastaamalla tuntemattomasta parametrista esitettyihin kysymyksiin.

    (Tavoite EI ole subjektiivinen) Bayesilaiset ovat yhtä mieltä klassisten tilastojen kanssa siitä, että parametrilla on yksi TOSI-arvo. Ne kuitenkin eroavat toisistaan ​​siinä, miten he päättelevät tosi parametrin.

    Bayesin HPD: t tarjoavat meille hyvän tavan hoitaa tietoja, mutta jos he eivät hyväksy CI: n usein esiintyviä ominaisuuksia, ne eivät ole kovin hyödyllisiä (analogia: henkilö, joka käyttää HPD: tä (joillakin aikaisemmilla) ilman hyvää usein esiintyvää ominaisuutta , on varmasti tuomittu kuin puuseppä, joka välittää vain vasarasta ja unohtaa ruuvimeisselin)

    Olen vihdoin nähnyt ihmisiä tässä säikeessä (Dr.Jorisin kommentit: ". ..olettamukset tarkoittavat hajautunutta prioria, ts. täydellisen tiedon puutetta todellisesta parametrista. ") puhuminen tiedon puutteesta todellisesta parametrista, joka vastaa diffuusin priorin käyttöä. En tiedä, voinko hyväksyä lausunnon (tohtori Keith on samaa mieltä kanssani). Esimerkiksi lineaaristen perusmallien tapauksessa jotkut jakaumat voidaan saada käyttämällä yhtenäistä prioria (jota jotkut ihmiset kutsuivat diffuusiksi), MUTTA se EI tarkoita, että tasaista jakaumaa voidaan pitää MATALAN TIEDON ENNEN. Yleensä ei-informatiivinen (tavoite) priori ei tarkoita, että sillä olisi vähän tietoa parametrista.



    Huomaa: Monet näistä pisteistä perustuvat yhden merkittävän bayesilaisen luennoista. Olen edelleen opiskelija ja voisin ymmärtää häntä väärin jollakin tavalla. Hyväksy anteeksipyyntöni etukäteen.

    "usein esiintyvä on menettämässä rajoja" Tarkasteltaessa eniten äänestettyä vastausta oletan, että tämä riippuu apuohjelmatoiminnosta (esim. ei, jos valitettavasti optimointi on käynnissä).Intuitiivisesti se voi riippua myös kyvystä määrittää aikaisempi toiminto ...
    "taajuusmuuttaja ON KIINNITTÄMÄ menettää" ... * edellyttää, että hänellä on asianmukainen etukäteen * (mikä ei yleensä ole niin helppoa).Täydellinen esimerkki: uhkapeliriippuvaiset ovat 99% varmoja, että heidän onnensa muuttuu tällä kertaa.Ne, jotka sisällyttävät tämän ennen päätöksentekoanalyysiin, eivät yleensä tee niin hyvin pitkällä aikavälillä.
    Mielestäni sinun ei pitäisi lyhentää luottamusvälejä * luottoluokituksina * vastauksessa luotettavien ja luottamusvälien väliseen eroon.
    #5
    +10
    probabilityislogic
    2011-06-14 21:37:11 UTC
    view on stackexchange narkive permalink

    Aina hauskaa harjoittaa vähän filosofiaa. Pidän aivan Keithin vastauksesta, mutta sanoisin kuitenkin, että hän on "herra unohdetun Bayesian" kannassa. Huono kattavuus tyypin B ja tyypin C kohdalla voi ilmetä vain, jos hän käyttää samaa todennäköisyysjakaumaa jokaisessa kokeessa ja kieltäytyy päivittämästä aikaisemmin.

    Näet tämän melko selvästi , tyypin A ja D purkit tekevät "tarkkoja ennusteita" niin sanotusti (0-1 ja 2-3 pelimerkille), kun taas tyypin B ja C purkit antavat periaatteessa tasaisen jakauman siruista. Joten toistettaessa kokeita kiinteällä "todellisella purkilla" (tai jos otamme näytteen toisesta keksistä), sirujen tasainen jakautuminen antaa todisteita tyypin B tai C purkeista.

    Ja "käytännön" "näkökulma, tyypit B ja C vaativat valtavan otoksen voidakseen erottaa toisistaan. Kahden jakauman KL-erot ovat $ KL (B || C) \ noin 0,006 \ noin KL (C || B) $. Tämä on divergenssi, joka vastaa kahta normaalijakaumaa sekä varianssilla $ 1 $ että erolla $ \ sqrt {2 \ kertaa 0,006} = 0,11 $. Joten meidän ei voida odottaa pystyvän erottamaan yhden otoksen perusteella (normaalissa tapauksessa tarvitsemme noin 320 otoskokoa tämän eron havaitsemiseksi 5%: n merkitsevyystasolla). Joten voimme perustellusti romahtaa tyypit B ja C yhdessä, kunnes meillä on tarpeeksi iso näyte.

    Mitä tapahtuu näille uskottaville väleille? Meillä on nyt 100% kattavuus "B tai C"! Entä usein esiintyvät intervallit? Kattavuus on muuttumaton, koska kaikki välit sisälsivät sekä B: n että C: n tai kumpikaan, joten sitä kritisoidaan edelleen Keithin vastauksessa - 59% ja 0% havaituista 3 ja 0 pelimerkistä.

    Mutta olkaamme tässä käytännöllisiä. Jos optimoit jotain yhden toiminnon suhteen, sen ei voida odottaa toimivan hyvin eri toiminnossa. Sekä taajuus- että bayesialaiset intervallit saavuttavat kuitenkin keskimääräisen halutun uskottavuus- ja luotettavuustason. Meillä on $ (0 + 99 + 99 + 59 + 99) /5=71.2 $ - joten taajuusmuuttajalla on keskimääräinen uskottavuus. Meillä on myös $ (98 + 60 + 66 + 97) /4=80.3 $ - bayesilaisella on asianmukainen keskimääräinen kattavuus.

    Toinen asia, jonka haluan korostaa, on se, että Bayesian ei sano, että " parametri on satunnainen "määrittämällä todennäköisyysjakauma. Bayesin (hyvin, ainakin minulle joka tapauksessa) todennäköisyysjakauma on kuvaus siitä, mitä tiedetään kyseisestä parametrista. Käsitettä "satunnaisuus" ei oikeastaan ​​ole Bayesin teoriassa, vain käsitteet "tietäminen" ja "ei tiedä". "Tunnetut" menevät olosuhteisiin, ja "tuntemattomat" laskemme todennäköisyydet, jos kiinnostavat, ja syrjäytymme, jos haittoja. Joten uskottava väli kuvaa sitä, mikä tiedetään kiinteästä parametrista, keskiarvo verrattuna siihen, mitä siitä ei tiedetä. Joten jos ottaisimme evästepakkauksen pakanneen henkilön kannan ja tiesimme, että se on tyyppiä A, heidän uskottavuusväli olisi vain [A] näytteestä riippumatta riippumatta siitä, kuinka monta näytettä otettiin. Ja ne olisivat 100% tarkkoja!

    Luottamusväli perustuu "satunnaisuuteen" tai vaihteluun, joka esiintyy eri mahdollisissa näytteissä. Sellaisenaan ainoa vaihtelu, jonka he ottavat huomioon, on näytteessä oleva muunnelma. Joten luottamusväli ei ole muuttunut henkilölle, joka on pakannut evästepurkin ja uudeksi, että se on tyyppiä A. Joten jos piirrät keksi yhdellä sirulla A-tyypin purkista, taajuusmies väittää 70 prosentin varmuudella, että tyyppi oli ei A, vaikka he tietävätkin, että purkki on tyyppiä A! (jos he säilyttivät ideologiansa ja sivuuttivat terveen järjen) Huomaa, että näin on, huomaa, että mikään tässä tilanteessa ei ole muuttanut otosjakaumaa - olemme yksinkertaisesti ottaneet toisen henkilön näkökulman, jolla on "ei-dataan" perustuvia tietoja parametrista.

    Luottamus aikavälit muuttuvat vain, kun tiedot muuttuvat tai malli / otosjakauma muuttuu. uskottavuusvälit voivat muuttua, jos muu asiaankuuluva tieto otetaan huomioon.

    Huomaa, että tämä hullu käyttäytyminen ei todellakaan ole sitä, mitä luottamusvälien kannattaja todella tekisi; mutta se osoittaa heikkouden menetelmän taustalla olevassa filosofiassa tietyssä tapauksessa. Luottamusvälit toimivat parhaiten, kun et tiedä paljoakaan parametrista tietojoukossa olevien tietojen lisäksi. Lisäksi uskottavuusvälit eivät pysty parantamaan paljoakaan luottamusväleissä, ellei ole olemassa ennakkotietoja, joita luottamusväli ei voi ottaa huomioon, tai riittävien ja oheistilastojen löytäminen on vaikeaa.

    En voi sanoa, että ymmärsin Keithin selityksen purkkiesimerkistä, nopea kysymys: Toistan kokeen $ m $ kertaa, keräsin $ m $ erilaisia ​​näytteitä, joten nyt olen laskenut $ m $: n erilaiset CI: t (kullakin 95% luottamustaso), mikä nyt on CI? Tarkoittaako se, että 95% $ m $: n luottoluokituksista kattaa todellisen arvon?
    @loganecolss - tämä on totta, mutta vain rajana muodossa $ m \ to \ infty $. Tämä vastaa CI: iden taustalla olevaa "todennäköisyys" = "pitkän aikavälin taajuus" -tulkintaa.
    Kyllä, rajalla. Sitten yhdelle tai vain parille näytteelle CI: t eivät tarkoita mitään, eikö? Mitä hyötyä sitten on laskea CI, jos minulla ei ole tonnia näytteitä?
    @loganecolss - siksi olen bayesilainen.
    @probabilityislogic Tarkoittaako se, että paras on käyttää Bayesin lähestymistapaa, kun sitä ei tunneta (pienillä tiedoilla), ja Frequentist-lähestymistapaa, kun parhaita (/ nopeimpia?) Tuloksia ei tunneta (big data)?
    @nazka - eräänlainen.Sanoisin, että on aina parasta käyttää Bayesin lähestymistapaa riippumatta siitä, kuinka paljon tietoa sinulla on.Jos tämä voidaan hyvin arvioida commonist-menettelyllä, käytä sitä.Bayesian ei ole synonyymi hitaalle.
    @probabilityislogic Ok kiitos!(Kyllä tarkoitin olla nopeampi johtaa optimaaliseen ratkaisuun).Luin Quorasta, että jos verrataan Bayesin ja Frequentistin lähestymistapaa esimerkiksi Quicksortiin, Bayesin lähestymistapa johtaa optimaalisimpaan intervalliin ja Frequentist-lähestymistapa pahimpaan mahdolliseen intervalliin.Jos se on totta, mielestäni se on todella paras ja nopein tapa kuvata niitä.
    #6
    +7
    Dikran Marsupial
    2010-09-04 16:07:45 UTC
    view on stackexchange narkive permalink

    Ymmärtääkseni: Luotettava väli on lausunto kiinnostavan tilaston arvojen alueesta, joka on edelleen uskottava, kun otetaan huomioon tietyn otoksen tiedoista, jotka olemme todellisuudessa havainneet. Luottamusväli on lausunto tiheydestä, jolla todellinen arvo on luottamusvälillä, kun koe toistetaan useita kertoja, joka kerta eri otos tiedoilla samasta perusjoukosta.

    Tavallisesti kysymys, johon haluamme vastata, on "mitkä tilastojen arvot ovat yhdenmukaisia ​​havaitun datan kanssa", ja uskottava väli antaa suoran vastauksen kysymykseen - tilastojen todellinen arvo on 95 prosentin uskottava väli todennäköisyydellä 95%. Luottamusväli ei anna suoraa vastausta tähän kysymykseen; ei ole oikein väittää, että todennäköisyys, että tilastojen todellinen arvo on 95%: n luottamusvälillä, on 95% (ellei se sattuu osumaan uskottavan aikavälin kanssa). Tämä on kuitenkin hyvin yleinen väärinkäsitys frekvensistisen luottamusvälin suhteen, sillä tulkinta, joka olisi suora vastaus kysymykseen.

    Jaynen paperissa, josta keskustelen toisessa kysymyksessä, on hyvä esimerkki tästä ( esimerkki # 5), kun muodostetaan täysin oikea luottamusväli, jossa tietyn otoksen tietoihin, joihin se perustuu, suljetaan pois kaikki tilastojen todellisen arvon mahdollisuudet 95%: n luottamusvälillä! Tämä on ongelma vain, jos luottamusväli tulkitaan väärin tilastojen uskottavien arvojen lausekkeeksi havaitun otoksen perusteella.

    Päivän lopussa kysymys on "hevoset kursseille", ja mikä väli on paras, riippuu kysymyksestä, johon haluat vastata - valitse vain menetelmä, joka vastaa suoraan kysymykseen.

    Epäilen, että luottamusvälit ovat hyödyllisempiä analysoitaessa [suunniteltuja] toistettavia kokeita (koska se on vain oletus luottamusvälin taustalla), ja uskottavat aikavälit paremmin analysoitaessa havaintotietoja, mutta se on vain mielipide (käytän molempia lajikkeita) omassa työssäni, mutta en kuvaile itseäni kummankaan asiantuntijana).

    Toistuvien kokeiden luottamusväleillä on kysymys siitä, että jotta ne toimisivat, toistettavan kokeen olosuhteiden on pysyttävä ennallaan (ja kuka uskoisi niin?), Kun taas Bayesin aikaväli (jos sitä käytetään oikein) olosuhteissa havaitut tiedot ja antaa siten mahdollisuuden reaalimaailmassa tapahtuviin muutoksiin (tietojen kautta). Luulen, että Bayesin tilastojen * ehtosäännöt * tekevät siitä niin vaikean ylittävän (mielestäni on mahdotonta: vain vastaavuus voidaan saavuttaa), ja automaattinen koneisto, jonka se saavuttaa tämän, saa sen näyttämään niin liukkaalta.
    #7
    +4
    Chester Lin
    2013-07-03 11:14:54 UTC
    view on stackexchange narkive permalink

    Löysin paljon tulkintoja luottamusvälistä ja uskottavasta joukosta. Esimerkiksi luottamusväliä ei voida ilmaista tässä muodossa $ P (\ theta \ in CI) $. Jos tarkastelet tarkasti `` jakaumia '' frekvenssiläisen ja Bayesian johtopäätöksessä, näet Frequentistin teokset näytteiden jakamisesta tiedoissa, kun taas Bayesian työskentelee parametrin (taka) jakeluun. Ne on määritelty täysin erilaisessa näytetilassa ja Sigma Algebrassa.

    Joten kyllä, voit sanoa 'Jos toistat kokeen monta kertaa, noin 95% 95%: n luottamusvälineistä peittää todellisen parametrin'. Vaikka Bayesin kielellä saat sanoa, että 'tilastojen todellinen arvo on 95%: n uskottavalla aikavälillä todennäköisyydellä 95%', tämä 95%: n todennäköisyys (Bayesin kielellä) itsessään on vain arvio. (Muista, että se perustuu ehtojakaumaan, joka on annettu näille tiedoille, ei otosjakaumalle). Tämän estimaattorin tulee sisältää satunnaisotoksen aiheuttama satunnaisvirhe.

    Bayesilainen yrittää välttää tyypin I virheongelmia. Bayesilaiset sanovat aina, että ei ole järkevää puhua tyypin I virheistä Bayesianissa. Tämä ei ole täysin totta. Tilastotieteilijät haluavat aina mitata mahdollisuutta tai virhettä, jonka mukaan "tietosi suosittelevat sinua tekemään päätöksen, mutta väestö ehdottaa toisin". Tähän Bayesian ei voi vastata (yksityiskohdat jätetään pois tästä). Valitettavasti tämä voi olla tärkein asia, jonka tilastotieteilijän tulisi vastata. Tilastotieteilijät eivät vain ehdota päätöstä. Tilastotieteilijöiden tulisi myös pystyä käsittelemään, kuinka paljon päätös voi mennä pieleen.

    Minun on keksittävä seuraava taulukko ja termit käsitteen selittämiseksi. Toivottavasti tämä voi auttaa selittämään luottamusvälin ja uskottavan joukon eron.

    Huomaa, että takajakauma on $ P (\ theta_0 | Data_n) $, jossa $ \ theta_0 $ määritetään aiemmasta $ P (\ theta_0) $: sta. Usein esiintyvässä näytteenottojakauma on $ P (Data_n; \ theta) $. $ \ Hat {\ theta} $: n otosjakauma on $ P (\ hat {\ theta} _n; \ theta) $. Alaindeksi $ n $ on otoksen koko. Älä käytä notaatiota $ P (Data_n | \ theta) $ esitellessäsi näytteenottojakautumaa usein. Voit puhua satunnaisista tiedoista muodossa $ P (Data_n; \ theta) $ ja $ P (\ hat {\ theta} _n; \ theta) $, mutta et voi puhua satunnaisista tiedoista muodossa $ P (\ theta_0 | Data_n) $.

    Confidence Interval vs Credible Set

    '???????' selittää, miksi emme pysty arvioimaan tyypin I virhettä (tai vastaavaa) Bayesin kielellä.

    Huomaa myös, että luotettavia sarjoja voidaan käyttää luotettavuusvälien arvioimiseksi joissakin olosuhteissa. Tämä on kuitenkin vain matemaattinen lähentäminen. Tulkinnan tulisi mennä taiteilijan kanssa. Tässä tapauksessa Bayesin tulkinta ei enää toimi.


    Thylacoleo: n merkinnät $ P (x | \ theta) $: ssa eivät ole yleisiä. Tämä on edelleen Bayesian. Tämä merkintätapa aiheuttaa perustavanlaatuisen ongelman mittateoriassa puhuttaessa taajuuskamppailijoista.

    Olen samaa mieltä Dikran Marsupialin tekemän johtopäätöksen kanssa. Jos olet FDA: n arvostelija, haluat aina tietää mahdollisuuden hyväksyä lääkehakemus, mutta lääke ei todellakaan ole tehokas. Tämä on vastaus, jota Bayesian ei voi antaa ainakaan klassisessa / tyypillisessä Bayesian kielessä.

    #8
    +3
    user36160
    2015-09-03 21:20:52 UTC
    view on stackexchange narkive permalink

    Yleinen ja johdonmukainen luottamus ja uskottavat alueet. http://dx.doi.org/10.6084/m9.figshare.1528163 koodilla osoitteessa http://dx.doi.org/10.6084/m9.figshare.1528187

    Tarjoaa kuvauksen uskottavista aikaväleistä ja luottamusväleistä joukon valinnalle yhdessä yleisen R-koodin kanssa sekä todennäköisyysfunktion että joidenkin havaittujen tietojen laskemiseksi. Lisäksi se ehdottaa testitilastoja, jotka antavat uskottavat ja luotettavuusvälit, jotka ovat optimaalisen kokoisia ja sopusoinnussa keskenään.

    Lyhyesti sanottuna ja välttämällä kaavoja. Bayesin uskottava väli perustuu dataan annettujen parametrien todennäköisyyteen . Se kerää parametrit, joilla on suuri todennäköisyys, uskottavaan joukkoon / intervalliin. 95 prosentin uskottava väli sisältää parametreja, joiden todennäköisyys yhdessä on 0,95, kun otetaan huomioon tiedot.

    Yleisöntekijän luottamusväli perustuu tietyille parametreille annettujen tietojen todennäköisyyteen . Kullekin (mahdollisesti äärettömän monelle) parametrille se luo ensin joukon tietoja, jotka todennäköisesti otetaan huomioon parametrin perusteella. Sitten se tarkistaa jokaisen parametrin, sisältääkö valitut suuren todennäköisyyden tiedot havaitut tiedot. Jos suuren todennäköisyyden data sisältää havaitut tiedot, vastaava parametri lisätään luottamusväliin. Luottamusväli on siis niiden parametrien kokoelma, joille emme voi sulkea pois mahdollisuutta, että parametri on tuottanut tiedot. Tämä antaa sellaisen säännön, että jos sitä käytetään toistuvasti vastaaviin ongelmiin, 95%: n luottamusväli sisältää todellisen parametriarvon 95%: ssa tapauksista.

    95%: n luotettava joukko ja 95%: n luotettavuusjoukko esimerkki negatiivisesta binomijakaumasta 95% Credible set and 95% Confidence set for negative binomial distribution

    Luottamusvälien kuvaus ei ole oikea."95%" saadaan siitä todennäköisyydestä, että populaation näyte tuottaa välin, joka sisältää parametrin todellisen arvon.
    @jlimahaverford - kuvaus on oikea samoin kuin sinun.Linkin luomiseksi kuvailemallesi lisäin "Tämä antaa säännön, joka, jos sitä käytetään toistuvasti vastaaviin ongelmiin, 95 prosentin uskottava väli sisältää todellisen parametriarvon 95 prosentissa tapauksista."
    En puhunut kuvauksestasi uskottavista aikaväleistä, vaan puhuin luottamusvälistä.Huomaan nyt, että luottamusvälejä koskevan kappaleen keskellä aloitat jälleen puhumisen uskottavuudesta, ja mielestäni tämä on virhe.Tärkeä ajatus on tämä: "Jos tämä olisi parametrin todellinen arvo, mikä on todennäköisyys, että otan tämän äärimmäisen tai enemmän otoksen. Jos vastaus on yli 5%, se on luottamusvälillä."
    @jlimahaverford - suostunut ja korjattu - kiitos.
    hmm, en näe sen korjaavan.
    @jlimahaverford - Se lukee nyt "Tämä antaa säännön sellaisen, että jos sitä käytetään toistuvasti vastaaviin ongelmiin, 95 prosentin luottamusväli sisältää todellisen parametriarvon 95 prosentissa tapauksista."
    #9
    +2
    kjetil b halvorsen
    2016-12-24 07:13:30 UTC
    view on stackexchange narkive permalink

    Tämä on enemmän kommentti, mutta liian pitkä.Seuraava artikkeli: Stokastisuuden aikakauden aamunkoitto (David Mumford) Mumfordilla on seuraava mielenkiintoinen kommentti:

    Vaikka kaikkia näitä todella jännittäviä käyttötarkoituksia tehtiintilastotietoja, suurin osa tilastotieteilijöistä itse johtaa Sir RA: taFisher käveli kätensä selän takana ja vaati, että tilastoja ei voida käyttää missään mutta täysin toistettavissa tilanteissa ja vain empiiristen tietojen avulla.Tämä on niin kutsuttu '' taajuuskoulun koulu, joka taisteli Bayesin koulun kanssa, joka uskoi, että edeltäjiä voidaan käyttää ja tilastollisten päättelyjen käyttöä jatkettiin huomattavasti.Tämä lähestymistapa kiistää, että tilastollisella päättelyllä ei voi olla mitään tekemistä todellisen ajatuksen kanssa, koska tosielämän tilanteita haudataan aina kontekstuaalisiin muuttujiin eikä niitä voida toistaa. Onneksi Bayesin koulu ei kuollut kokonaan, jatkoi DeFinetti, E.T.Jaynes, arid muut.



    Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 2.0-lisenssistä, jolla sitä jaetaan.
    Loading...