Kysymys:
Keskihajonnan keskihajonta
user88
2010-07-26 21:10:46 UTC
view on stackexchange narkive permalink

Mikä on estimaatin keskihajonnan keskihajonta, jos voidaan olettaa, että tiedot ovat normaalit?

Oletan, että etsit [otosvarianssin jakaumaa] (https://fi.wikipedia.org/w/index.php?title=Variance&oldid=735567901#Distribution_of_the_sample_variance).Tämä linkki Wikipedia-sivun varianssiosioon 21. elokuuta 2016 klo 16.55. Koska tämä on linkki Wikipediaan, artikkeli saattaa muuttua tulevaisuudessa.Siksi osio ei välttämättä vastaa sisältöä, johon tämä vastaus viittaa tällaisten muutosten jälkeen.Siksi tässä on linkki Wikipedia-sivun historialliseen versioon.Nykyinen varianssiartikkeli löytyy [täältä] (https://fi.wikipedia.org/wik
Kolme vastused:
#1
+59
Macro
2012-05-16 05:20:06 UTC
view on stackexchange narkive permalink

Olkoon $ X_1, ..., X_n \ sim N (\ mu, \ sigma ^ 2) $. Kuten tämä säie osoittaa, näytteen keskihajonnan keskihajonta

$$ s = \ sqrt {\ frac {1} {n-1} \ sum_ {i = 1} ^ {n} (X_i - \ yliviiva {X})}, $$

on

$$ {\ rm SD} (s) = \ sqrt {E \ vasen ([E (s) - s] ^ 2 \ oikea)} = \ sigma \ sqrt {1 - \ frac {2} {n-1} \ cdot \ left (\ frac {\ Gamma (n / 2) } {\ Gamma (\ frac {n-1} {2})} \ right) ^ 2} $$

missä $ \ Gamma (\ cdot) $ on gammafunktio, $ n $ on otoksen koko ja $ \ overline {X} = \ frac {1} {n} \ sum_ {i = 1} ^ {n} X_i $ on otoksen keskiarvo. Koska $ s $ on johdonmukainen estimaatti $ \ sigma $: sta, tämä viittaa siihen, että $ \ sigma $ korvataan $ s $: lla yllä olevassa yhtälössä, jotta saat yhdenmukaisen arvion $ {\ rm SD} (s) $: sta.

Jos kyseessä on puolueeton arvio, jota etsit, näemme tässä säikeessä, että $ E (s) = \ sigma \ cdot \ sqrt {\ frac {2} {n- 1}} \ cdot \ frac {\ Gamma (n / 2)} {\ Gamma (\ frac {n-1} {2})} $, joka odotuslineaarisuuden perusteella ehdottaa

$ $ s \ cdot \ sqrt {\ frac {n-1} {2}} \ cdot \ frac {\ Gamma (\ frac {n-1} {2})} {\ Gamma (n / 2)} $$

$ \ sigma $: n puolueettomana estimaattorina. Kaikki tämä yhdessä odotuslineaarisuuden kanssa antaa puolueettoman arvion $ {\ rm SD} (s) $: sta:

$$ s \ cdot \ frac {\ Gamma (\ frac {n-1} { 2})} {\ Gamma (n / 2)} \ cdot \ sqrt {\ frac {n-1} {2} - \ vasen (\ frac {\ Gamma (n / 2)} {\ Gamma (\ frac { n-1} {2})} \ oikea) ^ 2} $$

+1 On mukavaa nähdä paitsi parempaa vastausta lähes kahden vuoden kuluttua, myös vastauksen, joka tarjoaa enemmän hyödyllisiä yksityiskohtia kuin muualla tässä säikeessä olevat viitteet.
Unohditko neliöidä etäisyydet ensimmäisessä kaavassa?
Gamma-toimintoa on vaikea laskea ei-pienille arvoille $ n $.Soveltamalla Stirlingin likiarvoa saan $ s \ cdot \ sqrt {\ mathrm {e} \ cdot (1- \ frac {1} {n}) ^ {n-1} -1} $, joka on sekä laskennallisesti toteutettavissa ettähieman kompaktimpi ilmaisun suhteen.
Todennäköisesti kannattaa huomauttaa, että s (laskettu @Macro's-vastauksessa kutsutaan joskus otoksen keskihajonnan standardivirheeksi.
Niille, jotka haluavat yksinkertaisen lomakkeen, $ s / \ sqrt {2 (n-1)} $ on hyvä likiarvo muutaman prosentin tasolla.
#2
+5
robin girard
2010-07-26 21:23:25 UTC
view on stackexchange narkive permalink

Oletetaan, että havaitset $ X_1, \ pisteet, X_n $ iid normaalista, keskimääräinen nolla ja varianssi $ \ sigma ^ 2 $. (Empiirinen) keskihajonta on estimaattorin $ \ hat {\ sigma} ^ 2 $ / $ $ sigma ^ 2 $ neliöjuuri (puolueeton tai ei, tämä ei ole kysymys). Estimaattorina (saatu arvolla $ X_1, \ dots, X_n $), $ \ hat {\ sigma} $: lla on varianssi, joka voidaan laskea teoreettisesti. Ehkä se, mitä kutsut vakiopoikkeaman keskihajonnaksi, on itse asiassa keskihajonnan varianssin neliöjuuri eli $ \ sqrt {E [(\ sigma- \ hat {\ sigma}) ^ 2]} $? Se ei ole estimaattori, se on teoreettinen määrä (esimerkiksi $ \ sigma / \ sqrt {n} $ vahvistettava), joka voidaan laskea yksiselitteisesti!

Eikö se estimaattorin funktio ole vielä estimaattori? En vieläkään tiedä \ sigmaa, vain X_i.
ok, niin arvioit mahdollisesti neliöjuuren varianssin neliöjuuren estimoinnin varianssista ... eikö :) pitäisi olla jotain $ \ hat {\ sigma} / n $?
Mitä Srikant löysi (ja mikä näyttää vahvistuneen PhysicsForums-keskustelupalstalla), sen pitäisi olla $ \ sqrt {2} $, joten pikemminkin $ \ hat {\ sigma} \ frac {\ sqrt {2}} {2n} $.
Aww, nämä kommentit lukittuvat; $ \ frac {\ hat {\ sigma}} {\ sqrt {2n}} $. Ainakin tämä antaa tuloksen sopusoinnussa bootstrapin kanssa.
#3
-3
Harvey Motulsky
2010-07-27 00:34:08 UTC
view on stackexchange narkive permalink

@Macro antoi loistavan matemaattisen selityksen laskemalla yhtälö. Tässä on yleisempi selvitys vähemmän matemaattisille ihmisille.

Luulen, että termin "SD of SD" terminologia on hämmentävää monille. SD: n luottamusväliä on helpompi ajatella. Kuinka tarkka on keskihajonta, jonka lasket näytteestä? Aivan sattumalta olet saattanut sattua hankkimaan tietoja, jotka on tiivistetty toisiinsa, mikä tekee näytteen SD: stä paljon pienemmän kuin populaation SD. Tai sinulla voi olla satunnaisesti saatuja arvoja, jotka ovat paljon hajallaan kuin koko populaatio, jolloin otoksen SD on suurempi kuin populaation SD.

SD: n CI: n tulkinta on yksinkertaista. Aloita tavanomaisesta oletuksesta, että tietosi otettiin satunnaisesti ja itsenäisesti Gaussin jakaumasta. Toista nyt tämä näytteenotto monta kertaa. Odotat, että 95% näistä luottamusvälistä sisältää todellisen populaation SD: n.

Kuinka leveä on SD: n 95%: n luottamusväli? Se riippuu tietysti otoksen koosta (n).

n: 95%: n luottamusväli SD: stä

2: 0,45 * SD - 31,9 * SD

3: 0,52 * SD - 6,29 * SD

5: 0,60 * SD - 2,87 * SD

10: 0,69 * SD - 1,83 * SD

25: 0,78 * SD - 1,39 * SD

50: 0,84 * SD - 1,25 * SD

100: 0,88 * SD - 1,16 * SD

500: 0,94 * SD - 1,07 * SD

Ilmainen verkkolaskin

Pystyn tekemään Monte Carlon, halusin vain tehdä "tieteellisemmällä" tavalla; silti olet oikeassa, että jakelu ei ole normaalia, joten tämä sd on hyödytön testaamiseen.
Siksi, mitä se kannattaa, olen epämiellyttävä lausunnosta "luottamusväli, joka on 95% ... todennäköisesti sisältää todellisen SD: n" (tai, joka on ilmaistu tarkemmin linkitetyllä sivulla: "Voit olla 95% varma, että Näytteen SD: sta laskettu CI sisältää todellisen populaation SD "). Luulen, että nämä lausunnot flirttailevat / vahvistavat yleistä väärinkäsitystä, katso [täällä] (http://stats.stackexchange.com/questions/26450/why-does-a-95-ci-not-imply-a-95-chance keskiarvon sisältävä), esimerkiksi CV: tä koskevaan keskusteluun.
Mikä on "mielestäni sekä SD: n SD: n käsite että terminologia liian liukas käsiteltäväksi", jonka pitäisi tarkoittaa? Näytteen keskihajonta on satunnaismuuttuja, jolla on keskihajonta.
@Macro.Kiitos kommenteistasi.Kirjoitin uudestaan merkittävästi.
@gung.Kirjoitin uudestaan selittääkseni oikein luottamusvälin.


Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 2.0-lisenssistä, jolla sitä jaetaan.
Loading...