Kysymys:
Miksi riippumattomuus tarkoittaa nolla korrelaatiota?
joshuaronis
2019-06-17 03:48:50 UTC
view on stackexchange narkive permalink

Ensinnäkin, en kysy tätä:

Miksi nolla-korrelaatio ei tarkoita riippumattomuutta?

Tätä osoitetaan (melko hienosti) täällä: https://math.stackexchange.com/questions/444408/why-does-zero-correlation-not-imply-independence

Kysyn päinvastoin ... sanotaan, että kaksi muuttujaa ovat täysin toisistaan riippumattomia.

Eikö heillä voi olla pieni korrelaatio vahingossa?

Eikö sen pitäisi olla ... riippumattomuus merkitsee ERITTÄIN PITKÄ korrelaatiota?

Jopa itsenäisillä muuttujilla on melkein aina nollasta poikkeava NÄYTTEEN korrelaatio, vaikka se todennäköisesti onkin edelleen lähellä nollaa.
Kuten @jsk huomautti, saatat sekoittaa näytekorrelaation odotettuun korrelaatioon
@David voisitko selittää?Olen edelleen hyvin aloittelija tilastoissa.
@JoshuaRonis Näytekorrelaatio on korrelaatio, jonka havaitset työskennellessäsi joukon tietoja.Voit käyttää sitä saadaksesi käsityksen siitä, mikä kahden muuttujan välinen "oikea" korrelaatio on.Mitä suurempi otos, sitä paremman arvion saat.Esimerkiksi kahden noppan tulosten välinen korrelaatio on riippumaton, siis korreloimaton, vaikka heittäisitkin ne kymmenen kertaa, saatat saada korrelaatiota (satunnaisen sattuman vuoksi). Huomaa kuitenkin, että positiivista eikä negatiivista korrelaatiota ei suositella(eli sinulla on yhtäläiset mahdollisuudet kumpaankin)
Ei huijaus, mutta siihen liittyvä keskustelu: [Tarkoittaako nollan ulkopuolinen korrelaatio riippuvuutta?] (Https://stats.stackexchange.com/q/113417/177387)
Kysymyksesi ilmentää tautologiaa.Näin määritetään nollakorrelaatio.
Neljä vastused:
OmG
2019-06-17 03:51:56 UTC
view on stackexchange narkive permalink

Korrelaatiokertoimen määritelmän mukaan, jos kaksi muuttujaa on riippumattomia, niiden korrelaatio on nolla.Joten, ei voi tapahtua mitään korrelaatiota vahingossa!

$$ \ rho_ {X, Y} = \ frac {\ operaattorin nimi {E} [XY] - \ operaattorin nimi {E} [X] \ operaattorin nimi {E} [Y]} {\ sqrt {\ operaattorin nimi {E} [X ^ 2] - [\ operaattorin nimi {E} [X]] ^ 2} ~ \ sqrt {\ operaattorin nimi {E} [Y ^ 2] - [\ operaattorin nimi {E} [Y]] ^ 2}} $$

Jos $ X $ ja $ Y $ ovat riippumattomia, tarkoittaa $ \ operaattorin nimi {E} [XY] = \ operaattorin nimi {E} [X] \ operaattorin nimi {E} [Y] $ .Siksi $ \ rho_ {X, Y} $ osoittaja on tässä tapauksessa nolla.

Joten, jos et muuta korrelaation merkitystä, kuten täällä mainittiin, se ei ole mahdollista.Ellet selvitä määritelmääsi korrelaatiosta.

Ja silti meillä on kaavioita, jotka osoittavat selvästi (käänteisen) korrelaation merirosvojen lukumäärän ja globaalin keskilämpötilan välillä.Kuten muut kommentit huomauttavat, on oltava varovainen otoskokojen suhteen, puhumattakaan "vahingossa esiintymistä"
@OmG "jos et muuta korrelaation merkitystä, kuten täällä mainitaan" Kun luin toimenpideohjelmien kysymyksen, sain aivan toisenlaisen "korrelaation" merkityksen.Minulle: "Eikö heillä voisi olla pieni korrelaatio vahingossa?"tarkoittaa erittäin voimakkaasti korrelaation mittaamista, ja kun mittaat korrelaatiota todellisuudessa, löydät usein "pienen osan korrelaatiota vahingossa".
@industry7 näen.Mutta se olisi määriteltävä muodollisella menetelmällä.Se on laadullinen, emmekä voi puhua siitä täällä.
@CarlWitthoft Merirosvojen lukumäärä ja maailmanlaajuinen keskilämpötila eivät ole riippumattomia.Heillä on yhteinen syy (ts. Aika, kehitys, modernisointi jne.), Joka luo riippuvuuden niiden välille."Itsenäisyys" ei tarkoita "ei aiheuta";se tarkoittaa "assosiaatiota", ja selvästi nuo kaaviot osoittavat yhdistymistä.
@Noah Pelkään kenen tapahtuisi.https://www.venganza.org/
BruceET
2019-06-17 06:57:01 UTC
view on stackexchange narkive permalink

Comment näyte -korrelaatiosta. Verrattaessa kahta pientä riippumatonta otosta samankokoinen, näyte korrelaatio on usein huomattavasti erilainen kuin $ r = 0. $ [Mikään tässä ei ole ristiriidassa @ OmG: n vastauksen (+1) kanssa populaatio korrelaatiosta $ \ rho.] $

Harkitse korrelaatioita miljoonan itsenäisen parin välillä näytteet koosta $ n = 5 $ eksponentiaalijakaumasta nopeudella $ 1. $

  set.seed (616)
r = kopio (10 ^ 6, cor (rexp (5), rexp (5)))
keskiarvo (abs (r) > .5)
[1] 0,3886212
keskiarvo (r)
[1] -0.0005904455

hist (r, prob = T, br = 40, col = "taivaansininen2")
  viiva (v = c (-. 5, .5), col = "punainen", lwd = 2)
 

enter image description here

Tässä on esimerkiksi sirontakaavio miljoonasta näyteparista, joiden koko on $ 5, $ $ r = -0,5716. $

enter image description here

Eksponentiaalijakaumassa ei ole mitään erityistä tässä suhteessa. Vanhemman jakelun muuttaminen tavalliseksi yhtenäiseksi antoi seuraavat tulokset.

  set.seed (2019)
...
keskiarvo (abs (r) > .5)
[1] 0,391061
keskiarvo (r)
[1] 1.43269e-05
 

enter image description here

Sitä vastoin tässä on vastaava histogrammi yhtälöille paria normaalinäytteitä, joiden koko on $ n = 20. $

enter image description here

Huomaa: Muut tämän sivuston sivut käsittelevät $ r $ -jakelua tarkemmin; yksi heistä on tämä Q & A.

Pienen otoskokon kohdalla löydät todennäköisesti näytekorrelaatioita, jotka eroavat "huomattavasti" nollasta, mutta et todennäköisesti löydä korrelaatioita, jotka eroavat * merkittävästi * nollasta.Vaikka pistearviosi on kaukana nollasta, sinulla on aivan liian vähän tietoja voidaksesi luottaa siihen, että näet nollakorrelaation muun kuin sattuman takia.Kun vain 5 paria, korrelaatiokertoimet, jotka ovat suurempia kuin 0,8, eivät välttämättä poikkea merkittävästi 0: sta.
Dave
2019-06-17 19:11:26 UTC
view on stackexchange narkive permalink

Yksinkertainen vastaus: jos 2 muuttujaa on riippumattomia, population-korrelaatio on nolla, kun taas sample-korrelaatio on tyypillisesti pieni, mutta ei nolla.

Tämä johtuu siitä, että otos ei edusta täydellisesti populaatiota.

Mitä suurempi otos, sitä paremmin se edustaa populaatiota, joten sitä pienempi korrelaatio sinulla on.infinite-näytteen korrelaatio olisi nolla.

Tarkka muotoilu olisi, että missä tahansa $ p $: ssa ja $ \ epsilon $: ssa on joitain $ n $: ta, jos jos otoksen koko on suurempi kuin $ n $, korrelaation todennäköisyys olla suurempi kuin $ \ epsilon $ onalle $ p $.
Kyllä, aivan oikein!Yritin pitää vastaukseni mahdollisimman yksinkertaisena ja käsitteellisenä.
Simon Alford
2019-07-03 03:12:48 UTC
view on stackexchange narkive permalink

Ehkä tästä on hyötyä joillekin ihmisille, joilla on sama intuitiivinen ymmärrys. Olemme kaikki nähneet jotain tällaista:

enter image description here

Nämä tiedot ovat oletettavasti riippumattomia, mutta niillä on selvästi korrelaatio ( $ r = 0,66 $ ). "Luulin, että riippumattomuus merkitsee nolla korrelaatiota!" opiskelija sanoo.

Kuten muut ovat jo huomauttaneet, sample-arvot korreloivat, mutta se ei tarkoita, että population: llä ei ole nolla-korrelaatiota.

Näiden kahden on tietysti oltava riippumattomia - kun otetaan huomioon, että Nicolas Cage esiintyi ennätyksellisessä 10 elokuvassa tänä vuonna, meidän ei pitäisi sulkea paikallista uima-allasta kesäksi turvallisuussyistä.

Mutta kun tarkistamme, kuinka monta ihmistä hukkuu tänä vuonna, on pieni mahdollisuus, että ennätykselliset 1000 ihmistä hukkuvat tänä vuonna.

Tällaisen korrelaation saaminen on epätodennäköistä. Ehkä yksi tuhannesta. Mutta se on mahdollista, vaikka nämä kaksi ovat itsenäisiä. Mutta tämä on vain yksi tapaus. Ajattele, että siellä on miljoonia mahdollisia mitattavia tapahtumia, ja voit nähdä mahdollisuuden, että kahden todennäköisyydet, jotka antavat korkean korrelaation, ovat melko korkeat (joten yllä olevien kaltaisten kaavioiden olemassaolo).

Toinen tapa tarkastella sitä on, että kahden itsenäisen tapahtuman takaaminen aina korreloimattomilla arvoilla on itsessään rajoittavaa. Kun otetaan huomioon kaksi itsenäistä noppaa ja ensimmäisen tulokset, toiselle noppalle on tietty (huomattava) tulosjoukko, joka antaa jonkin verran nollakorrelaatiota. Toisen noppan tulosten rajoittaminen nolla korrelaatioon ensimmäisen kanssa on selkeä riippumattomuuden rikkomus, koska ensimmäisten noppien heitot vaikuttavat nyt tulosten jakautumiseen.



Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 4.0-lisenssistä, jolla sitä jaetaan.
Loading...