Kysymys:
Jos t-testi ja ANOVA kahdelle ryhmälle ovat samanarvoisia, miksi heidän oletuksensa eivät ole samanarvoisia?
Chris Beeley
2010-08-13 14:41:13 UTC
view on stackexchange narkive permalink

Olen varma, että tämä on kääritty kokonaan pääni ympärille, mutta en vain ymmärrä sitä.

T-testi vertaa kahta normaalijakaumaa käyttäen Z-jakaumaa. Siksi DATA: ssa on oletus normaaluudesta.

ANOVA vastaa lineaarista regressiota nuken muuttujien kanssa ja käyttää neliösummia, aivan kuten OLS. Siksi oletetaan JÄTTEIDEN normaalisuus.

Minulta on kulunut useita vuosia, mutta luulen, että olen vihdoin ymmärtänyt nuo perustiedot. Joten miksi t-testi vastaa ANOVAa kahdella ryhmällä? Kuinka ne voivat olla samanarvoisia, jos he eivät edes oleta samoja asioita tiedoista?

Yksi piste: t-testeissä käytetään t-jakaumaa eikä Z-jakaumaa
Vaikka kysymys ei ole oikea, se on erittäin hyödyllinen.Luulen myös, että "kahden pyrstön t-testin" mainitseminen jonnekin tekee kysymyksistä / vastauksista täydellisemmät.
Viisi vastused:
#1
+32
Rob Hyndman
2010-08-13 14:52:45 UTC
view on stackexchange narkive permalink

T-testissä, jossa on kaksi ryhmää, oletetaan, että kukin ryhmä jakautuu normaalisti samalla varianssilla (vaikka keskiarvot voivat vaihdella vaihtoehtoisen hypoteesin mukaan). Tämä vastaa regressiota, jossa on nuken muuttuja, koska regressio antaa jokaisen ryhmän keskiarvon erota, mutta ei varianssia. Siksi jäännöksillä (yhtä suuri kuin vähennettyjen ryhmien keskiarvojen tiedot) on sama jakauma --- eli ne jakautuvat normaalisti nollakeskiarvolla.

Epäyhtenäisten varianssien t-testi ei vastaa yksisuuntainen ANOVA.

Voin etsiä lainauksen, mutta tämä on tarpeeksi helppo testata empiirisesti. F kahdesta ryhmästä koostuvasta ANOVA: sta on täsmälleen yhtä suuri kuin t ^ 2 ja p-arvot ovat täsmälleen samat. Ainoa syy, miksi se ei olisi samanarvoinen epätasaisten varianssien tapauksessa, on korjauksen tekeminen. Muuten ne ovat samat.
F-testi on t-testin yleistys. t-testi on tarkoitettu kahden hoidon vertailuun ja F-testi on useita hoitoja varten. Johdanto on Casellan tilastollisen suunnittelun luvuissa 3 ja 4. Kuitenkin, kuten professori Hyndman huomauttaa, epätasaisella varianssilla se ei ole enää t-testi. Se on Fisher Behrenin ongelma. Emme yleensä käytä Fisherin ratkaisua, vaan Welchin testiä tai Bayesin lähestymistapaa.
Kaksinäytteinen t-testi epätasaisella varianssilla on todellakin yhtä suuntainen ANOVA, jossa on kaksi ryhmää.Ehkä tarkoitit sitä, että t-testi, jossa käytetään epätasaisten varianssien korjausta (ts. Welch), ei ole sama kuin yksisuuntainen ANOVA, jota ei korjata (vaikka miksi ne olisivatkin)?
#2
+21
Brett
2010-08-13 20:24:20 UTC
view on stackexchange narkive permalink

T-testi on yksinkertaisesti F-testin erityistapaus, jossa verrataan vain kahta ryhmää. Kummankin tulos on täsmälleen sama p-arvon suhteen ja F- ja t-tilastojen välillä on myös yksinkertainen suhde. F = t ^ 2. Nämä kaksi testiä ovat algebrallisesti vastaavia ja niiden oletukset ovat samat.

Itse asiassa nämä vastaavuudet ulottuvat koko ANOVA-, t-testi- ja lineaarisen regressiomallin luokkaan. T-testi on ANOVA: n erityistapaus. ANOVA on regressiotapaus. Kaikki nämä menettelyt kuuluvat yleisen lineaarisen mallin piiriin, ja niillä on samat oletukset.

  1. Havainnoinnin riippumattomuus.
  2. Jäännösten normaalisuus = normaalitapaukset jokaisessa ryhmässä erityistapauksessa. .
  3. Jäännösvarianssien yhtälö = yhtäläiset varianssit ryhmien välillä erikoistapauksessa.

Voit ajatella sitä normaalina tiedoissa, mutta olet tarkistamassa jokaisen ryhmän normaalisuus - mikä on oikeastaan ​​sama kuin jäännösten normaalisuuden tarkistaminen, kun mallin ainoa ennustaja on ryhmän indikaattori. Samoin yhtä suurilla variansseilla.

Aivan kuten sivussa, R: llä ei ole erillisiä rutiineja ANOVA: lle. R: n anovatoiminnot ovat vain kääreitä lm () -funktiolle - sama asia, jota käytetään lineaaristen regressiomallien sovittamiseen - pakattu hieman eri tavalla, jotta saadaan se, mikä tyypillisesti löytyy ANOVA-yhteenvedosta eikä regressioyhteenvedosta. / p>

Haluaisitko tietää kuinka sovittaa toistuvat mitta-ANOVA-mallit lm: llä.
Tässä artikkelissa kuvataan kategoristen muuttujien koodaamisen, regressio- ja ANOVA-mallien vastaavuuden ja toistuvien mittausten regressiokoodauksen kysymykset. http://dionysus.psych.wisc.edu/Lit/Topics/Statistics/Contrasts/Wendorf2004a.pdf Tässä on viittaus ... Wendorf, C. A. (2004). Alusta useista regressiokoodauksista: Yleiset muodot ja toistuvien kontrastien lisätapaus. Tilastojen ymmärtäminen 3, 47–57.
@AndyF Ei `lm ()`, ellet siirry sekoitettuihin malleihin `nlme` tai` lme4`-paketin kanssa, mutta on kätevä tapa käsitellä toistuvia mittauksia määrittämällä asianmukaisesti `` Virhe``-termi `` aov (): ssä () `, katso lisätietoja Baron & Li -opetusohjelmasta, §6.9, http://j.mp/c5ME4u
@AndyF `aov ()` on rakennettu funktion `lm () päälle, mutta sisältää lisäargumentin, nimeltään * Special * termit, kuten` `Error ''.
aov () on yksinkertaisesti kääre lm: ään (). Se tekee jonkin verran kontrastikoodausta kulissien takana ja pakkaa tuloksen ANOVA-tyyliin. Kaiken sen on mallinnanut lm (). Edellä mainitsemassani artikkelissa kerrotaan, kuinka koodaus asetetaan toistuvien kontrastien tekemiseksi regressiomalleissa, mukaan lukien lm ().
"Itse asiassa nämä vastaavuudet ulottuvat koko ANOVA-, t-testi- ja lineaarisen regressiomallin luokkaan. T-testi on ANOVA: n erityistapaus. ANOVA on erityinen regressiotapaus. Kaikki nämä menettelyt ovat osaYleinen lineaarinen malli ja samat olettamukset. "hieno yhteenveto.silloin ANOVA on yleisempi tapaus, kun vain meillä on enemmän kuin kaksi ryhmää.
#3
+17
Henrik
2010-08-13 17:24:12 UTC
view on stackexchange narkive permalink

Olen täysin samaa mieltä Robin vastauksesta, mutta haluan sanoa sen toisella tavalla (wikipedian avulla):

Oletukset ANOVA:

  • Itsenäisyys tapauksista - tämä on oletus mallista, joka yksinkertaistaa tilastollista analyysia.
  • Normaalisuus - jäännösten jakaumat ovat normaaleja.
  • Varianssien tasa-arvo (tai "homogeenisuus") kutsutaan homoscedastiseksi

Oletusten t-testi:

  • Kummankin verratun populaation tulisi noudattaa normaalijakaumaa ...
  • ... kahdella vertailtavalla populaatiolla tulisi olla sama varianssi ...
  • Testin suorittamiseen käytetyistä tiedoista tulisi ottaa otos riippumatta kahdesta verratusta populaatiosta. / li>

Siksi kiistän kysymyksen, koska heillä on ilmeisesti samat olettamukset (tosin eri järjestyksessä :-)).

Katso kommentti Robille.
@Alexis En ole varma, ymmärränkö aliarvostuksesi. Huolehdi yksityiskohtaisesti.
Toinen * t * -testioletus ei ole totta. Opiskelijan alkuperäinen työ oletti tämän, mutta "epätasainen vaihtelu" on riittävän yleinen oletus myöhemmässä testissä.
#4
+5
dsimcha
2011-02-04 07:30:00 UTC
view on stackexchange narkive permalink

Yksi ilmeinen seikka, jonka kaikki jättävät huomiotta: ANOVA: n avulla testaat nollan, että keskiarvo on identtinen selittävien muuttujien arvoista riippumatta. T-testillä voit testata myös yksipuolisen tapauksen, että keskiarvo on nimenomaisesti suurempi selittävän muuttujan yhden arvon antama kuin toinen.

Ellei erehdy, tämä ei ole ero.Jos teet ANOVA: n kahdelle ryhmälle, voit tehdä "yksipuolisen testin" aivan kuten voit t-testissä.Laitoin "yksipuolinen testi" lainausmerkeihin, koska "testissä" ei todellakaan ole eroa "yksipuolisen testin" ja "kaksipuolisen testin" välillä.Ainoa ero on siinä, miten tulkitset p-arvojen tilastollisen merkitsevyyden.Joten yksipuoliset vs kaksipuoliset "testit" ovat täsmälleen sama "testi".Ainoa tapa tulkita tulokset oikein on erilainen.
#5
-4
syed
2013-01-08 21:26:46 UTC
view on stackexchange narkive permalink

Käytän mieluummin t-testiä kahden ryhmän vertailussa ja käytän ANOVAa useammalle kuin kahdelle ryhmälle syistä. Tärkeä syy on oletus yhtäläisistä variansseista.

Tervetuloa sivustolle, @syed. Haluatko laajentaa vastaustasi? Esimerkiksi mitä "syitä" tarkoitat? Huomaa, että * molemmat * t-testi ja ANOVA olettavat samat varianssit.
Voisitteko selventää perusteluja?En voinut seurata sitä.


Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 2.0-lisenssistä, jolla sitä jaetaan.
Loading...