Kysymys:
Missä olosuhteissa tulisi käyttää monitasoista / hierarkkista analyysiä?
Patrick
2010-08-22 05:22:34 UTC
view on stackexchange narkive permalink

Missä olosuhteissa jonkun tulisi harkita monitasoisen / hierarkkisen analyysin käyttöä perus / perinteisempien analyysien (esim. ANOVA, OLS-regressio jne.) sijaan? Onko tilanteita, joissa tätä voidaan pitää pakollisena? Onko tilanteita, joissa monitasoisen / hierarkkisen analyysin käyttäminen ei ole tarkoituksenmukaista? Lopuksi, mitkä ovat hyvät resurssit aloittelijoille monitasoisen / hierarkkisen analyysin oppimiseksi?

Katso myös: http://stats.stackexchange.com/a/38430/5739
Kahdeksan vastused:
#1
+23
ars
2010-08-22 05:40:31 UTC
view on stackexchange narkive permalink

Kun tietojesi rakenne on luonnostaan ​​hierarkkinen tai sisäkkäinen, monitasoinen mallinnus on hyvä ehdokas. Yleisemmin, se on yksi tapa vuorovaikutusten mallintamiseen.

Luonnollinen esimerkki on, kun tietosi ovat järjestäytyneestä rakenteesta, kuten maasta, osavaltiosta, piiristä, jossa haluat tutkia vaikutuksia kyseisillä tasoilla. Toinen esimerkki tällaisen rakenteen sovittamisesta on pitkittäisanalyysi, jossa sinulla on toistuvia mittauksia monilta koehenkilöiltä ajan mittaan (esim. Biologinen vaste lääkeannokseen). Mallisi yksi taso olettaa ryhmän keskimääräisen vasteen kaikille aiheille ajan mittaan. Toinen mallisi taso sallii sitten häiriöt (satunnaiset vaikutukset) ryhmän keskiarvosta yksilöllisten erojen mallintamiseksi.

Suosittu ja hyvä kirja aluksi on Gelmanin data-analyysi regressiota ja monitasoisia / hierarkisia malleja käytettäessä .

Toistan tämän vastauksen ja haluaisin vain lisätä toisen suuren viittauksen tähän aiheeseen: Singerin sovelletun pitkittäistietojen analysointiteksti . Vaikka se on ominaista pitkittäisanalyysille, se antaa mukavan yleiskuvan MLM: stä yleensä. Löysin myös Snidjersin ja Boskerin monitasoisen analyysin hyväksi ja luettavaksi . John Fox tarjoaa myös mukavan johdannon näille malleille R täällä .
Kiitos kaikille vastauksistasi :) Eikö suurinta osaa käsitteestä voida luonnostaan ​​luonnostaan ​​hierarkkinen / sisäkkäinen? Esimerkiksi useimmissa psykologisissa tutkimuksissa yksilöissä on useita riippuvia muuttujia (kyselylomakkeet, ärsykevasteet jne.), Jotka ovat edelleen sisäkkäin kahdessa tai useammassa ryhmässä (satunnaisesti tai ei-satunnaisesti). Oletteko samaa mieltä siitä, että tämä edustaa luonnollisesti hierarkkista ja / tai sisäkkäistä tietorakennetta?
Jos joku teistä monitasoisista / hierarkisista guruista voisi säästää muutaman minuutin, olisin erittäin kiitollinen, jos voisitte punnita eri postissa esitettyjä analyysikysymyksiä (http://stats.stackexchange.com/questions/1799/recommendations-or parhaita käytäntöjä analysoimaan ei-itsenäisiä tietoja-spesifikaatioita). Erityisesti luuletko, että siinä viestissä hahmotellut kivun havaintotiedot analysoitaisiin paremmin hierarkkisin analyysein kuin ei-hierarkkisin analyysein? Vai eikö sillä olisi eroa tai edes sopimaton? Kiitti
#2
+18
Andy W
2010-08-22 07:48:21 UTC
view on stackexchange narkive permalink

Monitasoisen mallinnuksen keskuksessa on hyviä ilmaisia ​​online-opetusohjelmia monitasoiseen mallintamiseen, ja heillä on ohjelmisto-oppaita mallien sovittamiseksi sekä MLwiN-ohjelmistoihinsa että STATA: han.

Ota tämä harhaopiksi, koska en ole lukenut kirjasta enempää kuin luku, mutta hierarkkiset lineaariset mallit: sovellukset ja tietojen analysointimenetelmät Stephen W. Raudenbushin mukaan Anthony S. Bryk on erittäin suositeltava. Vannon myös, että Springer Use R! -Sovelluksessa oli kirja monitasoisesta mallinnuksesta R-ohjelmistolla! -sarjaa, mutta en näytä löytävän sitä tällä hetkellä (luulin, että sen ovat kirjoittaneet samat ihmiset, jotka kirjoittivat Aloittelijan opas R-kirjaan).

edit: Kirja R: n käytöstä monitasoisissa malleissa on Mixed Effect -mallit ja laajennukset ekologiassa ja R: ssä Zuur, AF, Ieno, EN, Walker, N., Saveliev, AA, Smith, GM

onnea

#3
+9
Galit Shmueli
2010-12-13 11:08:36 UTC
view on stackexchange narkive permalink

Tässä on toinen näkökulma monitasoisten ja regressiomallien käyttöön: Afshartousin ja de Leeuw'n mielenkiintoisessa artikkelissa ne osoittavat, että jos mallinnuksen tarkoitus on ennakoiva (eli ennustaa uusia havaintoja), mallin valinta on eroaa siitä, milloin tavoite on päättely (missä yrität sovittaa mallin tietorakenteeseen). Viittaama artikkeli on

Afshartous, D., de Leeuw, J. (2005). Ennustus monitasoisissa malleissa. J. Educat. Käyttäytyminen Tilast. 30 (2): 109–139.

Löysin juuri toisen näiden kirjoittajien aiheeseen liittyvän paperin täältä: http://moya.bus.miami.edu/~dafshartous/Afshartous_CIS.pdf

#4
+6
Cyrus S
2010-12-14 01:08:54 UTC
view on stackexchange narkive permalink

Tässä on esimerkki, jossa monitasoinen malli voi olla "välttämätön". Oletetaan, että haluat arvioida koulujen tarjoaman koulutuksen "laatua" käyttämällä oppilaiden testipisteitä. Yksi tapa määritellä koulun laatu on testin keskimääräinen suorituskyky, kun otetaan huomioon opiskelijan ominaisuudet. Voit käsittää tämän muodossa $$ y_ {is} = \ alpha_s + X_ {is} '\ beta_s + \ epsilon_ {is}, $$ jossa $ y_ {is} $ on jatkuva testipiste opiskelijalle $ i $ koulu $ s $, $ X_ {is} $ ovat oppilaiden attribuutteja, jotka on keskitetty kouluun, $ \ beta_s $ on näiden ominaisuuksien koulukohtainen kerroin, $ \ alpha_s $ on "kouluvaikutus", joka mittaa koulun laatua, ja $ \ epsilon_ {is} $ ovat opiskelijoiden tason omaleimaisuuksia testien suorittamisessa. Kiinnostus tässä keskitytään arvioimaan $ \ alpha_s $: t, jotka mittaavat "lisäarvoa", jonka koulu tarjoaa opiskelijoille sen jälkeen, kun heidän ominaisuutensa on otettu huomioon. Haluat ottaa huomioon opiskelijan ominaispiirteet, koska et halua rangaista hyvää koulua, jonka on kohdeltava tiettyjä haittoja omaavia oppilaita, joten masentavat keskimääräiset testitulokset halveksivat korkeaa "lisäarvoa", jonka koulu tarjoaa opiskelijoille.

Kun malli on käsillä, asiasta tulee arvio. Jos sinulla on paljon kouluja ja paljon tietoa kustakin koulusta, OLS: n hienot ominaisuudet (katso Angrist ja Pischke, Useimmiten harmiton ... , nykyinen arvostelu) viittaavat siihen, että haluat käyttää että sopivilla vakiovirheiden mukauttamisilla riippuvuuksien huomioon ottamiseksi ja käyttämällä nukkeja muuttujia ja vuorovaikutuksia koulutason vaikutusten ja koulukohtaisten sieppausten saamiseksi. OLS voi olla tehoton, mutta se on niin läpinäkyvä, että skeptisen yleisön saattaminen voi olla helpompaa vakuuttaa, jos käytät sitä. Mutta jos tietosi ovat harvoilla tietyillä tavoilla --- varsinkin jos sinulla on vain vähän havaintoja joistakin kouluista - saatat haluta asettaa enemmän "rakennetta" ongelmaan. Haluat ehkä "lainata voimaa" suurempien otosten kouluista parantaaksesi meluisia arvioita, jotka saisit pienissä otoskouluissa, jos arviointi tehdään ilman rakennetta. Sitten voit kääntyä FGLS: n kautta arvioidun satunnaisten vaikutusten mallin tai kenties likimääräisen todennäköisyyden lähentämiseksi tietyn parametrisen mallin mukaan tai jopa Bayesin parametrisen mallin suhteen. monitasoinen malli (kuitenkin päätämme sopia siihen viime kädessä) johtuu suorasta kiinnostuksesta koulutason sieppauksiin. Tietysti muissa tilanteissa nämä ryhmätason parametrit eivät voi olla muuta kuin haittaa. Pitäisikö sinun sopeutua niihin (ja siksi silti työskennellä jonkinlaisen monitasoisen mallin kanssa), riippuu siitä, pitävätkö tietyt ehdolliset eksogeenisyyttä koskevat oletukset voimassa. Tästä syystä suosittelen tutustumaan ekonometriseen kirjallisuuteen paneelidatamenetelmistä; suurin osa sieltä tulevista oivalluksista siirtyy yleiseen ryhmiteltyyn dataympäristöön.

Tämä on vanha säie, mutta jos luet tämän: OLS, jossa on nukkeja ja muuttujat, ei lainaa voimaa kuin muut mainitsemasi tekniikat, eikö? Minulla on joitain tietoja, joissa olen hajottanut analyysini kahteen osaan ja käyttänyt kahta lm (R lineaarinen malli) -komentoa mallinnamaan kaksi osaa. Esittelin nuken muuttujan osoittamaan kaksi osaa, sitten käytin lm: tä uudelleen tässä "yhtenäisessä" mallissa ja vastaukset ovat lähellä, mutta eivät samat. Kysymykseni olisi: onko vastaus "parempi" vai yksinkertaisesti erilainen algoritmin takia?
@Wayne:, jos käytit nukkeja ja kaikkia vuorovaikutussarjoja toisessa, piste-estimaattien tulisi olla samat. Standardivirheet voivat vaihdella, koska toinen menetelmä saattaa olettaa korkeamman vapausasteen, mutta haluat tarkistaa, onko se oikea mallinnusoletus.
#5
+6
probabilityislogic
2011-05-22 09:40:26 UTC
view on stackexchange narkive permalink

Monitasoinen mallinnus on tarkoituksenmukaista, kuten nimestäkin käy ilmi, kun tiedoillasi on vaikutuksia eri tasoilla (yksilöllisesti, ajan mittaan, yli verkkotunnusten jne.). Yhden tason mallinnus olettaa, että kaikki tapahtuu alimmalla tasolla. Toinen asia, jonka monitasoinen malli tekee, on tuoda esiin korrelaatioita sisäkkäisten yksiköiden välillä. Joten tason 1 yksiköt saman tason 2 yksikössä korreloivat.

Jossain mielessä voit ajatella monitasoista mallintamista löytävän keskipisteen "individualistisen harhakuvituksen" ja "ekologisen harhakuvan" välillä. ". Individualistinen harhaluulo on silloin, kun "yhteisövaikutuksia", kuten opettajan tyylin yhteensopivuutta opiskelijan oppimistyylin kanssa, ei oteta huomioon (vaikutuksen oletetaan tulevan yksin yksilöltä, joten tee regressio vain tasolla 1). ottaa huomioon, että "ekologinen harhaluulo" on päinvastainen, ja se olisi kuin olettaa, että parhaalla opettajalla olisi parhaat arvosanat saaneilla oppilailla (ja jotta tasoa 1 ei tarvita, regressoi vain tasolla 2). Useimmissa asetuksissa kumpikaan ei ole sopiva (opiskelija-opettaja on "klassinen" esimerkki).

Huomaa, että kouluesimerkissä tiedoissa oli "luonnollinen" ryhmittymä tai rakenne. Mutta tämä ei ole olennainen piirre monitasoisessa / hierarkkisessa mallinnuksessa. Luonnollinen klusterointi kuitenkin helpottaa matematiikkaa ja laskelmia. Keskeinen ainesosa on ennakkotieto, jonka mukaan prosesseja tapahtuu eri tasoilla. Itse asiassa voit suunnitella klusterointialgoritmeja asettamalla tietojesi monitasoisen rakenteen epävarmuudella siitä, mikä yksikkö on missä korkeammalla tasolla. Joten sinulla on $ y_ {ij} $ ja alaindeksi $ j $ on tuntematon.

#6
+4
user28
2010-08-22 06:04:55 UTC
view on stackexchange narkive permalink

Yleensä hierarkkisen Bayesian (HB) -analyysin puhuminen johtaa tehokkaisiin ja vakaisiin yksilöllisen tason arvioihin, ellei tietosi ole sellaisia, että yksittäisen tason vaikutukset ovat täysin homogeenisia (epärealistinen skenaario). HB-mallien tehokkuudesta ja vakaista parametriestimaateista tulee todella tärkeitä, kun sinulla on vähän tietoja (esim. Vähemmän obs-arvoja kuin parametrien lukumäärä yksilötasolla) ja kun haluat arvioida yksittäisen tason estimaatteja.

HB-malleja ei kuitenkaan aina ole helppo arvioida. Siksi, vaikka HB-analyysi yleensä kykenee muuhun kuin HB-analyysiin, sinun on punnittava suhteelliset kustannukset vs. hyödyt aikaisemman kokemuksesi ja nykyisten prioriteettiesi perusteella ajan ja kustannusten suhteen.

Sanoi, että jos et ole kiinnostunut yksittäisen tason estimaateista, voit yksinkertaisesti arvioida aggregaattitason mallin, mutta jopa näissä tilanteissa aggregaatiomallien arvioinnilla HB: n avulla yksilöllisen tason estimaattien avulla voi olla paljon järkeä.

Yhteenvetona voidaan todeta, että HB-mallien asentaminen on suositeltavaa, kunhan sinulla on aikaa ja kärsivällisyyttä sopia niihin. Voit sitten käyttää yhdistelmämalleja vertailukohtana arvioidaksesi HB-mallisi suorituskykyä.

Kiitos yksityiskohtaisesta vastauksestasi Srikant :) En ole tällä hetkellä perehtynyt Bayesin analyyseihin, mutta olen yksi aiheista, joita olen tarkoittanut tutkia. Onko hierarkkinen Bayesin analyysi erilainen kuin muut tällä sivulla käsiteltävät monitasoiset / hierarkkiset analyysit? Jos on, onko sinulla suositeltavaa resurssia kiinnostuneille osapuolille lisätietoja varten?
Analyyttisestä näkökulmasta HB-analyysi = monitasoiset mallit. Termiä monitasoiset mallit käytetään kuitenkin, kun sinulla on erilaisia ​​tasoja, jotka esiintyvät luonnollisesti (katso esimerkki @ars). Termiä HB-mallit käytetään, kun tilanteessa ei välttämättä ole eri tasoja. Esimerkiksi, jos mallinnat kuluttajan vastausta erilaisiin markkinointimuuttujiin (esim. Hinta, ennakkomaksut jne.), Kuluttajatasolla voi olla seuraava rakenne: $ β_i \ sim N (\ bar {\ beta}, \ Sigma ) $ ja $ \ bar {\ beta} \ sim N (.,.) $ populaatiotasolla. Viitteet: Katso muut vastaukset.
#7
+4
Chris Beeley
2010-12-13 13:47:49 UTC
view on stackexchange narkive permalink

Olen oppinut Snijdersiltä ja Boskerilta, Monitasoinen analyysi: Johdanto monitasoiseen perus- ja edistyneeseen mallintamiseen. Se on mielestäni erittäin hyvä aloittelijoille, sen täytyy olla, koska olen paksu, missä nämä asiat ovat, ja se oli järkevää minulle.

Toistan myös Gelmanin ja Hillin, todella loistava kirja.

#8
+1
StatisticsDoc Consulting
2012-11-20 11:01:29 UTC
view on stackexchange narkive permalink

Monitasoisia malleja tulisi käyttää, kun tiedot on sisäkkäin hierarkkisessa rakenteessa, varsinkin kun riippuvan muuttujan ylemmän tason yksiköiden välillä on merkittäviä eroja (esim. opiskelijoiden saavutussuunta vaihtelee opiskelijoiden välillä ja myös luokkien välillä jotka opiskelijat ovat sisäkkäin). Näissä olosuhteissa havainnot ovat ryhmiteltyjä eikä itsenäisiä. Klusteroinnin huomiotta jättäminen johtaa parametriarvioiden virheiden aliarviointiin, puolueelliseen merkitsevyystestaukseen ja taipumukseen hylätä nolla, kun se tulisi säilyttää. Perustelut monitasomallien käytölle sekä perusteelliset selvitykset analyysien tekemisestä ovat

Raudenbush, S. W. Bryk, A. S. (2002). Hierarkkiset lineaariset mallit: Sovellukset ja data-analyysimenetelmät. 2. painos. Newbury Park, Kalifornia: Sage.

R & B -kirja on myös hyvin integroitu kirjoittajien HLM-ohjelmistopakettiin, mikä auttaa paljon paketin oppimisessa. Selitys siitä, miksi monitasoiset mallit ovat välttämättömiä ja suositeltavia joillekin vaihtoehdoille (kuten ylemmän tason yksiköiden koodaaminen), annetaan klassisessa artikkelissa.

Hoffman, D.A. (1997). Katsaus hierarkkisten lineaaristen mallien logiikkaan ja perusteluihin. Journal of Management, 23, 723-744.

Hoffman-lehden voi ladata ilmaiseksi, jos Google tarjoaa "Hoffman 1997 HLM" -palvelun ja käytät pdf-tiedostoa verkossa.



Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 2.0-lisenssistä, jolla sitä jaetaan.
Loading...