Kysymys:
Selitä ero useiden regressioiden ja monimuuttujien regressioiden välillä käyttämällä mahdollisimman vähän symboleja / matematiikkaa
Neil McGuigan
2010-09-03 23:54:17 UTC
view on stackexchange narkive permalink

Onko moni- ja monimuuttujainen regressio todella erilainen? Mikä on muunnelma joka tapauksessa?

Viisi vastused:
#1
+57
chl
2010-09-04 00:03:08 UTC
view on stackexchange narkive permalink

Sanoisin hyvin nopeasti: 'moninkertainen' koskee ennustajien määrää, jotka tulevat malliin (tai vastaavasti suunnittelumatriisiin) yhdellä tuloksella (Y-vaste), kun taas 'monimuuttuja' viittaa vastevektorien matriisiin . Ei voi muistaa kirjoittajaa, joka aloittaa moniulotteisen mallinnuksen johdanto-osan tällä näkökohdalla, mutta mielestäni se on Brian Everitt hänen oppikirjassaan An R and S-Plus Companion to Multivariate Analysis. Jotta asiasta käydään perusteellista keskustelua, ehdotan, että tarkastelen hänen viimeisintä kirjaansa Multivariable Modeling and Multivariate Analysis for the Behavioral Sciences.

'Variate': lle sanoisin tämän on yleinen tapa viitata mihin tahansa satunnaismuuttujaan, joka seuraa tunnettua tai oletettua jakaumaa, esim puhumme gaussilaisista muunnelmista $ X_i $ normaalijakaumasta (parametreilla $ \ mu $ ja $ \ sigma ^ 2 $) tehdyn havainnon sarjana. Todennäköisesti sanoimme, että nämä ovat joitain X: n satunnaisia ​​ oivalluksia matemaattisella odotuksella $ \ mu $, ja noin 95% niistä odotetaan olevan alueella $ [\ mu-2 \ sigma; \ mu + 2 \ sigma] $.

Jopa https://www.coursera.org/learn/machine-learning/home/week/2 käyttää termiä monimuuttujainen regressio moniregressioiden sijasta ...
Mielestäni sama sekaannus syntyy ihmisten kanssa, jotka käyttävät termiä GLM yleiseen lineaariseen malliin (esim. Neurokuvantamistutkimuksissa) vs. yleistetty lineaarinen malli.Olen nähnyt monia "monimuuttujaisen logistisen regression" tapauksia, joissa on vain yksi tulos, enkä usko, että tällä on merkitystä niin kauan kuin kirjoittaja on selvästi määrittänyt termin.
#2
+47
user28
2010-09-04 00:27:21 UTC
view on stackexchange narkive permalink

Tässä on kaksi läheisesti liittyvää esimerkkiä, jotka kuvaavat ideoita. Esimerkit ovat jonkin verran Yhdysvaltojen keskitettyjä, mutta ideat voidaan ekstrapoloida muihin maihin.

Esimerkki 1

Oletetaan, että yliopisto haluaa tarkentaa pääsykriteereitään että he ottavat vastaan ​​parempia opiskelijoita. Oletetaan myös, että opiskelijan pisteiden keskiarvo (GPA) on se, mitä yliopisto haluaa käyttää opiskelijoiden suorituskykymittarina. Heillä on useita mielessä olevia kriteereitä, kuten lukion GPA (HSGPA), SAT-pisteet (SAT), sukupuoli jne., Ja haluaisivat tietää, mikä näistä kriteereistä on tärkeä GPA: n kannalta.

Ratkaisu: Moninkertainen regressio

Yllä olevassa yhteydessä on yksi riippuva muuttuja (GPA) ja sinulla on useita itsenäisiä muuttujia (HSGPA, SAT, Gender jne.). Haluat selvittää, mitkä riippumattomat muuttujat ovat hyviä ennustajia riippuvaiselle muuttujalle. Käytä tätä arviointia useilla regressioilla.

Esimerkki 2

Yllä olevan tilanteen sijaan oletetaan, että valintatoimisto haluaa seurata opiskelijoiden suorituksia ajan mittaan. ja haluaa selvittää, mikä heidän kriteereistään ohjaa opiskelijoiden suorituksia läpi ajan. Toisin sanoen heillä on GPA-pisteet neljän vuoden ajan, jonka opiskelija pysyy koulussa (esimerkiksi GPA1, GPA2, GPA3, GPA4) ja he haluavat tietää, mikä itsenäisistä muuttujista ennustaa GPA-pisteitä paremmin vuosi vuodelta. vuoden perusteella. Valintatoimisto toivoo löytävänsä, että samat riippumattomat muuttujat ennustavat suorituskykyä kaikissa neljässä vuodessa siten, että heidän valintaperusteidensa avulla opiskelijoiden suoritustaso on jatkuvasti korkea kaikkien neljän vuoden ajan. Ratkaisu: Monimuuttujainen regressio

Esimerkissä 2 meillä on useita riippuvia muuttujia (esim. GPA1, GPA2, GPA3, GPA4) ja useita itsenäisiä muuttujia. Tällaisessa tilanteessa käyttäisit monivaiheen regressiota.

On aina yksi, joka vastaa kysymykseen oikein esimerkkien avulla :)
100% paras vastaus, jonka voit todella ymmärtää
#3
+26
stackoverflowuser2010
2016-07-18 08:29:33 UTC
view on stackexchange narkive permalink

Yksinkertainen regressio koskee yhtä riippuvaa muuttujaa ($ y $) ja yhtä riippumatonta muuttujaa ($ x $): $ y = f (x) $

Moninkertainen regressio (alias monivaihteleva regressio) koskee yhdestä riippuvaa muuttujaa ja useita riippumattomia muuttujia: $ y = f (x_1, x_2, ..., x_n) $

Monimuuttujainen regressio koskee useita riippuvia muuttujia ja useita vahvat> itsenäiset muuttujat: $ y_1, y_2, ..., y_m = f (x_1, x_2, ..., x_n) $. Saatat kohdata ongelmia, joissa sekä riippuvat että itsenäiset muuttujat on järjestetty muuttujien matriiseiksi (esim. $ Y_ {11}, y_ {12}, ... $ ja $ x_ {11}, x_ {12}, ... $ ), joten lauseke voidaan kirjoittaa muodossa $ Y = f (X) $, jossa isot kirjaimet tarkoittavat matriiseja.

Lue lisää:

Ymmärrän määritelmän.Mutta mitä vaikutusta on monivaiheisen regressioon käsitteleminen yksimuuttuisten regressioiden järjestelmänä?
@LKS: Voit halutessasi kysyä sen täysin erillisessä kysymyksessä.
https://stats.stackexchange.com/questions/254254/why-do-we-need-multivariate-regression-as-opposed-to-a-bunch-of-univariate-regr
Viittikö Quoran vastaus tähän sivuun?: P
#4
+4
thecity2
2017-03-04 03:44:58 UTC
view on stackexchange narkive permalink

Mielestäni keskeinen näkemys (ja erottelija) tässä yhtälön kummallakin puolella olevien muuttujien lukumäärän lisäksi on, että monimuuttujaisen regressiotapauksen tavoitteena on hyödyntää sitä, että vastauksen välillä on (yleensä) korrelaatiomuuttujat (tai tulokset).Esimerkiksi lääketieteellisessä tutkimuksessa ennustajat voivat olla paino, ikä ja rotu, ja tulosmuuttujat ovat verenpaine ja kolesteroli.Voisimme teoriassa luoda kaksi "moninkertaisen regressiomallin", yhden regressiivisen verenpaineen painoon, ikään ja rotuun ja toisen mallin regressiivisen kolesterolin samoihin tekijöihin.Vaihtoehtoisesti voimme kuitenkin luoda yhden monivaiheen regressiomallin, joka ennustaa sekä verenpaineen että kolesterolin samanaikaisesti kolmen ennustemuuttujan perusteella.Ajatuksena on, että monimuuttujainen regressiomalli voi olla parempi (ennakoivampi) siinä määrin, että se voi oppia enemmän potilaiden verenpaineen ja kolesterolin välisestä korrelaatiosta.

Hieno asia.Mietin, voidaanko monimuuttujainen regressio tehdä R.: n avulla. Käyttäen Manovaa, pystyn tekemään monivaiheen ANOVA: n, mutta en pysty saamaan kertoimia, kuten yksimuuttujainen regressio.
#5
+1
Bhabesh Mahanta
2019-03-04 19:56:59 UTC
view on stackexchange narkive permalink

Monimuuttujaregressiossa on enemmän kuin yksi riippuvainen muuttuja, jolla on erilaiset varianssit (tai jakaumat).Ennustavat muuttujat voivat olla useampi kuin yksi tai useita.Joten se voi olla moninkertainen regressio riippuvien muuttujien matriisin kanssa, ts.e.useita variansseja. Mutta kun sanomme useita regressioita, tarkoitamme vain yhtä riippuvaa muuttujaa yhdellä jakaumalla tai varianssilla.Ennustavat muuttujat ovat useampia kuin yksi. Useiden yhteenveto viittaa useampaan kuin yhteen ennakoivaan muuttujaan, mutta monimuuttuja viittaa useampaan kuin yhteen riippuvaan muuttujaan.



Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 2.0-lisenssistä, jolla sitä jaetaan.
Loading...