Kysymys:
Käytännön ajatuksia selittävästä tai ennakoivasta mallinnuksesta
wahalulu
2010-08-04 01:19:57 UTC
view on stackexchange narkive permalink

Osallistuin huhtikuussa UMD: n matematiikkaosaston tilastoryhmän seminaarisarjaan "Selitää tai ennustaa?". Puheen piti Prof. Galit Shmueli, joka opettaa UMD: n Smith Business Schoolissa. Hänen puheensa perustui tutkimukseen, jonka hän teki artikkelille "Ennakoiva vs. selittävä mallinnus IS-tutkimuksessa", ja jatko-työpaperille nimeltä "Selitettäväksi tai ennustettavaksi?".

Dr. Shmuelin väite on, että termit ennakoiva ja selittävä tilastollisessa mallintamisessa ovat sekoittuneet ja että tilastokirjallisuudesta puuttuu perusteellinen eroerot. Asiakirjassa hän vertaa molempia ja puhuu niiden käytännön seurauksista. Kehotan teitä lukemaan paperit.

Kysymykset, jotka haluaisin esittää lääkäriyhteisölle, ovat:

  • Kuinka määrität ennustavan harjoituksen vs. selittävän / kuvaavan? Olisi hyödyllistä, jos voisit puhua tietystä sovelluksesta.
  • Oletko koskaan joutunut ansaan käyttää yhtä, kun tarkoitat käyttää toista? Minulla on varmasti. Mistä tiedät mitä käyttää?
Tämän kysymyksen ehdotetaan olevan suljettu. Katso: http://meta.stats.stackexchange.com/questions/213/list-of-candidate-questions-to-be-closed Katson, että sillä on 2 ääntä. Voivatko äänestäjät tai OP kommentoida, miksi he haluaisivat kysymyksen pysyvän avoimena metakierteessä?
Sen sijaan, että sanoisit "tämän pitäisi olla suljettu. Joku puolustaa sitä". Entä selittämällä miksi haluat sen suljetuksi. Liian epämääräinen? Pyydä sitten selvennystä. Tämä vaikuttaa mielestäni järkevältä. Kysyjä esittää paperin ja kysyy, miten ero ennakoivien ja selittävien tilastojen välillä on. Ainoa muutos, jonka haluaisin tehdä kysymykseen, on selventää kysymys tarkalleen, mikä helpottaa äänestämistä.
Olen jo tarjonnut syyn meta-langalle. Uskon, että kysymyksestä käydyt metakeskustelut sekoittavat tämän sivun.
@Srikant @JD Otan kysymyksen esille. Kiitos palautteesta. Uskon, että tämä on aihe, josta on syytä keskustella.
Kysymyksesi olisi hyvä yhteisölle, jos voisit sen sijaan, että kertoisit meille elämäsi, määritellä, mikä on (sinun mukaan) ennustava malli ja selittävä malli. Mielestäni hienot keskustelut alkavat selkeillä määritelmillä ...
Voisitko esittää kysymyksen täällä? Onko kysymys onko paperi oikea?
@srikant et ilmeisesti ymmärrä kysymysten alla olevien kommenttien luonnetta. Ne ovat määritelmän mukaan meta. Ne eivät ole vastauksia. Ne eivät ole kysymyksiä. Ne ovat meta. On tuhlaavaa ja typerää järjestää kokous, jossa kommenteista tulee osoitus metakeskusteluihin muualla.
@JD Ehkä. Mutta kysymyksen sulkemisprosessin hallitsemiseksi on omistettu metaketju. Jos en mainitse sitä, että tämä kysymys ehdotetaan suljettavaksi, yhteisö ei saa mahdollisuutta sanoa, pitäisikö sen pysyä avoimena vai ei. Yksi toinen asia on tarkastella henkilöä, joka kompastuu tähän kysymykseen kaukaisessa tulevaisuudessa. Kaikki tämä keskustelu siitä, pitäisikö meidän pitää kysymys avoimena ja miksi, on hieman merkityksetön. Mielestäni kommentteja olisi käytettävä selventämään kysymystä, jotta ei keskustella sen ansioista.
@srikant. Se on ilmaistu selkeästi ja selvästi. Tämä keskustelu kuuluu luultavasti meta-alueelle, koska se ei ole erityinen yllä olevaan kysymykseen. :) joo, ok, se oli vähän paska kommentti ... En voinut vastustaa sitä! Teet hyvän asian. Uskon, että voimme olla samaa mieltä siitä, että @wahalulu tarvitsi selvittää kysymyksensä. Luulen, että hän liikkuu oikeaan suuntaan.
Erittäin tuottava kysymys, koska käsittelemme sitä yhtenä ilman oikeaa vastausta.
@rolando2 Vaikka osa tästä kysyy useita vastauksia, kysymyksen ydin pyytää erottamaan "ennakoivan" ja "selittävän / kuvaavan" harjoituksen. Tällä on mahdollisesti objektiivisesti oikea vastaus. CW ei näytä sopivalta valinnalta tähän kysymykseen.
Tämä kysymys liittyy vahvasti merkitsevyystestien asiaan yleistysvirheisiin perustuvan mallin valinnan jälkeen. Katso: http: //stats.stackexchange.com/q/17825/6961
mahdollinen kopio [Käytännön ajatukset selittävästä ennustavasta mallinnuksesta] (http://stats.stackexchange.com/questions/18896/practical-oughts-on-explanatory-vs-predictive-modeling)
Minusta tuntuu, että tässä ja alla selityksiä ja kuvauksia käytetään virheellisesti synonyymeinä.Lue alla olevat kommenttini prof Shmuelin vastauksesta.
Kuusitoista vastused:
#1
+40
probabilityislogic
2011-11-26 15:15:58 UTC
view on stackexchange narkive permalink

Yhdessä lauseessa

Ennakoiva mallinnus koskee "mitä todennäköisesti tapahtuu?", kun taas selittävä mallinnus koskee "mitä voimme tehdä sen hyväksi?"

Monissa lauseissa

Mielestäni tärkein ero on siinä, mitä analyysin kanssa on tarkoitus tehdä. Ehdotan, että selitys on paljon tärkeämpi interventiolle kuin ennustaminen. Jos haluat tehdä jotain tuloksen muuttamiseksi, sinun on parasta etsiä selittää, miksi se on niin. Selittävä mallinnus, jos se tehdään hyvin, kertoo kuinka puuttua asiaan (mitä syötettä tulisi säätää). Jos kuitenkin haluat vain ymmärtää, millainen tulevaisuus on, ilman mitään aikomusta (tai kykyä) puuttua asiaan, ennakoiva mallinnus on todennäköisempää.

Uskomattoman löyhänä esimerkkinä " syöpätiedot ".

Ennakoiva mallinnus" syöpätietojen "avulla olisi tarkoituksenmukaista (tai ainakin hyödyllistä), jos rahoitat eri sairaaloiden syöpäosastoja. Sinun ei todellakaan tarvitse selittää, miksi ihmiset sairastuvat syöpään, vaan sinun tarvitsee vain tarkka arvio siitä, kuinka paljon palveluita tarvitaan. Selittävä mallinnus ei todennäköisesti auttaisi tässä paljon. Esimerkiksi tietäen, että tupakointi johtaa suurempaan syöpäriskiin, ei sinänsä kerrotaan, annetaanko enemmän varoja osastolle A vai osastolle B.

"Syövätietojen" selittävä mallintaminen olisi tarkoituksenmukaista, jos halusit vähentää kansallista syövän määrää - ennustava mallinnus olisi täällä melko vanhentunutta. Kyky ennustaa syöpätasot tarkasti ei todennäköisesti auta sinua päättämään, kuinka vähentää sitä. Tieto siitä, että tupakointi johtaa suurempaan syöpäriskiin, on kuitenkin arvokasta tietoa - koska jos alennat tupakointitasoa (esim. Tekemällä savukkeista kalliimpia), tämä johtaa siihen, että useammalla ihmisellä on vähemmän riskiä, ​​mikä (toivottavasti) johtaa odotettuun syövän laskuun hinnat.

Tarkastellessani ongelmaa tällä tavalla luulisin, että selittävä mallinnus keskittyy lähinnä muuttujiin, jotka ovat käyttäjän hallinnassa joko suoraan tai epäsuorasti. Saattaa olla tarve kerätä muita muuttujia, mutta jos et voi muuttaa mitään muuttujista analyysissä, epäilen, että selittävä mallintaminen on hyödyllistä, paitsi ehkä antaa sinulle halun hallita tai vaikuttaa näihin muuttujiin jotka ovat tärkeitä. Ennakoiva mallinnus etsii karkeasti vain muuttujien välisiä assosiaatioita, riippumatta siitä, hallitseeko käyttäjä vai ei. Sinun tarvitsee vain tietää tulot / ominaisuudet / riippumattomat muuttujat / jne. Ennusteen tekemistä varten, mutta sinun on pystyttävä muokkaamaan tai vaikuttamaan tuloihin / ominaisuuksiin / itsenäisiin muuttujiin / jne. Voidaksesi puuttua asiaan ja muuttaa tulosta .

+1, hienosti tehty! Vihaan nitpickiä, mutta haluan huomata, että ennusteen ei tarvitse koskea tulevaisuutta. Esimerkiksi arkeologi voi haluta määrittää (ts. Ennustaa) sademäärän alueella menneisyyden pisteessä tuntemalla jäljellä olevat jäljet ​​(eli sateiden vaikutukset).
@gung - Luulin, että kirjoitin vastaukseni niin, ettei näin käynyt. Selvästi, kaipasin paikkaa :-)
Hieno vastaus.Mielestäni meidän on monissa tapauksissa tiedettävä, miltä tulevaisuus näyttää ja miksi.Oletetaan, että opiskellessasi asiakkaan vaihtumista haluat tietää, kuinka monta asiakasta (ja tarkalleen mikä asiakas) vaihtaa seuraavana N kuukautena ja miksi he sitten vaihtelevat, jotta markkinointi voi puuttua niihin.Sitten tarvitsemme sekä ennakoivaa (oppiaksemme tulevaisuuden lukumäärää ja asiakkaita) että selittäviä, jotta voimme kertoa meille miksi, jotta voimme vähentää heittimiä.Joten onko meillä molempien hybridimalli vai riittääkö yksi?Varty koskettaa sitä sanomalla "Tunnettu suhde voi syntyä selittävästä / kuvaavasta analyysistä tai muusta tekniikasta"
-1
@Alexis,, joka on varmasti mahdollista, mutta on myös mahdollista, että se ei ole arkeologin ensisijainen tutkimuskohde, ja että muut tutkijat (paleoklimatologit) ovat jo keränneet nämä tiedot ja arkeologi haluaa yksinkertaisesti käyttää näitä tietoja heidän ensisijaisten teorioidensa testaamiseenteoreettinen kiinnostus ([Gill, 200] (https://www.worldcat.org/title/great-maya-droughts-water-life-and-death/oclc/43567384)).
#2
+31
varty
2011-11-26 01:23:50 UTC
view on stackexchange narkive permalink

Mielestäni erot ovat seuraavat:

Selittävä / kuvaileva

Kun etsit selittävää / kuvailevaa vastausta, ensisijainen painopiste on meillä olevat tiedot ja pyrimme selvittämään tietojen väliset suhteet melun laskemisen jälkeen.

Esimerkki: Onko totta, että säännöllinen liikunta (esimerkiksi 30 minuuttia päivässä) johtaa alentaa verenpainetta? Vastaamiseksi tähän kysymykseen voimme kerätä potilailta tietoja heidän harjoitteluohjelmastaan ​​ja verenpaineen arvoistaan ​​ajan mittaan. Tavoitteena on selvittää, pystymmekö selittämään verenpaineen vaihtelut harjoitteluohjelman vaihteluilla.

Verenpaineeseen vaikuttaa paitsi liikunta myös monien muiden tekijöiden, kuten kuten natriumin määrä syö henkilö jne. Näitä muita tekijöitä pidettäisiin meluna yllä olevassa esimerkissä, koska painopiste on liikuntaohjelman ja verenpaineen välisen suhteen kiusoittamisessa.

Ennuste vahva >

Suoritellessamme ennakoivaa harjoitusta ekstrapoloimme tuntemattomaan käyttämällä tunnettuja suhteita käsillä olevien tietojen välillä. Tunnettu suhde voi syntyä selittävästä / kuvaavasta analyysistä tai jostakin muusta tekniikasta.

Esimerkki: Jos liikun 1 tunti päivässä, missä määrin verenpaineeni todennäköisesti laskee? Vastauksena tähän kysymykseen voimme käyttää ennusteen tekemiseen aiemmin paljastamatonta suhdetta verenpaineen ja liikunnan välillä.

Edellä mainitussa yhteydessä ei keskity selitykseen, vaikka selittävä malli voi auttaa ennustusprosessi. On myös ei-selittäviä lähestymistapoja (esim. Hermoverkot), jotka pystyvät ennustamaan tuntemattoman lisäämättä välttämättä tietämystämme muuttujien välisen taustan suhteen luonteesta.

+1 Tämä vastaus välttää suurelta osin sekaannuksen liittämisen syy-yhteyteen käyttämällä selityksen, kuvauksen ja suhteen kieltä. Tämä antaa sille toivottavan selkeyden.
Kohdassa Selitys kirjoitit "pääpaino on meillä olevissa tiedoissa" - luulen, että yrität sanoa, että tehtävä on takautuva (toisin kuin ennusteen tulevaisuuden luonne). Selityksessä (lue "syy-selitys") on itse asiassa keskitytty laajasti teoriaan ja toimialatietoon ja tietoja käytetään näiden oletusten / teorioiden testaamiseen. Sen sijaan ennusteessa se on enemmän datapohjaista ja olet suhtautumisesta avoimempi, koska etsit syy-yhteyttä vaan pikemminkin korrelaatiota.
@GalitShmueli Reg-teoria / verkkotunnustieto - kyllä, olen samaa mieltä siitä. Yritin yksinkertaisesti verrata ennustetta visuaaliseen selitykseen keskittymällä siihen, mikä minusta näyttää olevan keskeinen ero - muuttujan arvon ekstrapolointi vs muuttujien välisen suhteen selvittäminen. Prosessissa olen tietysti syyllinen pienten vivahteiden laiminlyöntiin näiden kahden paradigman välillä.
@varty Olen samaa mieltä mielipiteesi: selityksessä / kuvauksessa olet kiinnostunut yleisestä / keskimääräisestä suhteesta / vaikutuksesta, kun taas ennusteessa olet kiinnostunut ennustamaan yksittäisiä arvoja (ei välttämättä ekstrapolointia)
#3
+19
Rob Hyndman
2010-08-04 04:36:09 UTC
view on stackexchange narkive permalink

Yksi käytännön kysymys, joka nousee esiin, on muuttujan valinta mallinnuksessa. Muuttuja voi olla tärkeä selittävä muuttuja (esim. On tilastollisesti merkitsevä), mutta ei välttämättä ole hyödyllinen ennustamistarkoituksiin (ts. Sen sisällyttäminen malliin johtaa huonompaan ennustustarkkuuteen). Näen tämän virheen melkein joka päivä julkaistuissa julkaisuissa.

Toinen ero on pääkomponenttianalyysin ja tekijäanalyysin erottelussa. PCA: ta käytetään usein ennustamiseen, mutta se ei ole niin hyödyllinen selitykseksi. FA sisältää lisäkiertovaiheen, joka tehdään tulkinnan (ja siten selityksen) parantamiseksi. Tästä on mukava viesti tänään Galit Shmuelin blogissa.

Päivitys: kolmas tapaus syntyy aikasarjoissa, kun muuttuja voi olla tärkeä selittävä muuttuja, mutta se ei vain ole ' t käytettävissä tulevaisuudessa. Esimerkiksi asuntolainat voivat olla vahvasti yhteydessä BKT: hen, mutta siitä ei ole paljon hyötyä tulevien asuntolainojen ennustamiseen, ellei meillä ole myös hyviä ennusteita BKT: stä.

Miksi / miten tärkeä selittävä muuttuja vähentäisi ennakoivaa tarkkuutta?
@Srikant. Tämä voi tapahtua, kun selittävällä muuttujalla on heikko mutta merkittävä suhde vastemuuttujaan. Sitten kerroin voi olla tilastollisesti merkitsevä, mutta vaikea arvioida. Näin ollen ennusteiden MSE voi kasvaa, kun muuttuja otetaan huomioon, verrattuna siihen, kun se jätetään pois. (Bias vähenee sisällyttämällä siihen, mutta varianssi kasvaa.)
Ensimmäinen kohta on erittäin hyvä asia. Silti joskus on vielä pahempaa; täällä PMID: 18052912 on loistava esimerkki siitä, että joskus sarjan parempi meluosa voidaan tehdä kuin tosi - on ilmeistä, että satunnaisdatalla voidaan tehdä hyvä malli, mutta tämä on hieman järkyttävää .
anteeksi anteeksi, mutta eikö kierto ole normaalisti osa PCA: ta ja FA: ta?
Tilastollisesti sig. mutta heikko ennustaja on harvoin tehokas joko ennustamiseen tai selitykseen. Esimerkiksi, jos lineaarisen regressioratkaisun RSQ on 0,40 ilman ennakoijan X1 sisällyttämistä ja jos X1: n sisällyttäminen lisää tähän RSQ: hon 0,01, niin X1 ei ole "tärkeä" ennustamisen eikä selityksen kannalta.
Ensimmäisen kappaleen osalta voit näyttää tämän esimerkillä - ennusteen keskimääräinen neliövirhe koostuu yleensä kahdesta osasta - parametriarvioinnin epävarmuus ja selittämätön vaihteluepävarmuus. OLS-regressiota varten nämä komponentit annetaan muodossa $ s ^ 2x_i ^ T (X ^ TX) ^ {- 1} x_i $ (parametri) ja $ s ^ 2 $ (selittämätön). Tässä $ s ^ 2 $ on arvioitu varianssi jäännöksissä ja $ X $ on mallimatriisi, jota käytetään mallin sovittamiseen, ja $ x_i $ on regresorien vektori ennusteita varten.
@rolando2 - tämä voi olla totta ennusteen laadulle, mutta uuden muuttujan sisällyttäminen voi vaikuttaa suuresti itse ennusteisiin.
@probabilityislogic - Voisitteko laajentaa tätä kohtaa? Kiitti.
Edellä kirjoittaessani "tärkeän" ennustamista tai selitystä varten "laiminlyöin tapauksen, jossa tärkeä syy-muuttuja on melkein täysin ennustettavissa muiden, vähemmän syy-muuttujien joukon perusteella.
@rolando2 - ajatukseni oli, että X1: n sisällyttäminen voi johtaa erilaisiin ennusteisiin. Joten sinulla voi olla $ | \ hat {y} _ {X1} - \ hat {y} _ {ei X1} | >> 0 $. Joten vaikka odotamme molempien ennusteiden olevan samanlaiset etäisyydet "todellisen arvon" kanssa (vastaavasta $ R ^ 2 $: sta), emme odota niiden olevan lähellä toisiaan. Lisäksi, jos sinulla on 1000 dollaria dollaria datapisteitä, $ R ^ 2 $ korottaminen 0,4 dollarista 0,41 dollariin tarkoittaa erittäin merkittävää ennustajaa ("konservatiivinen" BIC on 10 dollaria yksikköä pienempi suuren mallin alla tai Bayes-tekijä noin 20000 dollaria $ suuremman mallin hyväksi).
@probabilityislogic - kiitos lisäpisteistäsi. Ensimmäinen vaikuttaa minuun enemmän, johon liittyy erilaisia ​​olennaisia ​​johtopäätöksiä ennustetuista arvoista, kuin toinen, joka koskee tilastoa. sig. pikemminkin kuin mitään olennaista, jos luen sitä oikein.
#4
+17
Galit Shmueli
2011-11-26 10:50:32 UTC
view on stackexchange narkive permalink

Vaikka joidenkin mielestä on helpoin ajatella eroa käytetyn mallin / algoritmin suhteen (esim. hermoverkot = ennakoiva), se on vain yksi erityinen näkökohta selittää / ennustaa -erotuksessa. Tässä on diasarja, jota käytän tiedonlouhintakurssilleni lineaarisen regressio-opetuksen molemmista kulmista. Vaikka pelkästään lineaarinen regressio ja tämän pienen esimerkin avulla nousevat esiin erilaisia ​​asioita, jotka johtavat erilaisiin malleihin selittäville ja ennakoiville tavoitteille (muuttujien valinta, muuttujien valinta, suorituskykymittarit jne.)

Galit

Onko uteliaisuudesta tarkoituksellista, että keskustelussa ennusteen regressiosta (aloitat s. 33) valitset ennustimet (vaihe 1) * ennen * osiointia koulutus- ja validointitietojoukoihin (vaihe 3)? Olen ajatellut, että objektiivisin ja rehellisin menettely olisi osiointi alusta alkaen, jopa ennen sirontakuvien tarkastelua (vaihe 2). Jos regressorit valitaan koko tietojoukon perusteella, eikö tämä paisuta näennäisiä merkitsevyystasoja monissa testeissä, vaikka niitä sovellettaisiin myöhemmin validointitietoihin?
Mielestäni yleisempi kysymys on, suoritatko tietojen visualisoinnin ennen pidon pitämistä. Kun tietojoukko on suuri, sillä ei ole merkitystä. Pienellä otoksella visualisoinnin käyttäminen ennustajien valintaan on todellakin vaarallista. Dioissani en tarkoita visualisoinnin käyttöä muuttujien valinnassa. "Valitse ennustimet" on yleisemmin "valitse mahdollinen käytettävissä olevien ennustajien joukko, joka on kohtuullinen". Kyse on enemmän verkkotunnustiedon sisällyttämisestä kohtuullisen joukon valitsemiseen.
Jatkamalla aihetta "Selittämään tai ennustamaan", minulla on asiaan liittyvä kysymys [täällä] (http://stats.stackexchange.com/questions/177391/paradox-in-model-selection-aic-bic-to-explain-tai ennustaa).Olisin kiitollinen, jos katsot, koska kysymys perustuu enimmäkseen paperillesi.
Professori Shmueli, sanot tätä aihetta käsittelevän kirjoituksesi sivulta 291, että harkitset vain "ei-stokastista ennustusta" sellaisena kuin se on määritelty Geisser, 1993. Mistä voisin löytää täydellisen määritelmän ei-stokastisesta ennustuksesta?Mukava aloittaa myös uusi viesti, mutta ajattelin kysyä ensin tästä.
@GalitShmueli, professori, artikkelistasi oli minulle paljon hyötyä.Mielestäni se valotti useita epäselviä kohtia tilastollisista malleista ja työkaluista, ennen kaikkea regressiosta.Kiitos!Siellä on kuitenkin kohta, joka ei ole minulle selvä.Artikkelisi keskittyy selittäviin malleihin, jotka on tarkoitettu syy- ja ennakointimalleiksi.Mainitsette vain kolmannen tyyppisen mallin, kuvailevat: "Vaikka tämä artikkeli ei ole keskipisteessä, kolmas mallintamistyyppi, jota tilastotieteilijät käyttävät ja kehittävät, on kuvaileva mallinnus."sivu 291.
Täällä jakamissasi dioissa selitystä ja kuvausta käytetään kuitenkin synonyyminä.Miksi? Lisäksi olen lukenut toisen diasarjan, jossa kolme konseptia ovat selvästi erilliset.Kirjoitin aiheeseen liittyvän kysymyksen täältä (https://stats.stackexchange.com/questions/464261/regression-causation-vs-prediction-vs-description) kommenttisi ovat erittäin arvostettuja.
@markowitz - kiitos, että ilmoitit minulle uudestaan tästä säikeestä.Tässä on äskettäinen diasarja, joka erottaa selityksen / ennustuksen / kuvauksen, ja näet erityisesti regressiominaisuuden.https://www.slideshare.net/gshmueli/to-explain-to-predict-or-to-describe
@GalitShmueli, Kiitos, että olet jakanut nuo viimeisimmät dian kannet täällä.Kuin kuitenkin jo lukenut ne, myös tästä syystä olin vakuuttunut siitä, että selitys ja kuvaus eivät ole synonyymejä.Lisäksi minulla on vielä epäilyksiä kuvauksen roolista regressiossa.Kuten jo edellisessä kommentissani (linkin kanssa) sanoin, kirjoitin kysymyksen tästä.Ehdotuksiasi siitä olisi erittäin arvostettua.
#5
+11
Jeromy Anglim
2010-08-04 11:16:41 UTC
view on stackexchange narkive permalink

Esimerkki: Klassinen esimerkki, jonka olen nähnyt, liittyy ihmisen suorituskyvyn ennustamiseen. Itsetehokkuus (eli missä määrin henkilö luulee pystyvänsä suorittamaan tehtävän hyvin) on usein vahva ennustaja tehtävän suorittamisesta. Jos siis laitat itsetehokkuuden moninkertaiseen regressioon muiden muuttujien, kuten älykkyyden ja aiemman kokemuksen, kanssa, huomaat usein, että itsetehokkuus on vahva ennustaja.

Tämä on johtanut joitain tutkijoita ehdottaa, että itsetehokkuus aiheuttaa tehtävän suorittamisen. Ja että tehokkaat interventiot ovat sellaisia, joissa keskitytään lisäämään ihmisen itsetehokkuuden tunnetta.

Vaihtoehtoinen teoreettinen malli näkee itsetehokkuuden kuitenkin suurelta osin seurauksena tehtävän suorittamisesta. Eli, jos olet hyvä, tiedät sen. Tässä yhteydessä interventioiden tulisi keskittyä todellisen osaamisen lisäämiseen eikä havaittuun osaamiseen.

Joten muuttujan, kuten itsetehokkuuden, sisällyttäminen voi lisätä ennustetta, mutta olettaen, että otat itsetehokkuuden seurauksena -mallin, se ei pitäisi sisällyttää ennustajaksi, jos mallin tarkoituksena on selvittää suorituskykyyn vaikuttavia syy-prosesseja.

Tämä herättää tietysti aiheen syy-teoreettisen mallin kehittämiseen ja validointiin. Tämä perustuu selvästi useisiin tutkimuksiin, mieluiten kokeelliseen manipulointiin, ja johdonmukaiseen argumenttiin dynaamisista prosesseista.

Proksimaalinen vs. distaalinen : Olen nähnyt samanlaisia ​​asioita, kun tutkijat ovat kiinnostuneita distaalisten ja proksimaalisten syiden vaikutukset. Lähimmät syyt ennustavat yleensä paremmin kuin distaaliset syyt. Teoreettinen kiinnostus voi kuitenkin olla ymmärtää tapoja, joilla distaaliset ja proksimaaliset syyt toimivat.

Muuttuva valintakysymys : Lopuksi valtava asia yhteiskuntatieteellisessä tutkimuksessa on vaihteleva valintakysymys Missä tahansa tutkimuksessa on ääretön määrä muuttujia, jotka olisi voitu mitata mutta eivät. Siksi mallien tulkinnassa on otettava huomioon tämän seuraukset teoreettisia tulkintoja tehdessä.

Yhteiskuntatieteessä on myös ongelma "heikko hypoteesi" (esim. Vaikutus on positiivinen vs. negatiivinen). Ja tuossa "itsetehokkuuden" esimerkissä voit nähdä sen sisäisenä suorituskyvyn ennustajana, jonka kukin henkilö on rakentanut. Joten se on todennäköisesti samanlainen kuin "mustan laatikon" ennusteen käyttö selittävänä muuttujana.
#6
+9
Nikita Zhiltsov
2011-11-27 03:03:37 UTC
view on stackexchange narkive permalink

Tilastollinen mallintaminen: kaksi kulttuuria (2001), kirjoittanut L. Breiman, on ehkä paras asia tässä asiassa. Hänen tärkeimmät johtopäätöksensä (katso myös muiden merkittävien tilastotieteilijöiden vastaukset asiakirjan lopussa) ovat seuraavat:

  • "Enemmän ennakointitarkkuutta liittyy luotettavampaan tietoon taustalla olevasta datamekanismista. Heikko ennustustarkkuus voi johtaa kyseenalaisiin johtopäätöksiin. "
  • " Algoritmiset mallit voivat antaa paremman ennustettavuuden kuin datamallit ja tarjota parempaa tietoa taustalla olevasta mekanismista. "
Vain linkin luomiseksi aikaisempaan aiheeseen liittyvään kysymykseen: [Kaksi kulttuuria: tilastot vs. koneoppiminen?] (Http://stats.stackexchange.com/q/6/930)
Algoritmisten mallien ongelmana on, että niitä on vaikea ymmärtää. Tämän vuoksi on vaikea diagnosoida ja korjata mahdollisia ilmeneviä ongelmia. Rakennemallia on paljon helpompi arvioida, koska tiedät miltä jokaisen komponentin tulisi näyttää.
#7
+8
John Myles White
2010-08-04 01:39:20 UTC
view on stackexchange narkive permalink

En ole lukenut hänen teoksiaan linkitetyn artikkelin tiivistelmää pidemmälle, mutta mielestäni ero "selityksen" ja "ennustamisen" välillä tulisi heittää pois ja korvata harjoittajan tavoitteiden välisellä erotuksella, joka ovat joko "kausaalisia" tai "ennustavia". Yleisesti ottaen mielestäni "selitys" on niin epämääräinen sana, että se ei tarkoita melkein mitään. Onko Hooken laki esimerkiksi selittävä vai ennakoiva? Onko spektrin toisessa päässä ennakoivan tarkat suositusjärjestelmät hyviä syy-malleja yksiselitteisistä luokituksista? Luulen, että me kaikki olemme samaa mieltä siitä, että tieteen tavoite on selitys, kun taas tekniikan tavoite on ennustaminen; ja tämä intuitio jotenkin hukkuu käytetyistä työkaluista, kuten valvotuista oppimisalgoritmeista, joita voidaan käyttää sekä kausaalisen päättelyn että ennustavan mallinnuksen kannalta, mutta jotka ovat todella puhtaasti matemaattisia laitteita, jotka eivät ole sisäisesti yhteydessä "ennustamiseen" tai "selitykseen" .

Tämän kaiken sanottuani ehkä ainoa sana, jota käytän malliin, on tulkittavissa. Regressiot ovat yleensä tulkittavissa; monikerroksiset hermoverkot eivät usein ole niin. Mielestäni ihmiset joskus naiivisti olettavat, että tulkittavissa oleva malli tarjoaa syy-tietoa, kun taas tulkitsemattomat mallit tarjoavat vain ennustavaa tietoa. Tämä asenne tuntuu minusta yksinkertaisesti sekavalta.

#8
+7
user28
2010-08-04 02:32:41 UTC
view on stackexchange narkive permalink

Olen edelleen hieman epäselvä, mikä kysymys on. Tästä huolimatta mielestäni ennustavan ja selittävän mallin välinen olennainen ero on niiden painopisteen ero.

Selittävät mallit

Selvitysmallit ovat määritelmän mukaan ensisijaisena tavoitteena on selittää jotain todellisessa maailmassa. Useimmissa tapauksissa pyrimme tarjoamaan yksinkertaisia ​​ja puhtaita selityksiä. Yksinkertaisella tarkoitan mieluummin parsimonia (selitä ilmiöt mahdollisimman pienillä parametreillä) ja puhtaalla tarkoitan, että haluaisimme tehdä seuraavanlaiset lausunnot: "$ x $: n muuttamisen vaikutus yksikköön muuttaa $ y: tä $ by $ \ beta $ pitämällä kaikkea muuta vakiona ". Kun otetaan huomioon nämä yksinkertaisten ja selkeiden selitysten tavoitteet, selittävillä malleilla pyritään rankaisemaan monimutkaisia ​​malleja (käyttämällä sopivia kriteerejä, kuten AIC) ja mieluummin hankkimaan ortogonaalisia riippumattomia muuttujia (joko kontrolloitujen kokeiden tai sopivien datamuunnosten avulla).

Ennakoivat mallit

Ennakoivien mallien tavoitteena on ennustaa jotain. Siksi heillä on taipumus keskittyä vähemmän simssimiseen tai yksinkertaisuuteen, mutta enemmän kykyynsä ennustaa riippuvainen muuttuja.

Edellä on kuitenkin jonkin verran keinotekoinen ero, koska ennustamiseen voidaan käyttää selittäviä malleja ja joskus ennustavat mallit voivat selittää jotain.

+1 mainitsemalla ** monimutkaisuus **, jota parhaat vastaukset eivät maininneet suoraan. Haaste kuitenkin syntyy, kun interventioihin käytetään selittäviä malleja. Kuinka voidaan varmistaa, että arvioidut kertoimet eivät ole puolueellisia, mikä on yleinen ongelma, joka johtuu parsimoniasta?
#9
+5
Shane
2010-08-04 02:30:22 UTC
view on stackexchange narkive permalink

kuten muut ovat jo sanoneet, ero on hieman merkityksetön, paitsi siltä osin kuin tutkijan tavoitteet koskevat.

Brad Efron, yksi The Two Cultures -lehden kommentoijista, teki seuraavan havainnon (kuten edellisessä kysymyksessäni käsiteltiin):

Ennuste itsessään riittää vain satunnaisesti. Posti on tyytyväinen kaikkiin menetelmiin, jotka ennustavat oikeat osoitteet käsin kirjoitetuista luonnoksista. Peter Gregory sitoutui tutkimukseensa ennustamistarkoituksiin, mutta myös ymmärtämään paremmin hepatiitin lääketieteellistä perustaa. Useimpien tilastollisten tutkimusten päätavoitteena on syy-tekijöiden tunnistaminen.

Tietyt kentät (esim. Lääketiede) painottavat painavasti mallin sovittamista selittävänä prosessina (jakauma jne.) keinona ymmärtää taustalla oleva prosessi, joka tuottaa tiedot. Muut kentät ovat vähemmän kiinnostuneita tästä, ja ovat tyytyväisiä "musta laatikko" -malliin, jolla on erittäin suuri ennustava menestys. Tämä voi toimia tiensä myös mallinrakennusprosessiin.

#10
+5
gung - Reinstate Monica
2011-11-26 09:23:21 UTC
view on stackexchange narkive permalink

Kunnioittavasti tämä kysymys voitaisiin kohdistaa paremmin. Ovatko ihmiset koskaan käyttäneet yhtä termiä, kun toinen oli sopivampi? Tottakai. Joskus se on tarpeeksi selkeä kontekstista, tai et halua olla pedanttinen. Joskus ihmiset ovat vain huolimattomia tai laiskoja terminologiassaan. Tämä pätee moniin ihmisiin, enkä todellakaan ole parempi.

Tässä on potentiaalista arvoa (keskustelemalla selityksestä vs. ennustamisesta CV: stä) on selventää näiden kahden lähestymistavan välistä eroa. Lyhyesti sanottuna ero keskittyy syy-yhteyden rooliin. Jos haluat ymmärtää jonkin dynamiikan maailmassa ja selittää, miksi jotain tapahtuu samalla tavalla, sinun on tunnistettava syy-suhteet asiaankuuluvien muuttujien välillä. Voit ennustaa jättämällä syy-yhteyden huomiotta. Voit esimerkiksi ennustaa vaikutuksen tietoon sen syystä; voit ennustaa syyn olemassaolon tiedosta, että vaikutus on tapahtunut; ja voit ennustaa yhden vaikutuksen likimääräisen tason tietämällä toisen vaikutuksen, joka johtuu samasta syystä. Miksi joku haluaa pystyä tekemään tämän? Lisätä tietämystään siitä, mitä voi tapahtua tulevaisuudessa, jotta he voivat suunnitella vastaavasti. Esimerkiksi ehdonalaistalautailulautakunta voi haluta pystyä ennustamaan todennäköisyyden, että vanki uusiutuu, jos hänet vapautetaan. Tämä ei kuitenkaan riitä selityksiin. Tietysti kahden muuttujan todellisen syy-yhteyden arvioiminen voi olla erittäin vaikeaa. Lisäksi mallit, jotka sieppaavat (mitä uskotaan olevan) todelliset syy-suhteet, ovat usein huonompia ennusteiden tekemisessä. Joten miksi se sitten tehdään? Ensinnäkin suurin osa tästä tapahtuu tieteessä, jossa ymmärrystä haetaan sen itsensä vuoksi. Toiseksi, jos voimme luotettavasti valita todelliset syyt ja kehittää kykyä vaikuttaa niihin, voimme vaikuttaa jonkin verran vaikutuksiin.

Tilastollisen mallinnuksen strategian suhteen ei ole suurta eroa. Ensisijainen ero on tutkimuksen suorittamisessa. Jos tavoitteena on pystyä ennustamaan, selvitä, mitä tietoja mallin käyttäjät voivat saada, kun heidän on tehtävä ennuste. Tiedot, joita heillä ei ole pääsyä, eivät ole arvokkaita. Jos he todennäköisesti haluavat pystyä ennustamaan ennusteiden tietyllä tasolla (tai kapealla alueella), yritä keskittää ennustajan otosalue tälle tasolle ja ylinäyttää siellä. Esimerkiksi, jos ehdonalaistalautakunta haluaa enimmäkseen tietää rikollisista, joilla on kaksi suurta vakaumusta, saatat kerätä tietoja rikollisista, joilla on 1, 2 ja 3 tuomio. Toisaalta muuttujan syy-tilan arvioiminen vaatii periaatteessa kokeen. Toisin sanoen kokeelliset yksiköt on osoitettava satunnaisesti selittävien muuttujien ennalta määritetyille tasoille. Jos on huolissaan siitä, onko syy-vaikutuksen luonne riippuvainen jostakin muusta muuttujasta, kyseinen muuttuja on sisällytettävä kokeeseen. Jos todellisen kokeen suorittaminen ei ole mahdollista, kohtaat paljon vaikeamman tilanteen, joka on liian monimutkainen mennä täällä.

Ihmettelen syy-yhteyden merkityksestä. Oletetaan esimerkiksi, että meillä on tietojoukko lohkoryhmän ulottuvuuksista ja tilavuuksista, $ (x, y, z, v) $, ja mallinnamme niiden assosiaatiota regressoimalla $ z $ arvoon $ (x, y, v ) $ (ja niiden vuorovaikutukset). Missä mielessä voidaan sanoa, että kaksi ulottuvuutta ja tilavuus "aiheuttavat" kolmannen ulottuvuuden? Siksi selityksen ja ennusteen välinen ero näyttää perustuvan johonkin pohjimmiltaan erilaiseen; nimittäin analyysin * tarkoitus *. Viimeisen kappaleen osalta tällä sivustolla on monia tilejä, jotka todistavat jyrkistä eroista strategiassa.
Olet oikeassa, tämä riippuu tutkimuksen tarkoituksesta. Oletan, että en tehnyt sitä selkeästi (puhuin vain siitä, mitä * haluat * saavuttaa). On myös totta, että selityksen ei tarvitse koskea syy-yhteyttä tarkalleen - sopii myös jotain syy-yhteydelle (esim. Mitat - volyymitapaus on looginen / matemaattinen implikaatio). Suurin osa selittävistä mallinnuksista keskittyy kuitenkin syy-yhteyteen; Luulin, että voisin ohittaa tällaisen asian yksinkertaisuuden vuoksi. Lopuksi, strategia eroaa tutkimuksen suunnittelussa ja tiedonkeruussa, mutta y: n regressio x: lle on melkein sama.
Kiitos vastauksestasi. Muilta tämän sivuston keskusteluilta olen oppinut ymmärtämään yleismaailmallisia lausuntoja, kuten "useimmat syy-yhteyttä selittävät mallinnuskeskukset" vastaamaan kirjailijan taustaa ja kokemusta sen sijaan, että ne olisivat kirjaimellisesti totta. Fyysisissä ja "kovissa" tieteissä tämä toteamus voi olla oikea, mutta yhteiskunta- ja "pehmeissä" tieteissä epäilen, että harjoittajat esittäisivät niin vahvan väitteen. Usein itse asiassa tutkittavilla suhteilla uskotaan olevan yhteisiä piilotettuja syitä, mutta ne eivät heijasta suoraa syy-yhteyttä regressorien ja regressandin välillä.
@whuber on varmasti totta, että taustani ja kokemukseni vaikuttavat ideoihini. Jos tämä vastaus ei ole hyödyllinen (huomaan, että se ei ole saanut yhtään ääntä), voin poistaa sen. Useat muut ovat antaneet vastauksia, jotka kattavat ideat, jotka halusin välittää.
@whuber - hyvä esimerkki pehmeästä syystä on "tupakointi aiheuttaa syöpää", vaikka olen varma, että löytäisit ketjutupakoitsijan, jolla ei ole syöpää. Syy-yhteyden käsite liittyy toisiinsa tapahtumien ajoitukseen. Syyn on tapahduttava ennen seurausta - mikä selittää, miksi kuutioesimerkillä ei ole mitään järkeä.
#11
+4
Brett
2011-11-30 00:22:57 UTC
view on stackexchange narkive permalink

Suurin osa vastauksista on auttanut selventämään mitä selityksen mallinnus ja ennustaminen on ja miksi ne eroavat toisistaan. Mikä ei ole toistaiseksi selvää, on miten ne eroavat toisistaan. Joten ajattelin tarjota esimerkin, josta voi olla hyötyä. Akateemisen valmistautumisen mittareina meillä on:

  1. kelpoisuustestien tulokset;
  2. HS GPA; ja
  3. hyväksyttyjen AP-testien lukumäärä.

Ennakointistrategia

Jos tavoitteena on ennakointi, saatan käyttää kaikkia näitä muuttujia samanaikaisesti lineaarisessa mallissa ja ensisijainen huolenaiheeni olisi ennakoiva tarkkuus. Kumpi muuttujista osoittautuu hyödyllisimmäksi yliopiston GPA: n ennustamiseksi, sisällytetään lopulliseen malliin.

Selitysstrategia

Jos tavoitteena on selitys, olen ehkä enemmän huolissani tietojen vähentämisestä ja mietin huolellisesti riippumattomien muuttujien välisiä korrelaatioita. Ensisijainen huolenaiheeni olisi kertoimien tulkinta.

Esimerkki

Tyypillisessä korrelaattoreiden ennustimien monimuuttujaongelmassa ei ole harvinaista havaita regressiokertoimia, jotka ovat "odottamattomia". Ottaen huomioon riippumattomien muuttujien keskinäiset suhteet, ei olisi yllättävää nähdä osittaiset kertoimet joillekin näistä muuttujista, jotka eivät ole samassa suunnassa kuin niiden nollajärjestyssuhteet ja jotka saattavat vaikuttaa intuitiivisilta ja vaikeasti selitettäviltä.

Oletetaan esimerkiksi, että malli viittaa siihen, että (kun otetaan huomioon kelpoisuustestitulokset ja onnistuneesti suoritettujen AP-testien lukumäärä) korkeampien lukion GPA: t liitetään alempiin korkeakoulujen GPA: hin. Tämä ei ole ongelma ennakoinnissa, mutta se aiheuttaa ongelmia selittävälle mallille, jossa tällaista suhdetta on vaikea tulkita . Tämä malli saattaa tarjota parhaan otosennusteen, mutta se ei auta meitä ymmärtämään akateemisen valmistelun ja kollegion GPA: n suhdetta.

Sen sijaan selittävässä strategiassa saatetaan etsiä jonkinlaista muuttuvaa vähennystä, kuten pääoma komponentit, tekijäanalyysi tai SEM, jotta:

  1. keskitytään muuttujaan, joka on "akateemisen suorituskyvyn" paras mittari, ja mallinnetaan College GPA kyseiselle muuttujalle; tai
  2. käytä tekijäpisteitä / piileviä muuttujia, jotka on johdettu akateemisen valmistelun kolmen mittarin yhdistelmästä, eikä teoreettisia muuttujia.

Tällaiset strategiat saattavat vähentää ennustekykyä mallia, mutta ne saattavat antaa paremman käsityksen siitä, miten akateeminen valmistelu liittyy College GPA: han.

Mitä tulee vasta-intuitiiviseen merkkiin, ihmettelen, johtuuko se siitä, että intuitiosi tulkitsee väärän kaksimuuttujan - kuten päävaikutuksen ikään kuin se olisi sisäkkäin tai vuorovaikutustehoste.
#12
+3
Lionel Henry
2012-10-16 14:05:15 UTC
view on stackexchange narkive permalink

Haluaisin tarjota mallikeskeisen näkemyksen asiasta.

Ennakoiva mallinnus tapahtuu useimmissa analyyseissä. Esimerkiksi tutkija asettaa regressiomallin, jossa on joukko ennustajia. Theregressiokertoimet edustavat sitten ennustavia vertailuja ryhmien välillä. Ennakoiva näkökohta tulee todennäköisyysmallista: johtopäätös tehdään superpopulaatiomallista, joka on saattanut tuottaa havaitun populaation tai näytteen. Tämän mallin tarkoituksena on ennustaa uusia tuloksia yksiköille, jotka syntyvät tästä superpopulaatiosta. Usein tämä on turha tavoite, koska asiat muuttuvat aina, etenkin sosiaalisessa maailmassa. Tai koska malli harvoista yksiköistä, kuten maista, etkä voi piirtää uutisnäytettä. Mallin hyödyllisyys tässä tapauksessa jätetään analyytikon arviointiin.

Kun yrität yleistää tuloksia muille ryhmille tai tuleville yksiköille, tämä on edelleen ennustetta, mutta erilaista. Voimme vaatia esimerkiksi ennustamista. Keskeistä on, että arvioitujen mallien ennakoiva voima on oletusarvoisesti kuvaava . Vertailet tulosta ryhmien välillä ja oletat todennäköisyysmallin tai vertailun, mutta et voi päätellä, että nämä vertailut muodostavat syy-vaikutuksia.

Syynä on, että nämä ryhmät saattavat kärsiä valintapoikkeamisesta . Toisin sanoen heillä voi luonnollisesti olla korkeampi pistemäärä mielenkiinnon kohteena olevasta tuloksesta riippumatta hoidosta (hypoteettinen syy-yhteys). Tai heille voidaan kohdella erilainen hoitovaikutus kuin muilla ryhmillä. Siksi erityisesti havainnointitietojen osalta arvioidut mallit koskevat yleensä ennustavia vertailuja eikä selityksiä. Selitys koskee syy-vaikutuksen tunnistamista ja arviointia ja vaatii hyvin suunniteltuja kokeita tai instrumentaalisten muuttujien harkittua käyttöä. Tällöin ennustavat vertailut on leikattu kaikista valintaperusteista ja ne edustavat syy-vaikutuksia. Mallia voidaan siten pitää selittävä.

Huomasin, että näillä termeillä ajattelu on usein selkeyttänyt, mitä tein todellakin, kun asetin mallia joillekin tiedoille.

+1, täällä on hyvää tietoa. Olisin kuitenkin varovainen lausunnossa "Ennakoiva mallinnus tapahtuu useimmissa analyyseissä". Se, onko ennakoiva mallintaminen yleisempää, vaihtelee tieteenaloittain jne. Oletan, että suurin osa mallinnuksista akateemisessa ympäristössä on selittävää, ja että paljon mallintamista / tiedonlouhintaa, jota tehdään yksityisellä sektorilla (esimerkiksi tunnistetaan mahdolliset toistuvat asiakkaat) on ennakoiva. Voisin helposti olla väärässä, mutta on vaikea sanoa a priori, mikä tapahtuu suurimman osan ajasta.
No, mielestäni suurin osa havainnointidatan mallintamisesta on ennakoivaa, vaikka tavoite olisi selittävä. Jos et satunnaista hoidon määritystä ja aiheuta muutosta kokeellisessa kokoonpanossa, regressiokertoimillasi on vain kuvaileva arvo, ts. Ne tarjoavat vain keinot ennakoiviin vertailuihin. Voit esimerkiksi ennustaa menestystä koulussa väestötietojen perusteella, mutta se ei tarkoita, että nämä väestötiedot ovat selittäviä syy-seurauksia. Syynä on se, että vertailevat ennusteet altistuvat valintahäiriöille.
#13
+1
Guest with A thought
2014-09-03 00:22:27 UTC
view on stackexchange narkive permalink

Voimme oppia paljon enemmän kuin luulemme Black boxin "ennakoivista" malleista. Tärkeintä on suorittaa erityyppisiä herkkyysanalyysejä ja simulaatioita, jotta voidaan todella ymmärtää, kuinka muutokset OUTPUT-malliin vaikuttavat INPUT-tilan muutoksiin. Tässä mielessä jopa puhtaasti ennustava malli voi antaa selittäviä oivalluksia. Tämä on kohta, jonka tutkimusyhteisö usein unohtaa tai ymmärtää väärin. Pelkästään siksi, että emme ymmärrä miksi algoritmi toimii, ei tarkoita, että algoritmilla ei ole selittävää voimaa ...

Kaiken kaikkiaan todennäköisyysdokumenttien ytimekäs vastaus on valtavirran näkökulmasta täysin oikea ...

On epäselvää, mitä "selittäviä oivalluksia" voidaan saada tällä tavalla, jos tällä lauseella tarkoitat syy-yhteyttä.
#14
+1
Aksakal
2017-09-01 17:22:45 UTC
view on stackexchange narkive permalink

Tilastoissa on ero sen välillä, mitä hän kutsuu selittäviksi ja ennakoiviksi . Hänen mukaansa meidän pitäisi tietää joka kerta, kun käytämme yhtä tai toista, mitä tarkalleen käytetään. Hän sanoo, että me sekoitamme ne usein, joten sekaantuminen .

Olen samaa mieltä siitä, että social science -sovelluksissa ero on järkevä, mutta luonnontieteissä ne ovat ja niiden pitäisi olla samat. Kutsun heitä myös päätelmiksi vs. ennustaminen ja olen samaa mieltä siitä, että social sciences: ssä ei pitäisi sekoittaa niitä.

Aloitan luonnontieteistä. Fysiikassa keskitymme selittämiseen, yritämme ymmärtää miten maailma toimii, mikä aiheuttaa mitä jne. Joten keskitytään syy-yhteyteen, päätelmiin ja vastaaviin. Toisaalta ennustava näkökohta on myös osa tieteellistä prosessia. Itse asiassa tapa, jolla todistat teorian, joka jo selitti havainnot hyvin (ajattele otosta), on ennustaa uudet havainnot ja tarkistaa sitten ennusteen toiminta. Kaikilla teorioilla, joilla ei ole ennustavia kykyjä, on suuria vaikeuksia saada hyväksyntä fysiikassa. Siksi kokeilut, kuten Michelson-Morley, ovat niin tärkeitä.

Yhteiskuntatieteissä valitettavasti taustalla olevat ilmiöt ovat epävakaita, toistamattomia, toistamattomia.Jos katsot, että ytimet hajoavat, saat samat tulokset aina, kun tarkkailet niitä, ja samat tulokset kuin minä tai kaveri sata vuotta sitten.Ei taloudessa tai rahoituksessa.Lisäksi kyky suorittaa kokeita on hyvin rajallinen, melkein olematon kaikissa käytännön tarkoituksissa, me vain tarkkailemme ja suoritamme satunnaisia näytteitä havainnoista.Voin jatkaa, mutta ajatus on, että käsittelemämme ilmiöt ovat erittäin epävakaita, joten teoriamme eivät ole yhtä laadukkaita kuin fysiikassa.Siksi yksi tapa, jolla käsittelemme tilannetta, on keskittyä joko päätelmiin (kun yrität ymmärtää, mikä aiheuttaa tai mikä vaikuttaa mihin) tai ennustamiseen (sano vain, mitä luulet tapahtuvan tälle tai tälle sivuuttamatta rakennetta)./ p>

#15
  0
Brijesh
2017-09-01 17:00:10 UTC
view on stackexchange narkive permalink

Rakennemalli antaisi selityksen ja ennakoiva malli ennusteen.Rakennemallissa olisi piileviä muuttujia.Rakennemalli on regressio- ja tekijäanalyysin samanaikainen huipentuma

Latentit muuttujat ilmenevät multi kollineaarisuuden muodossa ennustavissa malleissa (regressio).

#16
-1
Poidah
2020-01-10 09:10:33 UTC
view on stackexchange narkive permalink

Selittävää mallia on käytetty myös lääketieteessä ja terveysalalla, jolla on hyvin erilainen merkitys.Pohjimmiltaan se, mitä ihmisillä on sisäisinä vakaumuksina tai merkityksinä, voi olla melko erilainen kuin hyväksytyt selitykset.Esimerkiksi uskonnollisella henkilöllä voi olla selittävä malli, jonka mukaan sairaus johtui rangaistuksesta tai karmasta menneisyydestä samoin kuin biologisten syiden hyväksyminen.

https://thehealthcareblog.com/blog/2013/06/11/the-patient-explanatory-model/

https://pdfs.semanticscholar.org/0b69/ffd5cc4c7bb2f401be6819c946a955344880.pdf

Voisitteko antaa ainakin yhteenvedon näistä linkeistä?- muuten tämä on enemmän kommentti kuin vastaus.
En uskonut ihmisten olevan kiinnostuneita siitä.Koska tämä on melko matemaattinen ryhmä.Joten pidin vastaukseni rajoitettuna.


Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 2.0-lisenssistä, jolla sitä jaetaan.
Loading...