Kuinka standardivirheet lasketaan sovitetuille arvoille logistisesta regressiosta?

Kysymys:

user2457873

2013-08-09 19:41:21 UTC

view on stackexchange narkive permalink

Kun ennustat sopivan arvon logistisesta regressiomallista, miten vakiovirheet lasketaan? Tarkoitan sovitetut arvot , ei kertoimet (joihin liittyy Fishersin informaatiomatriisi).

Sain selville, kuinka saada numerot R (esim. täällä r-ohjeessa tai täällä pinon ylivuotossa), mutta en löydä kaavaa.

  pred < - ennustaa (y.glm, newdata = jotain, se.fit = TOSI)

Jos voisit tarjota online-lähteen (mieluiten yliopiston verkkosivustolla), se olisi fantastista.

üks vastaus:

Dason

2013-08-09 19:58:18 UTC

view on stackexchange narkive permalink

Ennuste on vain lineaarinen yhdistelmä arvioiduista kertoimista. Kertoimet ovat asymptoottisesti normaaleja, joten myös näiden kertoimien lineaarinen yhdistelmä on asymptoottisesti normaali. Joten jos voimme saada kovarianssimatriisin parametriestimaateille, voimme saada standardivirheen näiden arvioiden lineaariselle yhdistelmälle helposti. Jos merkitsen kovarianssimatriisia nimellä $ \ Sigma $ ja kirjoitan lineaarisen yhdistelmän kertoimet vektoriin muodossa $ C $, vakiovirhe on vain $ \ sqrt {C '\ Sigma C} $

  # Väärennettyjen tietojen tekeminen ja mallin sovittaminen sekä ennustekokonaisuuden.seed (500) dat saaminen <- data.frame (x = runif (20), y = rbinom (20, 1, .5)) o <- glm (y ~ x, data = dat) pred <- ennustaa (o, newdata = data.frame (x = 1,5), se.fit = TOSI) # Saadaksesi ennusteen x = 1,5: lle, todella kysyn # yhat = b0 + 1,5 * b1, joten glm-objektiin sovellettava # C = c (1, 1,5) # ja vcov antaa minulle # kovarianssimatriisin estimaateille C <- c (1, 1,5) vakio er <- sqrt ( t (C)% *% vcov (o)% *% C) > pred $ se.fit [1] 0.4246289> std.er [, 1] [1,] 0.4246289

Näemme, että esittelemäni "käsin" -menetelmä antaa saman vakiovirheen kuin raportoitu predict

-sivulla

Minulla on yksi asiaan liittyvä kysymys. Kun ennustamme arvon ja luottamusvälin lineaarisella regressiolla (ei logistisella), sisällytämme virheiden varianssin / standardivirheen. Mutta logistinen regressio ei. Johtuuko tämä ero siitä, että logistisen regression havaitut arvot ovat joko 0 tai 1 ja että virheiden varianssia ei ole syytä arvioida? Minusta tuntuu, että meidän pitäisi ainakin tehdä jotain, mutta minusta saattaa puuttua jotain.

Vanha kysymys, mutta tämä säie auttoi minua juuri nyt, joten tässä menee: Logit havaitsee 0 tai 1, mutta se ennustaa todennäköisyyden. Kun saat sovitetun arvon standardivirheen, se on lineaarisen ennustajan asteikolla. Saat luottamusvälin todennäköisyydelle puhumalla logit (fit +/- 1.96 * se.fit)

Huomaa vain, että tämä käyttää asymptoottista normaaliarvoa, mikä voi olla melko huono logistiselle mallille (etsi tältä sivustolta Hauss-Donner -ilmiötä).Kertoimet, jotka voidaan korjata esimerkiksi todennäköisyyden profiloinnilla (käytetään confint-funktiolla MASS: ssa).Se ei ole mahdollista lineaarisille ennustajille ...

Tämä on väärin, mitä toimenpideohjelma pyysi.sovittamasi GLM käyttää identiteettilinkkitoimintoa, ei logit-linkkitoimintoa.Sinun pitäisi sen sijaan olla sopiva `o <- glm (y ~ x, data = dat, perhe = binomi)`.Voisitteko tarkistaa?Selityksesi toimii arvioitaessa log-kertoimia SE (käyttämällä vaihtoehtoa "type =" link ""), mutta ei SE: tä, kun "ennustaa" käyttää vaihtoehtoa "type =" vastaus ".

ⓘ

Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 3.0-lisenssistä, jolla sitä jaetaan.

about - legalese