Kysymys:
Miksi mediaani-ikä on parempi tilasto kuin keski-ikä?
Lazer
2010-09-11 01:26:57 UTC
view on stackexchange narkive permalink

alt text

alt text

Selvästikin mediaani näyttää olevan valitsemasi tilastotiedot iän suhteen.

En voi selittää itselleni, miksi aritmeettinen keskiarvo olisi huonompi tilasto. Miksi se on niin?

Lähetettiin alun perin tänne, koska en tiennyt tämän sivuston olemassaoloa.

Näyttää siltä, ​​että sinulla oli jo kohtuullinen vastaus toisella sivustolla?
@Shane: Mutta kenties eri sivustoilla on mahdollisuus kerätä erilaisia ​​vastauksia eri näkökulmista?
Neljätoista vastused:
#1
+47
whuber
2010-09-11 03:17:24 UTC
view on stackexchange narkive permalink

Tilastot eivät mielestäni anna hyvää vastausta tähän kysymykseen. Keskiarvo voi olla merkityksellinen esimerkiksi kuolleisuustutkimuksissa, mutta ikää ei ole niin helppo mitata kuin luulisi. Vanhemmat ihmiset, lukutaidottomia ihmisiä ja joissakin kolmannen maailman maissa yleensä pyöristävät ikänsä esimerkiksi kerrottavaksi 5 tai 10.

Mediaani on vastustuskykyisempi tällaisille virheille kuin keskiarvo. Lisäksi mediaani-ikä on tyypillisesti 20-40, mutta ihmiset voivat elää 100 ja enemmänkin (yhä suurempi ja huomattava osa nykymaiden väestöstä elää yli 100). Tällaisen iän omaavilla ihmisillä on 1,5–4-kertainen vaikutus keskiarvoon kuin mediaaniin verrattuna hyvin nuoriin ihmisiin. Mediaani on siis hiukan ajantasaisempi tilasto maan ikäjakaumasta ja on keskiarvoa hieman riippumattomampi kuolleisuudesta ja elinajanodotteesta.

Lopuksi mediaani antaa meille hieman parempi kuva siitä, miltä ikäjakauma itse näyttää: kun näet esimerkiksi mediaanin 35, tiedät, että puolet väestöstä on yli 35-vuotiaita, ja voit päätellä joitain asioita syntyvyydestä, vanhempien iästä ja niin edelleen ; mutta jos keskiarvo on 35, et voi sanoa niin paljon, koska siihen voi vaikuttaa esimerkiksi suuri väestön kohouma 70-vuotiaana tai ehkä väestöero jossakin ikäryhmässä vanhaan sodaan tai epidemiaan.

Siten mediaani näyttää demografisista, eikä tilastollisista syistä kelvollisemmaksi omnibus-arvon roolille suhteellisen suurten väestöryhmien ikien yhteenvetoon.

Luulen, että tarkoitit "Mediaani on vastustuskykyisempi sellaisille virheille kuin keskiarvo". Olen kuitenkin samaa mieltä kommenteistasi, ja uskon, että Yhdysvaltojen väestönlaskenta ilmoittaa useissa kategorioissa mediaaniarvot virallisissa raporteissa (ei pelkästään iässä) periaatteessa kaikista samoista syistä. Tulot ovat ehkä jopa parempi esimerkki kuin ikä tällaisten seikkojen kuvaamiseksi.
Olet korvannut tosiasian - keskiarvo on herkkä poikkeamille / vääristyneille jakaumille - arvolauselmalle, joka koskee mediaanin etusijaa keskiarvoon nähden. Itse asiassa olet väittänyt, että keskiarvoa ei pidä suositella, koska se ei ole mediaani (aivan kuten ne, jotka sanovat, että keskiarvoa tulisi käyttää vain symmetrisissä jakaumissa, ts. Kun keskiarvo ja mediaani ovat samat).
@Alexis En seuraa kritiikkiäsi. Voisitko tarkentaa? Loppujen lopuksi tämä vastaus tarjoaa paljon enemmän kuin "tosiasia": se sisältää melko vähän niistä yhdessä analyysin niiden vaikutuksista. Ja erityisesti mihin "arvolausekkeeseen" viittaat?
Huolestun siitä, että keskiarvon ja mediaanin tosiasialliset ominaisuudet (esim. Edellinen on herkkä poikkeaville, eli "Tällaisen iän ihmisillä on 1,5 - 4-kertainen vaikutus keskiarvoon kuin mediaaniin verrattuna hyvin nuoriin ihmisiin.") tullut * arvoksi * arvostaan, nimittäin "mediaani antaa meille hieman paremman kuvan siitä, miltä ikäjakauma itse näyttää". Ensimmäinen on tosiasia, sitä myöhemmin sen arviointi. Huoleni on vaihdosta näiden kahden välillä. Lisätietoja: http://stats.stackexchange.com/questions/96371/should-the-mean-be-used-when-data-are-skewed
@Alexis Kiitos. Olen edelleen kamppaileva ymmärtääksesi, mitä tarkoitat "arvoilla". Tein lausunnon siitä, kuinka uskollisesti tilastot antavat meille tietoa jakautumisista, ei siitä, kuinka paljon ihmiset välittävät eri ikäisistä (mitä "arvon" tavallisesti katsotaan tarkoittavan tällaisessa tilanteessa). Kannatan tätä lausumaa tavanomaisella herkkyysmitalla (vaikutus). Jos voisit auttaa minua ymmärtämään huolesi paremmin, selventäisin mielelläni viestiä tältä osin. (Joillakin linkitetyn kysymyksen vastaajilla on samanlaisia ​​vaikeuksia ymmärtää huolesi.)
@whuber (kiitos kärsivällisyydestäsi), se on sanojen kuten "parempi" käyttö edellisen kommenttini lainauksessa, joka mielestäni merkitsee "kuinka paljon ihmiset välittävät" -merkitystä tässä. Luulen, että yritän työntää kysymyksen "Eikö tarkoitamme erilaisia, emmekä parempia?"
@Alexis Muista, että tämä kysymys ei koske keskiarvon tai mediaanin käyttöä yleensä, vaan niiden apuohjelmissa * ikäjakaumien arvioinnissa. * Huomaa, että vastauksessani alusta alkaen myönnetään, ettei ihmeläästä ole: keskiarvo on hyödyllinen ja merkityksellinen * tiettyihin tarkoituksiin. * En usko, että olen tehnyt syntiä, josta syytät minua, mikä on epämääräinen "paremman" soveltaminen: Olen tarkoin määrittänyt * kuinka * mediaani ja keskiarvo eroavat tässä yhteydessä *. Minusta kuulostaa siltä, ​​että sinulla on ongelma lyödä keskiarvoista * vs. * mediaaneista, mutta tämä ei ole oikea paikka tehdä se.
#2
+17
Dirk Eddelbuettel
2010-09-11 01:48:50 UTC
view on stackexchange narkive permalink

John antoi sinulle hyvän vastauksen sisarsivustolla.

Yksi näkökohta, jota hän ei nimenomaisesti maininnut, on kestävyys: mediaani keskeisen sijainnin mittana toimii paremmin kuin keskiarvo, koska sen hajoamispiste on korkeampi (50%), kun taas keskiarvo on hyvin pieni 0: sta (katso lisätietoja wikipediasta).

Intuitiivisesti se tarkoittaa, että yksittäiset huonot havainnot eivät vääristä mediaania, kun taas keskiarvoon.

Jaottelu ei ole ongelma koko väestön kuvailevassa tilastossa.
#3
+12
John D. Cook
2010-09-11 19:20:44 UTC
view on stackexchange narkive permalink

Tässä on ensimmäinen vastaukseni, joka lähetettiin sivustolle math.stackexchange:

Mediaani on se, mitä monet ihmiset todella pitävät mielessä sanoessaan "tarkoita". Mediaania on helpompi tulkita: puolet väestöstä on yli tämän ikäisen ja puolet alle. Keskiarvo on hieman hienovaraisempi.

Ihmiset etsivät symmetriaa ja joskus asettavat symmetriaa, kun sitä ei ole. Ikäjakauma populaatiossa ei ole läheskään symmetrinen, joten keskiarvo voi olla harhaanjohtava. Ikäjakaumat ovat jotain pyramidia. Paljon lapsia, ei paljon vanhuksia. (Tai ainakaan näin on jonkinlaisessa vakaassa tilassa. Yhdysvalloissa toisen maailmansodan jälkeinen vauvan puomin sukupolvi on vääristänyt tätä jakaumaa ikääntyessään. Jotkut ihmiset ovat kutsuneet tätä "pyramidin neliöittämiseksi", koska boomit ovat tehneet pyramidin yläosa on laajempi kuin aikaisemmin.)

Epäsymmetrisen jakauman ollessa kyseessä mediaanin ilmoittaminen saattaa olla parempi, koska se on symmetrinen tilasto. Mediaani on symmetrinen, vaikka näytteenottojakauma ei ole.

Missä mielessä mediaani on "symmetrinen" tilasto? Ei todellakaan ole, että jakaumat ovat yleensä jakautuneet symmetrisesti mediaaniensa (eikä niiden keskiarvojen) suhteen. Jos tarkoitat vain sitä, mitä kirjoitit toisessa kommentissa, jonka mukaan "mediaani jakaa väestön kahtia" (mikä * määrittää * mediaanin), argumenttisi kuulostaa pyöreältä: mediaani on hyvä, koska mediaani on mediaani!
#4
+7
John
2010-09-11 05:30:30 UTC
view on stackexchange narkive permalink

Miksi kirves on parempi kuin kirves?

Se on samanlainen kuin kysymyksesi. He vain tarkoittavat ja tekevät erilaisia ​​asioita. Jos puhutaan mediaaneista, tarina, jonka he yrittävät välittää, malli, jota he yrittävät soveltaa dataan, on erilainen kuin keinoin.

#5
+4
ars
2010-09-12 10:01:58 UTC
view on stackexchange narkive permalink

Tarkastellaan esimerkiksi Kongon (Kongon demokraattisen tasavallan) ja Japanin keski-ikäjä. Toista tuhoaa sisällissota, toinen on hyvin kehittynyt väestön ikääntyessä. Keskiarvo ei ole kovin mielenkiintoinen omenoiden ja omenoiden vertailussa. Toisaalta mediaani voi olla informatiivinen keskitaipumuksen mittana, koska määritelmän mukaan meillä on puolet yläpuolella, puolet alapuolella. Population Pyramid -artikkeli saattaa olla valaiseva (katso osiot nuorten pullistumisesta, väestön ikääntymisestä).

#6
+3
Henry
2011-03-27 10:39:31 UTC
view on stackexchange narkive permalink

Mielestäni ei ole hyvää kuvaavaa syytä valita mediaani yli keskiarvon ikäjakaumille. Raportoitujen tietojen vertailussa on yksi käytännöllisyys.

Monet maat ilmoittavat väestönsä viiden vuoden ikäisinä ylimmän kaistan ollessa avoin. Tämä aiheuttaa joitain vaikeuksia laskea keskiarvoja intervallien perusteella, erityisesti nuorimmalle intervallille (vaikuttaa lapsikuolleisuuteen), ylimpään "intervalliin" (mikä on keskiarvo 80+ "intervalliin"?) Ja lähimpiin huippuväliin ( kunkin välin keskiarvo on yleensä pienempi kuin keskiarvo).

Mediaania on paljon helpompi arvioida interpoloimalla mediaanivälin sisällä, usein lähentämällä olettamalla tasainen tai trapezium-ikäjakauma kyseisellä aikavälillä (kuolemantapaukset ovat monissa maissa suhteellisen alhaiset mediaani-iän ympärillä, mikä tämä on kohtuullisempi arvio kuin nuorille tai vanhoille).

#7
+3
Richard E. Gilder
2012-01-02 21:18:02 UTC
view on stackexchange narkive permalink

Yhdysvaltojen kansanterveystietovarastot ovat siirtymässä kohti ikää viiden vuoden välein HIPAA-määräysten vaikutuksesta, joka koskee tietojen tahallista sokeuttamista ja peittämistä yksityisyyden suojasta.

Ottaen huomioon tämän haasteen menneisyydessä (ennen HIPAA: ta) olleen melko mittakaavan mittaustietojen taso syntymäajan ja kuoleman päivämäärän eron perusteella, meidän on ehkä harkittava AGE: tä mittakaavan muuttujana, joka voi on kuvattava parametrisesti lainkaan kansanterveystietoaineistoissa sellaisten mallien hyväksi, jotka kuvaavat AGE: tä ei-parametrisilla tavoilla mittatasona. Tiedän, että tämä saattaa tuntua "ylhäältäpäin" monille biolääketieteen informatiikkayhteisön ryhmille, mutta tällä ajatuksella voi olla jonkin verran hyötyä "tulkinnassa", kuten yllä olevissa kommenteissa kuvataan.

Entä kaikki muut kuin parametriset lähestymistavat käytettävissä oleva analyyttinen voima? Kyllä, on totta, että jokainen meistä melkein yleisesti yrittää soveltaa GLM (yleinen lineaarinen malli) -tekniikoita muuttujaan, joka esittelee itsemme jakeluissa, jotka käyttäytyvät samalla tavalla kuin AGE.

Samalla on otettava huomioon kyseisen jakauman muoto ja se, kuinka muoto määritetään monien ulottuvuusvaikutusten vaikutuksella jakautumassa oleviin moniulotteisiin keskustoihin ja alaryhmien keskiöihin. Mitä tehdä näille erittäin monimutkaisille tietojoukoille?

Kun tietoelementti ei täytä "mallin oletuksia", skannaamme asteittain (sanoin poikki, ei alas; meidän pitäisi olla menetelmän yhtäläisten mahdollisuuksien työnantajat, kukin työkalu tulee tehtaalta lomake seuraa toimintosääntöjä) luettelo muista mahdollisista malleista löytääksesi mallit, jotka "eivät petä" oletustestejä.

Nykyisessä kansanterveystietosarjojen muodossa meidän on todella (tietojen visualisointiyhteisönä) keksittävä vakiomalli ikäihmisten käsittelemiseksi viiden vuoden välein (5YI). Äänestän AGE: n tietojen visualisoinnista (kun otetaan huomioon uusi 5YI-muoto), että käytän histogrammeja sekä laatikko- ja viiksikuvioita. Kyllä, tämä tarkoittaa mediaania. (Ei sanaa!)

Joskus kuva todella on tuhannen sanan arvoinen, ja abstrakti on yhteenveto tuhannesta sanasta. Laatikko- ja viiksikuvaaja näyttää jakauman "muodon" merkityksellisenä symbolisena esityksenä histogrammista lähes ikonisella tarkkuustasolla. Viiden vuoden ikäjakaumien vertaaminen osoittamalla "vierekkäin" laatikko- ja viiksikuviot, joissa voidaan hetkessä visuaalisesti verrata 75: n ja 50: n (mediaanin) malleja alempaan 25: een ntiliiniin, tekisi tyylikkään "universaalin standardin" iän vertailemiseksi maailma. Niille meistä, jotka jatkossakin nauttivat datan esityksen jännityksestä taulukkonäytön tekstimekaniikan avulla, "varsi ja lehti" -kaavio voi myös olla hyödyllinen, kun sitä käytetään animoituna visuaalisena grafiikkaelementtinä "kipinän" lähestymistavassa, joka kuvaa vaihtelua jakaumien muodoista ajan myötä.

Ikä on täysi-ikäinen. Sitä on tutkittava edelleen tehokkaammilla laskennallisilla algoritmeilla, jotka ovat nyt käytettävissä.

Tämä on hyvin kirjoitettu viesti, mutta sillä ei näytä olevan yhteyttä alkuperäiseen kysymykseen.
Mielestäni se vastaa epäsuorasti, mutta asianmukaisesti kysymyksen, @Andy, näennäiseen tarkoitukseen. Mahdollinen vika on itse kysymyksessä, joka on epäselvä, koska siinä ei määritetä merkitystä, jossa keskiarvo voisi olla "huonompi" kuin mediaani. Hyvässä vastauksessa on siis tutkittava tätä ja harkittava ikäjakauman yhteenvedon tarkoitusta yhdellä tilastolla. Tässä tämä johtaa luonnollisesti keskusteluun siitä, mitä "ikä" voi tarkoittaa ja kuinka sopivasti vertailla ikäjakaumia.
#8
+3
Emil Friedman
2012-05-23 20:34:40 UTC
view on stackexchange narkive permalink

Jotta voimme antaa hyödyllisen vastauksen alkuperäiseen kysymykseen, meidän on tiedettävä kysymys sen takana. Toisin sanoen "Miksi haluat jonkinlaisen yhteenvetotilaston, jossa verrataan eri maiden ikäjakaumaa?" Mediaani voi olla hyödyllisin joissakin kysymyksissä. Keskiarvo voi olla hyödyllisin muille. Ja on luultavasti kysymyksiä, joissa "tietyn ikän ylä- tai alapuolella olevat prosentit" olisi hyödyllisin tilasto.

#9
+2
Mike Dunlavey
2010-09-14 05:23:26 UTC
view on stackexchange narkive permalink

Saat hyviä vastauksia täällä, mutta anna minun lisätä vain 2 senttini. Työskentelen farmakometriassa, joka käsittelee esimerkiksi veren määrää, eliminaatiota, lääkkeen vaikutuksen perustasoa, lääkkeen suurinta vaikutusta ja vastaavia parametreja.

Teemme eron muuttujien välillä, jotka voivat saada minkä tahansa arvon plus tai miinus verrattuna arvoihin, jotka voivat olla vain positiivisia. Esimerkki muuttujasta, joka voi saada minkä tahansa arvon, plus tai miinus, olisi lääkkeen vaikutus, joka voi olla positiivinen, nolla tai negatiivinen. Esimerkki muuttujasta, joka voi olla vain realistisesti positiivinen, on veren määrä tai lääkeaineen poistumisnopeus.

Mallinnamme nämä asiat jakaumilla, jotka ovat tyypillisesti joko normaalia tai lognormaalia, normaalia kaikille arvostetuille ja lognormaalia vain positiivisille. Lognormaali luku on luku E, joka otetaan normaalisti jakautuneen luvun tehoon, ja siksi se voi olla vain positiivinen.

Normaalisti jakautuneen muuttujan mediaani, keskiarvo ja tila ovat samat. numero, joten ei ole väliä mitä käytät. Lognormaalisesti jakautuneen muuttujan keskiarvo on kuitenkin suurempi kuin mediaani ja tila, joten se ei ole kovin hyödyllinen. Itse asiassa mediaanilla on taustalla olevan normaalin keskiarvo, joten se on paljon houkuttelevampi mittari.

Koska ikä (oletettavasti) ei voi koskaan olla negatiivinen, lognormaali jakauma on todennäköisesti parempi kuvaus siitä kuin normaalisti, joten mediaani (E normaalin keskiarvon keskiarvoon) on hyödyllisempi.

Iän jakautuminen ei todellakaan ole log-normaalia.
En usko, että voit päätellä, että ikä jakautuu normaalisti lokiin vain siitä tosiasiasta, että se on aina positiivinen. Gamma- ja Weibull-jakaumat ovat myös aina positiivisia, joten miksi et valitsisi niitä?
@Rob: @nico: Olen varma, että olet oikeassa. Se oli huono esimerkkivalinta. Tyypillisesti mallinnetaan farmakometriset parametrit, kuten tilavuus ja puhdistuma.
#10
+2
Susanne
2015-02-12 22:34:32 UTC
view on stackexchange narkive permalink

Minulle on opetettu, että mediaania tulisi käyttää vaihteluvälin ja keskiarvon kanssa keskihajonnalla. Kun puhumme iästä, mielestäni alue on merkityksellisempi tapa ilmaista leviäminen ja helpompi ymmärtää useimmille. Esimerkiksi tutkimuspopulaatiossa keski-ikä oli 53 (SD 5,4) tai mediaani-ikä 48 (vaihteluväli 23-77). Tästä syystä haluaisin mieluummin käyttää mediaania kuin keskiarvoa. Mutta olisin kiinnostunut täältä, mitä tilastotieteilijä tai tilastotietojen ammattilainen sanoisi keskiarvon käyttämisestä kantaman kanssa? Näen tämän melko vähän tieteellisissä julkaisuissa.

Tervetuloa CV: hen, Susanne.Jos olet lähettänyt tämän yrittäessäsi saada vastauksia, poista se ja lähetä se uudeksi kysymykseksi.Tämän sivuston käyttöä koskevia ohjeita on [ohjeessa].
#11
+1
user28
2010-09-11 02:33:58 UTC
view on stackexchange narkive permalink

Johanneksen vastaus math.stackexchange-palveluun voidaan katsoa seuraavasti:

Kun sinulla on väärä jakauma, mediaani voi olla parempi yhteenvetotilasto kuin keskiarvo.

Huomaa, että kun hän sanoo, että lapsia on enemmän kuin aikuisia, hän ehdottaa, että ikäjakauma on vinossa.

Oikeastaan ​​luulen, että nykyään vinous monissa maissa kohdistuu enemmän eläkeläisiin, ei tottumuksiin.
Ehkä se on vinossa toisella tavalla, mutta yleinen asia on voimassa. Vinoilla jakaumilla mediaani voi olla järkevämpi kuin keskiarvo.
Päivitin vastauksen matematiikassa.stackexchange vastauksen korostamiseksi juuri siinä. Ihmiset etsivät symmetriaa ja voivat asettaa väärin symmetrian, kun sitä ei ole. Kun ilmoitat mediaanista, annat vastauksen, joka on symmetrinen - mediaani jakaa väestön kahtia - vaikka jakauma ei ole symmetrinen.
Tämä vastaus näyttää minusta aina jonkin verran turhalta: kun jakaumat eivät ole vinoja (ts. Ne ovat symmetrisiä), keskiarvo * on yhtä suuri kuin mediaani, joten sanominen, että mediaani on "parempi", kun jakauma on vinossa, on takaoven tapa sanoa " käytä vain mediaania. "
#12
+1
Eustache
2012-03-10 16:27:28 UTC
view on stackexchange narkive permalink

Toivon, että aineistosi poikkeamat vaikuttavat keski-ikään, vaikka näin ei ole mediaani-iässä. Otetaan esimerkki rokotetuista potilastiedoista: 1,2,3,4,4,5,6,6,6,78 vuoden keskiarvo olisi: 11,5 ja näiden potilaiden mediaani-ikä on 4,5. tähän keskimääräiseen ikään on vaikuttanut poikkeama 78. mediaani on paras, kun käsitellään vinon jakauman tietojoukkoja.

Katso vastaukseni käyttäjälle28.
#13
  0
Matt L.
2014-05-28 21:18:26 UTC
view on stackexchange narkive permalink

Luultavasti väestöanalyysin tapauksessa luulisin, että sekä keskiarvo että mediaani ovat arvokkaita, etenkin yhdessä toistensa kanssa, jos etsit kasvupoikkeamia tai kasvualueita, jotka pelkästään mediaani voivat merkitä väärin. Yhteisöissä, joissa on suuri eläkeyhteisö tai alueilla, joilla syntyvyys on räjähtänyt, mediaani ei yksinään voi antaa sinulle kokonaiskuvaa, ja tässä keskiarvo voi olla hyödyllinen verrattuna siihen.

#14
  0
brethvoice
2020-03-31 19:21:02 UTC
view on stackexchange narkive permalink

LYHYT VASTAUS: Mediaani-ikä ei ole yksinkertaisesti parempi kuin keski-ikä; olet ehkä huomannut, että useammat ihmiset käyttävät sitä. Joten parempi kysymys voisi olla: "Miksi useampi väestötiede käyttää mediaaniaikaa kuin keski-ikää?"

Tilasto, sanavarastona, on peräisin valtiosta (nimellisesti oikeushenkilöstä), joka yrittää ymmärtää ihmisväestöään. Ajattele siis näiden hallitusten ihmisiä ja kuinka paljon tietoa he haluavat tai tarvitsevat sekä kuinka paljon aikaa heillä on käytettävä tieteellisten sanojen tarkan matemaattisen merkityksen ymmärtämiseen.

Helpoin tapa kerätä paljon tietoa ilman kuvaa on raportoida yksi numero; tätä kutsutaan kyseisen parametrin estimaattoriksi (tässä häkissä aika kului ihmisen syntymästä, tarkalleen vuosien tasolle). Setti. Jaynes osoitti kirjassa Probability Theory: The Logic of Science, voisi päättää rakentaa estimaattorin, joka perustuisi utilitaristiseen tappiotoimintoon, joka tiivistää virheen tekemisen seuraukset käyttämällä yhtä numeroa kokonaisen sijasta. tietojoukko, kun tehdään päätöksiä näiden tietojen perusteella.

Jaynesin kirjassa hän osoittaa matemaattisten todisteiden avulla, että moodi tai suurin todennäköisyyden estimaattori on estimaattori, joka minimoi tappion, joka on muotoiltu Dirac-delta-funktiona. Keskiarvo minimoi toisen asteen häviöfunktiot siten, että mitä enemmän saadaan estimaatista, häviön määrä (ei-toivotut seuraukset) nousee hyvin nopeasti, kun ohitat yksikköasteikon.

Mediaani puolestaan ​​minimoi käänteisen kolmion muotoisen häviöfunktion siten, että on vain viisi kertaa vähemmän toivottavaa olla pois päältä yhdellä tarkkuusyksiköllä kuin 25 kertaa (kuten käytettäessä ilkeät). Itse asiassa tarkkuusyksiköllä ei ole mitään eroa, koska tällaisessa kolmionmuotoisessa pistehäviöfunktiossa ei ole kaarevuutta.

Tämän teoreettisen perustan avulla voisi kirjaimellisesti piirtää häviöfunktioita, jotka eivät ole lainkaan symmetrisiä, ja muodostaa loputtoman määrän uusia arvioita, jotka räätälöidään asiakkaiden / käyttäjien tarpeisiin. Toinen vaihtoehto yhden numeron kulttuuriodotusten käsittelemiselle on kouluttaa samoja tietojen käyttäjiä / kuluttajia siitä, että keskitetyn taipumuksen mittari voi antaa enemmän tietoa yhdistettynä muihin jakauman parametreihin, kuten varianssiin, vinoon ja kurtoosiin ( saatat haluta aloittaa pelkällä varianssilla ja vinolla helpottaaksesi heitä siihen.

Varianssi on vain yksi esimerkki dispersiomittauksesta; toinen Jaynes ehdottaa (muissa kirjoituksissa), että muodostetaan Bayesin posteriorijakauma ja lasketaan lyhimmän uskottavan aikavälin leveys arvolla 0,5 (tai luottamusväli / keskihajonta jne., jos et osta Bayesin teoriaan - älä, älä saada sivuraiteelle). Intuitiivisempi menetelmä, jonka useammille ihmisille on mahdollisesti helpompi ymmärtää, olisi kvartiilien välinen alue, varsinkin kun ilmoitetaan mediaanina vastaavana keskitaipumuksen mittarina.

En ole varma, onko vinossa vai kurtosissa ei-parametrista muotoa, mutta jos sellaisia ​​on, ne on melkein varmasti helpompi ymmärtää kuin nämä parametriset analogit. Minulla on aavistustakaan siitä, että merkittävä, ellei hallitseva, osa mediaani-iän kasvusta keskimääräistä ikää useammin johtuu siitä, että se yksinkertaisesti vetoaa enemmän ihmisiin, joilla on vähemmän aikaa tai halua mennä teoreettisiin yksityiskohtiin esimerkiksi sigma-algebroista, Lebesgue-mittausteoria jne., Jotka kaikki ovat teknisesti välttämättömiä todennäköisyysperusteen yleisempien perusteiden ymmärtämiseksi.

Vaikka täällä on paljon hyviä ajatuksia arvioista jne., Mielestäni ne näyttävät väärässä paikassa: tämä kysymys koskee vain * kuvailevaa * tilastoa.Sitä ei välttämättä ole tarkoitus arvioida mitään.
@whuber mikä on minkä tahansa tilaston tarkoitus, ellei kuvata kiinnostavaa ominaisuutta yhdellä numerolla varustetusta tietojoukosta?Olen samaa mieltä siitä, että varianssi, vinous, kurtosis tai suurempaan asteeseen liittyvät momentit eivät yleensä ole estimaattoreita, vaan määrittelijöitä keskitaipumuksen mittaamiseksi.Mutta toivon, ettemme jätä huomiotta sanan "todennäköisyys" merkitystä yleisessä kielenkäytössä.Toimenpideohjelman yhteydessä näyttää siltä, että joku kysyi "kuinka ikäisiä ihmisiä on tällaisessa paikassa"joten mediaani on estimaattori, koska se luonnehtii kiinnostavaa määrää (parametria) yhdellä luvulla.
Ero kuvaavan tilastotiedon ja estimaattorin välillä on osittain sen käytössä: ensimmäinen on aineiston ominaisuus, puhdas ja yksinkertainen.Todennäköisyyttä ei ole, eikä sitä tarvita kuvaavien tilastojen luomiseen tai käyttämiseen.Arvioija päinvastoin yrittää luonnehtia jotain muuta kokonaan: nimittäin "populaatiota", josta tiedot ovat hypoteettisesti johdettuja.


Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 2.0-lisenssistä, jolla sitä jaetaan.
Loading...