Kysymys:
Mitä parhaita käytäntöjä minun tulisi noudattaa tontteja valmistellessani?
user28
2010-07-21 16:00:45 UTC
view on stackexchange narkive permalink

Teen yleensä omat idiosynkraattiset valintani tontteja valmistellessani. Ihmettelen kuitenkin, onko tonttien tuottamiseen parhaita käytäntöjä.

Huomaa: Robin kommentti vastaukseen tähän kysymykseen on tässä erittäin tärkeä.

Viisitoista vastused:
#1
+24
Peter Smit
2010-07-21 16:18:56 UTC
view on stackexchange narkive permalink

Tufte-periaatteet ovat erittäin hyviä käytäntöjä tonttien valmistelussa. Katso myös hänen kirjansa Kauniita todisteita

Periaatteet ovat:

  • Pidä korkea data-mustesuhde
  • Poista kaavio roska
  • Anna graafiselle elementille useita toimintoja
  • Pidä mielessä datatiheys

Etsitävä termi on Tietojen visualisointi

Tuften visuaalinen näyttö määrällisistä tiedoista (http://www.amazon.com/o/ASIN/0961392142/ref=nosim/gettgenedone-20) on parempi kuin Beautiful Evidence IMO. Kaikki hänen neljä kirjaa ovat kuitenkin hyviä, ja jos sinulla on mahdollisuus käydä jollakin hänen kursseistaan, tee se.
Olen samaa mieltä useimpien Tuftein sanojen kanssa, mutta minun on sanottava, että hänen [vähäinen data: mustekasetit] (http://indiemaps.com/blog/2008/02/props-to-box-plots/) ovat yksinkertaisia typerä. Luulen, että minulla on 3-4 kertaa kauemmin aikaa selvittää kuin tavallisissa laatikoissa. R-oletusarvot ovat paljon parempia (vaikka hännän päissä olevat viivat ovat tarpeettomia). Perinteisillä laatikkoalueilla on lisäetu, että ne voivat edustaa näytteen kokoa (leveydellä) ja standardipoikkeamia (lovilla).
+1 @ naught101 muutamat muut jakavat tämän mielipiteen SO: ssä: http://stackoverflow.com/questions/6973394/functions-available-for-tufte-boxplots-in-r#comment8320383_6973394
#2
+15
Shane
2010-07-21 16:16:55 UTC
view on stackexchange narkive permalink

Voisimme olla täällä koko päivän merkitsemällä parhaita käytäntöjä, mutta sinun tulisi aloittaa lukemalla Tufte. Ensisijainen suositukseni:

Pidä yksinkertaisena.

Usein ihmiset yrittävät ladata kaavioihinsa tietoja. Mutta sinulla pitäisi olla vain yksi pääidea, jonka yrität välittää, ja jos joku ei saa viestiäsi melkein heti, sinun pitäisi miettiä uudelleen, kuinka olet esittänyt sen. Älä siis ala työskennellä kaavion parissa, ennen kuin viesti itsessään on selvä. Occamin partakone soveltuu myös tähän.

Olen samaa mieltä enemmistön kanssa, mutta mielestäni "pidä yksinkertaisena". voi olla epäselvä. Tärkein asia on, että sinun pitäisi tietää, mitä haluat kaavion välittää. "Pidä se yksinkertaisena." tuo esiin joitain muita ideoita, kuten "Data: mustesuhteen tulisi olla korkea.", jota Tufte kannustaa, ja "Esitä korkeintaan kolme muuttujaa". Tufte ei suosittele.
Tämä neuvo on selvästi päinvastoin parempi.Mutta on tilanteita, joissa kaavio on välttämättä monimutkainen ja vaatii yksityiskohtaista, huolellista ja harkittua tutkimusta.Mutta komplikaation pitäisi itsessään olla mahdollisimman yksinkertainen.Esimerkiksi 25 kuvaajaa 5 x 5 -matriisissa saattaa tarvita pitkittynyttä tutkimusta, mutta ajatus siitä, että kukin näyttää vain osan tiedoista, on suhteellisen helppo ymmärtää.
#3
+12
Ian Turner
2010-07-21 16:20:45 UTC
view on stackexchange narkive permalink

Yksi nyrkkisääntö, jota en aina noudata, mutta joka on joskus hyödyllistä, on ottaa huomioon, että on todennäköistä, että juoni on jossain vaiheessa tulevaisuudessa

  • lähetetään faksilla,
  • valokopioitu ja / tai
  • mustavalkoisena toistettu.

Sinun on yritettävä tehdä juoni riittävän selkeä, että vaikka ne toistettaisiin epätarkasti tulevaisuudessa, tiedot, joita juoni yrittää välittää, ovat silti luettavissa.

Luulen, että tarkoitat faksilla lähettämistä jossain ** ** menneisyydessä **;)
+1 tälle. Seminaarin juoni, paperisi sydän, ei saisi olla täysin käsittämätön, koska tulostin sen.
[tämä vastaus] (http://stats.stackexchange.com/a/11460/9007) käsittelee samanlaista ongelmaa.
#4
+8
Benjamin Bannier
2010-07-21 18:01:40 UTC
view on stackexchange narkive permalink

Selkeän viestin välittämisen lisäksi yritän aina muistaa juonittelun:

  • Tarrojen ja selitteiden kirjasinkoon tulee olla riittävän suuri, mieluiten sama fonttikoko ja kirjasin, jota käytettiin lopullisessa julkaisun.
  • viivanleveyksien tulisi olla riittävän suuret (1 pt: n viivat yleensä katoavat, jos tontteja kutistetaan vain vähän). Yritän siirtyä 3 - 5 pt: n linjaleveydelle.
  • Jos piirretään useita aineistoja / käyriä väreillä, varmista, että ne voidaan ymmärtää, jos ne tulostetaan mustavalkoisina, esim. käyttämällä erilaisia ​​symboleja tai linjatyyliä värien lisäksi.
  • käytä aina häviötöntä (tai lähellä häviötöntä) muotoa, esim. vektorimuoto, kuten pdf, ps tai svg tai korkean resoluution png tai gif (JPEG ei toimi ollenkaan eikä sitä ole koskaan suunniteltu viivapiirroksiin).
  • valmistele grafiikat lopullisessa kuvasuhteessa käytettäväksi julkaisu. Kuvasuhteen muuttaminen myöhemmin voi antaa ärsyttäviä fontti- tai symbolimuotoja.
  • poista aina piirtäjäohjelmasta turha sekoitus, kuten käyttämättömät histogrammitiedot, trendiviivat (tuskin hyödylliset) tai oletusnimet.

Olen määrittänyt piirturiohjelmistoni (matplotlib, ROOT tai root2matplotlib) tekemään oletusarvoisesti suurimman osan tästä oikeudesta. Ennen kuin käytin gnuplot -tunnusta, joka tarvitsi täällä ylimääräistä hoitoa.

#5
+8
user88
2010-07-22 01:11:03 UTC
view on stackexchange narkive permalink

Fysiikan kentällä on sääntö, jonka mukaan koko paperin / raportin tulisi olla ymmärrettävää vain juonien nopeasta tarkastelusta. Joten suosittelen lähinnä, että heidän pitäisi olla itsestään selviä.
Tämä tarkoittaa myös sitä, että sinun on aina tarkistettava, onko yleisösi perehtynyt jonkinlaisiin juoneihin - olin kerran tehnyt suuren virheen olettaen, että jokainen tiedemies tietää, mitkä laatikkoesitykset ovat, ja hukkaan sitten tunnin selittää sitä.

Sympatiat laatikkokaaviokokemuksessa, mutta mitä tämä tarkoittaa, on (a) käyttää suhteellisen yksinkertaista muunnosta (esim. Näyttää mediaani, kvartiilit, 5% ja 95% pistettä ja kaikki datapisteet sen jälkeen) sen sijaan, että näytettäisiin mitään yleisen käytännön perusteella1,5 IQR;(b) lisäämällä kuvateksti, joka tekee käytänteistä selkeät.
#6
+6
Bossykena
2010-07-21 22:26:15 UTC
view on stackexchange narkive permalink

Tässä ovat ohjeeni, jotka perustuvat yleisimpiin havaitsemiini virheisiin (kaikkien muiden mainittujen hyvien kohtien lisäksi).

  • Käytä sirontakaavioita, älä viivakaavioita, jos elementtien järjestys ei ole asiaankuuluva.
  • Valmistellessasi vertailtavaksi tarkoitettuja kaavioita, käytä samaa asteikkokerrointa kaikille.
  • Vielä parempi - etsi tapa yhdistää tiedot yhteen kaavioon (esim. laatikkopiirrokset ovat parempia kuin useat histogrammit, jotta voidaan verrata suurta määrää jakaumia).
  • Älä unohda määrittää yksiköt
  • Käytä selitystä vain, jos sinun on - käyrät on yleensä selkeämpi merkitä suoraan.
  • Jos sinun on käytettävä selitettä, siirrä se juovan sisään tyhjälle alueelle.
  • Suorita viivakaavioissa kuvasuhde, joka tuottaa karkeasti viivoja. 45 ° sivun kanssa.
* "boxplotit ovat parempia kuin useat histogrammit vertaamaan suurta määrää jakeluita" * - tämä pätee vain, jos tietosi ovat yksimuotoisia eikä niissä ole kurtoosia tai muita ominaisuuksia, joita boxplotit eivät voi siepata.
#7
+6
visnut
2010-08-13 06:30:32 UTC
view on stackexchange narkive permalink

Tutustu R-grafiikkakirjastoon ggplot2. Yksityiskohdat ovat verkkosivulla http://had.co.nz/ggplot2/ Tämä paketti tuottaa erittäin hyvät oletuskäyrät, jotka noudattavat Tufte-periaatteita, Clevelandin ohjeita ja Ihakan väripakettia.

#8
+6
Andrej Panjkov
2011-06-02 08:51:32 UTC
view on stackexchange narkive permalink

Jos piirrät värillisenä, ota huomioon, että värisokeilla ihmisillä voi olla vaikeuksia erottaa elementtejä pelkästään värin perusteella. Joten:

  • Käytä viivatyyliä erottaaksesi viivat.
  • Käytä ylimääräistä painoa elementeissä, tee viivanleveydeksi vähintään 2 pt jne.
  • Käytä eri merkit sekä värit pisteiden erottamiseksi.
  • Käytä tarroja ja merkintöjä viitaten myös sijaintiin ja tyyliin.
  • Kun viitat tekstin juoni-elementteihin, kuvaa ne värin, suhteellisen sijainnin mukaan ja tyyli: "punainen, ylempi, viiva-piste-käyrä"
  • Käytä värisokeaystävällistä palettia. Katso http://www.vischeck.com/vischeck/,, http://jfly.iam.u-tokyo.ac.jp/color/#pallet. Minulla on yksinkertainen python-toteutus paletista viimeisessä viitteessä osoitteessa code.google.com, etsi python-cudtools
Ota huomioon myös se, että jonkun on ehkä tulostettava se harmaasävytulostimella. Olen tehnyt tämän aiemmin - käytin tehtävässä ggplot2-oletusvärejä (jotka näyttävät hyvältä näytöltä), jotka sitten tulostin mustavalkoisina, ja puolta väreistä ei voitu erottaa muista! \*punastua\*
#9
+4
Frank Harrell
2011-06-02 17:47:18 UTC
view on stackexchange narkive permalink

Nämä ovat upeita ehdotuksia. Olemme koonneet paljon materiaalia osoitteeseen http://biostat.mc.vanderbilt.edu/StatGraphCourse. Ryhmä lääketeollisuuden, korkeakoulujen ja FDA: n tilastotieteilijöitä luo myös resurssin, joka on erittäin hyödyllinen kliinisissä tutkimuksissa ja niihin liittyvässä tutkimuksessa. Paljon uutta materiaalia paljastetaan kuukaudessa, mutta paljon on jo olemassa - http://www.ctspedia.org/do/view/CTSpedia/PageOneStatGraph

Oma suosikkini graafinen kirja on Elements of Graphing Data , kirjoittanut William Cleveland.

Ohjelmistojen osalta mielestäni on vaikea voittaa R: n ggplot2- ja ristikkopaketteja. Stata tukee myös erinomaisia ​​grafiikoita.

#10
+3
Matti Pastell
2010-07-22 16:05:55 UTC
view on stackexchange narkive permalink

Se riippuu myös siitä, missä et halua julkaista juoniasi. Säästät itsellesi paljon vaivaa tutustumalla kirjoittajien oppaaseen, ennen kuin teet juonteita lehdelle.

Tallenna kaaviot myös muotoon, jota on helppo muokata tai tallentaa niiden luomiseen käyttämäsi koodi. Mahdollisuudet ovat, että sinun on tehtävä korjauksia.

#11
+3
Pablo Marin-Garcia
2011-06-01 00:35:02 UTC
view on stackexchange narkive permalink

Älä käytä dynamiittikuvioita: http://pablomarin-garcia.blogspot.com/2010/02/why-dynamite-plots-are-bad.html, käytä viulukuvioita tai vastaavia (boxplots-perhe)

#12
+2
Freya Harrison
2010-07-22 18:41:54 UTC
view on stackexchange narkive permalink

Lisään, että kaavion valinnassa on otettava huomioon tietojen analysointiin käytetty tilastollisen testin tyyppi. Toisin sanoen mitä tahansa analyysissä käytettyjen tietojen ominaisuuksia on näytettävä visuaalisesti - joten näytät keskiarvot ja vakiovirheet, jos käytit t-testiä, mutta laatikkoalueita, jos käytit Mann-Whitney-testiä.

#13
+2
David J.
2011-12-07 09:12:54 UTC
view on stackexchange narkive permalink

Muut vastaukset ovat liian kaavamaisia ​​vakuuttaviksi, joten anna minun antaa yleisempi vastaus. Olen kamppaillut tämän kysymyksen kanssa jonkin aikaa. Tarjoan tämän prosessin:

  1. Tunne viestisi
  2. Tunne yleisösi
  3. Tunne rajoituksesi
  4. Räätälöi viesti omasi yleisö rajoitteidesi mukaan

Olen skeptinen yleisvaatimuksista, kuten "pidä yksinkertaisena" - mitä se tarkoittaa? No, se riippuu yleisöstä. Jotkut yleisöt syövät Tufte-tyylin. Mutta jotkut yleisöt arvostavat pientä kaavion roskaa silloin tällöin. Jotkut ihmiset ovat kyllästyneet sirontapisteistä. Jotkut ihmiset pitävät värikkäistä taustat. Onko niin väärin houkutella heitä hieman, vaikka kompromissi "esteettisestä" puhtaudesta? Se on sinun tehtäväsi päättää.

Yleisön reaktio on tärkeä palaute, mutta ei ainoa. Jos löydät tavan mitata heidän ymmärrystään ennen ja jälkeen esityksestäsi, alat ymmärtää tekemäsi vaikutuksen.

"oikea" vastaus riippuu tällaisista kysymyksistä:

  • Mitä mediaa käytät?

  • Luotko staattista tai vuorovaikutteisia juonia?

  • Yritätkö kertoa ennalta määritetyn tarinan (käsikirjoitus) tai rohkaista kokeilemaan (etsintä)?

  • Missä määrin haluat yleisön tekemään omat johtopäätöksensä?

  • Missä määrin haluat yleisön seuraavan ja vakuuttavan tarinasi?

  • Missä määrin haluat yleisön haastavan havaintosi?

Yhteenvetona suunnittelu materiaaleissasi tarkoituksella ilmoitettiin viestisi, yleisösi ja rajoituksesi.

"Kiinnittyä" vai häiritäkö? Väri voi olla ok, mutta olet viime kädessä täällä tietoja tiedoista, ja estetiikan tulisi palvella tietoja, eikä päinvastoin.
#14
+2
naught101
2012-04-20 06:29:44 UTC
view on stackexchange narkive permalink

Yksi asia, jonka muistan tuften mainitsevan, jota ei ole muissa vastauksissa, on kartoitus - ts. merkitse kaavion sijainti, suunta, koko jne. todellisuus . Kaaviossa olevan sisällön pitäisi olla todellisessa maailmassa. Suuren pitäisi olla iso (pitäen mielessä, että alueiden tulisi edustaa alueita ja volyymeja. Älä koskaan yritä edustaa alueen skalaarista arvoa, se on erittäin epäselvä!). Tämä koskee myös värejä, muotoja jne., Jos ne ovat merkityksellisiä.

Mielenkiintoinen esimerkki on "hame-sarjan" kaavio tässä: http: // a-little-book-of-r -for-time-series.readthedocs.org/en/latest/src/timeseries.html. Vaikka teknisesti se on oikein, ja "korkeampi" hameen pituus on kaaviossa korkeampi, se on itse asiassa melko hämmentävää, koska hameen pituus alkaa yläosasta ja menee alas (toisin kuin ihmiset tai puut, joissa mitataan korkeus maasta). Joten kasvanut hameen pituus edustaa pienempää arvoa:

  hameet <- scan ("http://robjhyndman.com/tsdldata/roberts/skirts.dat", skip = 5) hameet <ts (hameet, start = c (1866)) juoni. hameet (hameet, sarja ylim = c (max (hameet), min (hameet)))  

enter image description here

On, kuten aina, vaikeuksia. Esimerkiksi pidämme yleensä aikaa siirtyä eteenpäin, ja ainakin lännessä luemme vasemmalta oikealle, joten myös aikasarjakaaviomme kulkevat yleensä vasemmalta oikealle ajan kasvaessa. Joten mitä tapahtuu, jos haluat edustaa jotain, joka on parhaiten edustettu sivusuunnassa (esim. Jonkin itä-länsi-mitat), ajan myötä? Siinä tapauksessa sinun on tehtävä kompromisseja ja joko kuvattava aika eteenpäin tai alaspäin (mikä riippuu taas kulttuurisista käsityksistä), tai valita kartoittaa sivusuunnassa oleva muuttujasi ylös / alas kaaviossasi.

Esimerkki ajan / tilan vaihtamisesta on kirjassa Making Maps (kriittinen keskustelu ja esimerkkejä [tässä]) (http://freegeographytools.com/2011/making-maps-a-visual-guide-to-map -design-for-gis-a-review-of-the-2nd-edition).
Mukava (kamala) esimerkki! Kartat tuovat esiin toisen, vaikeamman kaupan: yrittävät edustaa kahta ulottuvuutta + aikaa kaksiulotteisella sivulla (esim. Kartat mannermaasta). Melko vaikeaa. Mutta luulen, että animaatiot ovat :)
Kertoavan esimerkkisi avulla voidaan mainita kaksi usein syntyvää ylimääräistä pistettä.1. Aika-akselilla otsikko tai otsikko, kuten "TIme", on yleensä tarpeeton.2. Nimikkeitä tai etikettejä, kuten "hameet", voidaan aina parantaa suppeasti mutta informatiivisesti, mukaan lukien tarvittaessa mittayksiköt.
#15
+1
Baltimark
2010-07-21 23:11:59 UTC
view on stackexchange narkive permalink

Se riippuu tapasta, jolla juonista keskustellaan.

Jos esimerkiksi lähetän tontteja ryhmäkokoukseen, joka tehdään eri sijainneista saapuvien soittajien kanssa, mieluummin kootaan heidät yhteen Powerpointiin Excelin sijaan, joten on helpompi kääntää.

Henkilökohtaisiin teknisiin puheluihin laitan jotain exceliin, jotta asiakas voi siirtää juoni sivuun ja tarkastella raakatietoja. Tai voin syöttää p-arvot soluihin sivuregressiokertoimien, esim.

Muista: juoni on halpaa, etenkin diaesityksen tai sähköpostin lähettämisen ryhmälle. Haluaisin mieluummin tehdä 10 selkeää kaaviota, jotka voimme selata, kuin viisi juonia, joissa yritän laittaa erilliset kohortit (esim. "Miehet ja naiset") samaan kaavioon.



Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 2.0-lisenssistä, jolla sitä jaetaan.
Loading...