Helpoin tapa vastata kysymykseesi on ymmärtää, että karkeasti tietojoukot luokitellaan usein poikkileikkaukseksi, aikasarjoiksi ja paneeliksi. Poikkileikkauksen regressio on poikkileikkaustietojoukkojen siirtymistyökalu. Tämän useimmat ihmiset tietävät ja viittaavat termiin regressio . Aikasarjojen regressiota käytetään joskus aikasarjoihin, mutta aikasarjaanalyysillä on laaja valikoima työkaluja regressioiden lisäksi.
Esimerkki poikkileikkaustiedoista on $ (x_1, y_1), (x_2, y_3), \ pisteitä, (x_n, y_n) $ , missä $ x_i, y_i $ ovat koulun satunnaisesti valittujen oppilaiden painoja ja korkeuksia. Kun näyte on satunnainen , voimme usein suorittaa lineaarisen regressio $ y \ sim x $ ja saada luotettavia tuloksia, jotta voimme ennustaa korkeuden $ \ hat y $ tämän koulun opiskelijasta, joka tietää vain opiskelijan painon $ x $ .
Jos näyte ei ollut satunnainen, regressio ei välttämättä toimi ollenkaan. Esimerkiksi valitsit vain tytöt ensimmäisessä luokassa arvioidaksesi mallin, mutta sinun on ennustettava miespuolisen 12. luokkalaisen pituus. Regressiolla on siis omat ongelmansa myös poikkileikkausasetuksissa.
Katsokaa nyt aikasarjatietoja, se voi olla $ x_t, y_t $ , kuten $ (x_1, y_1 ), (x_2, y_3), \ pisteitä, (x_n, y_n) $ , jossa $ t $ vuoden kuukausi ja $ x, y $ ovat edelleen painoa ja pituutta, mutta tietyn tämän koulun opiskelijan.
Yleensä regressio ei tarvitse toimia lainkaan. Yksi syy on, että indeksit $ t $ järjestetään. Joten otoksesi ei ole satunnainen, ja mainitsin aiemmin, että regressio mieluummin satunnainen näyte toimii oikein. Tämä on vakava asia. Aikasarjatiedot ovat yleensä pysyviä, esim. pituutesi tässä kuussa on vahvasti korreloitu ensi kuun pituuden Näiden ongelmien käsittelemiseksi kehitettiin aikasarjaanalyysi, joka sisälsi myös regressiotekniikan, mutta sitä on käytettävä tietyillä tavoilla.
Kolmas yleinen tietojoukotyyppi on paneeli, erityisesti yksi iwth pitkittäistieto. Täältä saat useita kuvia painon ja korkeuden muuttujista useille opiskelijoille. Tämä tietojoukko voi näyttää poikkileikkausten aaltoja tai joukkoa aikasarjoja.
Tämä voi luonnollisesti olla monimutkaisempi kuin kaksi edellistä tyyppiä. Tässä käytämme paneelin regressiota ja muita paneeleille kehitettyjä erityistekniikoita.
Yhteenvetona syynä siihen, miksi aikasarjojen regressiota pidetään erillisenä työkaluna poikkileikkausregressioon verrattuna, on, että aikasarjat esittävät ainutlaatuisia haasteita regressiotekniikan riippumattomuusoletusten suhteen. Erityisesti johtuen siitä, että poikkileikkausanalyysistä poiketen havaintojen järjestyksellä on merkitystä, se johtaa yleensä kaikenlaisiin korrelaatio- ja riippuvuusrakenteisiin, mikä voi joskus mitätöidä regressiotekniikoiden soveltamisen. Sinun on käsiteltävä riippuvuutta, ja juuri siinä aikasarjaanalyysi on hyvä.
Omaisuuden hintojen ennustettavuus
Toistat myös yleisen väärinkäsityksen osakemarkkinoista ja varojen hinnoista yleensä, että niitä ei voida ennustaa. Tämä väite on liian yleinen ollakseen totta. On totta, että et voi suoraan ennustaa AAPL: n seuraavaa merkintää luotettavasti. Se on kuitenkin hyvin kapea ongelma. Jos heität verkkoasi laajemmaksi, löydät paljon mahdollisuuksia ansaita rahaa kaikenlaisiin ennusteisiin (ja erityisesti aikasarjaanalyysiin). Tilastollinen arbitraasi on yksi tällainen kenttä.
Syy siihen, miksi omaisuuserien hintoja on vaikea ennustaa lähitulevaisuudessa, johtuu siitä, että suuri osa hintamuutoksista on uutta tietoa. Todella uutta tietoa, jota ei voida realistisesti suunnitella menneisyydestä, on määritelmän mukaan mahdotonta ennustaa. Tämä on kuitenkin idealisoitu malli, ja monet ihmiset väittävät, että poikkeavuuksia on olemassa, jotka mahdollistavat valtion pysymisen. Tämä tarkoittaa, että osa hinnanmuutoksesta voidaan selittää menneisyydellä. Tällaisissa tapauksissa aikasarjaanalyysi on varsin sopiva, koska se käsittelee tarkalleen pysyvyyttä. Se erottaa uuden vanhasta, uutta on mahdotonta ennustaa, mutta vanha vetää menneisyydestä tulevaisuuteen. Jos pystyt selittämään edes vähän, rahoitus tarkoittaa sitä, että saatat pystyä ansaitsemaan rahaa. Niin kauan kuin ennustamiseen perustuvan strategian hinta kattaa sen tuottamat tulot.
Katsaus lopuksi taloustieteeseen Nobel-palkinto vuonna 2013: "On täysin mahdollista ennakoida näiden hintojen laaja kehitys pitkillä ajanjaksoilla, kuten seuraavien kolmen tai viiden vuoden aikana." Katsokaa Shillerin Nobel -luentoa, jossa hän keskustelee varojen hintojen ennustettavuudesta