Faktorimallien käyttö sijoitusstrategioissa on pitkään herättänyt keskustelua siitä, kuinka nämä mallit eroavat perinteisistä ennustemalleista, jotka perustuvat tilastollisiin kausaliteetteihin ja ennakoivien tekijöiden analysointiin. Faktorisijoittaminen, jossa pyritään tunnistamaan ja hyödyntämään erityisiä taloudellisia tekijöitä, eroaa ratkaisevasti niistä lähestymistavoista, jotka keskittyvät ennustamaan tiettyjen osakkeiden tai markkinasegmenttien tulevaa kehitystä.
Faktorimallin käyttäjän lähestymistapa on perinteisesti eroteltu, jossa jokaiselle faktorille on oma erillinen portfolionsa. Tällöin sijoittaja voi yhdistää nämä erilliset faktoripohjaiset portfoliot monifaktoriseksi kokonaisportfolioksi, mutta tämä yhdistäminen ei perustu monifaktoriseen ennusteeseen, vaan sen tarkoituksena on yksinkertaisesti hajauttaa riskit. Tämä eroaa merkittävästi ennustemallien käyttötavoista, joissa sijoittajat pyrkivät rakentamaan portfolion, joka perustuu ennakoivien mallien tuottamaan tulokseen ja näiden mallien varmistamaan tuottoon.
Faktorimallin näkökulmasta tärkeää on, että sijoittajat eivät yritä luoda portfoliota, joka perustuu yksittäisten ennusteiden mukaan valittuihin osakkeisiin, vaan he keskittyvät luomaan portfolion, joka on altistettu tietyille taloudellisille tekijöille, kuten arvoon, kokoon tai momentumiin. Tämä tarkoittaa, että sijoittajat voivat valita osakkeita, joiden uskotaan olevan altistuneet tietylle riskitekijälle, kuten markkinahintojen oikaisulle, eikä yksittäisten osakkeiden tulevaa tuottoa ennusteta suoraan.
Sen sijaan, että sijoittajat hyödyntäisivät tilastollisia malleja ennustamaan markkinahintojen liikkeitä, he rakentavat portfolionsa siten, että se on altistettu eräänlaisen järjestelmällisen riskin, kuten korkeiden tai matalien arvostustekijöiden, liikkeelle. Tämän strategian ytimessä on ajatus siitä, että markkinahinnat ja taloudelliset tekijät liikkuvat ennakoitavalla tavalla, mutta se ei perustu ennustamaan tietyn osakkeen hintakehitystä vaan koko markkinasegmentin käyttäytymistä.
Tässä sijoittajille tarjoama malli on enemmänkin riskien hajauttamiseen perustuva lähestymistapa kuin ennustemallin käyttö, jossa pyritään ennustamaan tarkasti, miten yksittäiset osakkeet tulevat käyttäytymään tulevaisuudessa. Tämä ero näkyy myös siinä, kuinka tilastollisessa analyysissä käytetään regressiomalleja ja muita matemaattisia lähestymistapoja arvioimaan tekijöiden vaikutusta tuottoihin. Faktorimallissa ei ole niinkään kyse yksittäisten ennusteiden hyödyntämisestä, vaan laajojen taloudellisten tekijöiden eristämisestä ja analysoinnista, jotka voivat vaikuttaa markkinoiden kokonaisdynamiikkaan.
Faktorimallien avulla sijoittajat voivat tarkastella, kuinka tietyt taloudelliset tekijät, kuten yrityksen koko, kasvu tai arvo, voivat vaikuttaa koko markkinan tuottoihin. Tällöin sijoittajan tehtävänä on arvioida, kuinka nämä tekijät liittyvät toisiinsa ja kuinka ne voivat muokata markkinoiden riskiprofiilia. Tämä lähestymistapa poikkeaa merkittävästi perinteisestä mallista, jossa pyritään ennustamaan tarkasti osakkeiden kehitystä. Esimerkiksi arvo-osakkeet voivat houkutella sijoittajia, koska niiden riskiprofiili on ennakoitavissa ja voidaan suhteuttaa laajempiin taloudellisiin tekijöihin, kuten yrityksen taloudelliseen tilaan.
Lisäksi sijoittajat, jotka hyödyntävät faktorimalleja, eivät pyri ennustamaan yksittäisten osakkeiden tuottoa, vaan heidän tavoitteensa on yhdistää osakkeet, joiden taloudelliset tekijät luovat yhteisen riskiprofiilin. Näin ollen sijoittajat voivat rakentaa portfolion, joka on hajautettu ja altistettu eri markkinatekijöille, mikä voi parantaa portfolion kokonaistuottoa pitkällä aikavälillä. Tämä lähestymistapa perustuu käsitykseen, että markkinoiden liikkeet voivat olla ennakoitavissa tietyillä tekijöillä, mutta yksittäisten osakkeiden tarkka ennustaminen ei ole tavoitteena.
Yhtä lailla, kuten monilla muilla taloudellisilla malleilla, myös faktorimallien käyttö ei ole täysin ongelmatonta. Useat tutkimukset ovat kyseenalaistaneet sen, kuinka tarkasti nämä mallit pystyvät arvioimaan tekijöiden vaikutusta osakkeiden tuottoihin. Esimerkiksi Fama ja French (1996) esittivät, että osakkeet, jotka ovat lähellä konkurssia, kokevat hintakorjauksia, jotka heijastuvat korkean arvon omaavien osakkeiden, eli ns. arvotekijän, kautta. Tämä puolestaan voisi tarkoittaa, että arvotekijän nousu ei välttämättä ole seurausta markkinoiden irrationaalisuudesta, vaan luonnollisesta hintojen oikaisusta taloudellisten tekijöiden perusteella.
Muita vaihtoehtoisia selityksiä faktorimallien pohjalta ovat tuotannon ja investointien näkökulmat. Esimerkiksi Berkin et al. (1999) mukaan yritysten omaisuus ja kasvu voivat muuttua ennakoitavalla tavalla, jolloin nämä muutokset voivat vaikuttaa yrityksen järjestelmälliseen riskiin ja odotettuun tuottoon. Tällöin tekijöiden rooli ei ole pelkästään taloudellisten suhteiden seuraaminen, vaan myös se, kuinka nämä suhteet voivat muuttaa yritysten tulevaisuuden tuotto-odotuksia ja riskejä.
Kokonaisuudessaan faktorimallit tarjoavat tavan ymmärtää markkinoiden kompleksisuutta ja niihin vaikuttavia tekijöitä, mutta ne eivät ole täydellisiä ja niiden käyttöön liittyy omat haasteensa ja rajoituksensa. Sijoittajien on tärkeää ymmärtää, että vaikka faktorimallien avulla voidaan tavoitella hajautetumpia ja vähemmän riskialttiita portfoliosijoituksia, tekijöiden vaikutuksia on vaikea ennustaa täysin tarkasti. Sijoittaminen faktoreihin on enemmänkin riskien hallintaa ja markkinadynamiikan ymmärtämistä kuin yksittäisten osakkeiden tarkkaa ennustamista.
Miten moninkertaiset testit ja ylikorjaus vaikuttavat faktoreiden sijoittamiseen?
Faktorisijoittaminen on yhä suosittu lähestymistapa rahoitusmarkkinoilla, mutta se tuo mukanaan tärkeitä tilastollisia ja metodologisia haasteita, joita ei ole aina riittävästi käsitelty perinteisissä ekonometrian oppikirjoissa. Vaikka monet taloustieteilijät ovat puhuneet testauksen ongelmista, erityisesti moninkertaisista testeistä, tätä aihetta ei ole käsitelty riittävän syvällisesti. Kuten Harvey (2017, s. 1402) toteaa, ”tavanomaiset testausmenetelmämme eivät ole aina riittävän varustautuneita vastaamaan esittämiimme kysymyksiin”. Monissa tieteellisissä yhteyksissä on pitkään pohdittu testausmenetelmien parantamista, mutta rahoitusalalla haasteet jäävät usein huomiotta. Tämä ilmenee erityisesti niin kutsutun p-hakkauksen kiistämisessä, jonka taustalla on kaupallisia intressejä, jotka ohjaavat finanssialan akateemista tutkimusta (Harvey 2022).
Backtest-ylikorjaus ja sen vaikutukset
Backtestit, eli historialliset simulaatiot siitä, kuinka tietty systeemaattinen strategia olisi toiminut menneisyydessä, ovat olennainen osa faktorisijoittajien työkalupakkia. Näitä testejä käytetään usein todisteina siitä, että väitetty syy-yhteys on todellinen. Kuitenkin backtest on luonteeltaan vain assosiaatiotestaus, eikä sillä ole kykyä osoittaa tai kumota syy-seuraus-suhteen olemassaoloa. Toisin kuin kontrolloiduissa kokeissa, backtestit eivät mahdollista tutkimuksen interventiota tiedonluontiprosessiin, eivätkä ne hyödynnä satunnaista jakoa, joka on olennainen osa tieteellisten kokeiden luonteenpiirteitä. Näin ollen backtestit voivat vain antaa arvion sijoitusstrategian taloudellisesta potentiaalista, olettaen että historia toistaa itseään.
Lisäksi backtestien ongelmana on, että harvoin raportoidaan tai korjataan testien määrää. Tämä on erityisen tärkeää, sillä moninkertaisessa testauksessa saattaa tapahtua valintavirhe, joka vie tuloksia harhaan. Näin ollen backtestin tulokset voivat helposti johtaa virheellisiin johtopäätöksiin ja sekoittaa signaalin ja kohinan eron. Tällaisessa tilanteessa kaksi tutkijaa saattaa tehdä saman virheen ja tulkita kohinan signaaliksi, erityisesti jos heidän mallinnusmenetelmänsä ovat samanlaisia ja sisältävät samanlaisia virheitä.
Type-B spuriosity ja sen vaikutus faktorisijoittamiseen
Termi "type-B spuriosity" tarkoittaa tilannetta, jossa tutkimuksessa assosiaatio sekoitetaan syy-seuraus-suhteeksi. Tämä on erityisen vaarallista, koska se voi johtaa vääristyneisiin johtopäätöksiin, kun käytetyt mallit eivät ole oikein määriteltyjä. Type-B spuriosity ilmenee erityisesti silloin, kun mallin virheellinen määrittely johtaa vääristymiin arvioiduissa syy-seuraus-suhteissa. Tässä yhteydessä on tärkeää huomata, että type-B spuriosity voi tapahtua myös yhdellä testillä, mutta sen todennäköisyys kasvaa näytteen koon kasvaessa. Tämä johtuu siitä, että ei-syy-yhteys voidaan arvioida tarkemmin suuremmassa näytteessä.
Yksi yleisimmistä syistä type-B spuriosityyn on mallin väärä määrittely, joka voi johtaa siihen, että tutkija ei ota huomioon kaikkia oleellisia muuttujia. Jos mallista puuttuu keskeinen muuttuja, esimerkiksi konfounderi, se voi johtaa virheellisiin päätelmiin ja väärään syy-seuraus-suhteeseen. Tässä yhteydessä on tärkeää ymmärtää, että mallin oikea määrittely ei ole pelkästään tekninen kysymys; se edellyttää myös teoreettista ymmärrystä siitä, miten muuttujat liittyvät toisiinsa.
Alikontrollointi ja sen vaikutukset
Alikontrollointi on tilanne, jossa tutkija ei ole ottanut huomioon kaikkia relevanteja muuttujia, jotka voivat vaikuttaa tutkittavaan ilmiöön. Tämä johtaa virheellisiin arviotuksiin ja vääristää mahdollisia sijoitustekijöitä. Esimerkiksi, jos mallista puuttuu keskeinen konfounderi, kuten Z, jonka vaikutus on merkittävä, tutkimus voi antaa virheellisiä tuloksia ja vääristää sijoitusstrategian tuottopotentiaalin arvioita. Näin ollen on tärkeää, että tutkijat huomioivat kaikki mahdolliset muuttujat, jotka voivat vaikuttaa arvioituihin tuloksiin.
On myös huomattava, että alikontrollointi ei aina ole ilmeistä. Mallin määrittelyvirheet voivat olla hienovaraisia ja ne voivat johtaa siihen, että tutkija tekee vääriä johtopäätöksiä syy-seuraus-suhteista, vaikka tulokset näyttäisivät jollain tasolla oikeilta. Tämä on erityisen tärkeää faktorisijoittamisen kentällä, jossa päätöksiä tehdään usein historiallisten tietojen pohjalta. Ilman oikeaa mallin määrittelyä sijoitusstrategioiden toimivuutta ei voida arvioida luotettavasti.
Yhteenvetona voidaan todeta, että faktorisijoittamisessa on monia haasteita, jotka liittyvät moninkertaisiin testeihin, backtest-ylikorjauksiin ja alikontrollointiin. Nämä tekijät voivat johtaa virheellisiin päätelmiin ja vääristää sijoitustrategioiden arvioita. Sijoittajien ja tutkijoiden on tärkeää ymmärtää nämä ongelmat, jotta he voivat tehdä parempia päätöksiä ja välttää virheellisiä johtopäätöksiä, jotka voivat vaikuttaa heidän sijoitustoimintaansa.
Miten datatiede ja kokeelliset tutkimukset vaikuttavat rahoitusmarkkinoihin?
Rahoitustieteellisessä tutkimuksessa on pitkään ollut keskeistä pyrkiä ymmärtämään, miten taloudelliset ilmiöt, kuten osakkeiden ja korkojen tuotot, määräytyvät ja mitkä tekijät vaikuttavat näihin tuottoihin. Tieteen kehityksen myötä on tullut ilmi, että perinteisten taloustieteellisten malleiden ja hypoteesien lisäksi tarvitaan uusia lähestymistapoja, jotka hyödyntävät datatiedettä ja kokeellisia menetelmiä. Monet klassiset taloustieteelliset teoriat, kuten tehokkaiden markkinoiden hypoteesi (EMH), ovat saaneet osakseen kritiikkiä, ja niiden paikkansapitävyys on kyseenalaistettu uusien tutkimusten valossa. Esimerkiksi Fama ja Frenchin (1993) tutkimus "Common Risk Factors in the Returns on Stocks and Bonds" esitteli uusia riskitekijöitä, jotka selittävät osakkeiden tuottojen poikkeavuuksia.
Modernit rahoitustieteelliset mallit, kuten monitekijämallit, ovat olleet tärkeässä roolissa tämän keskustelun jatkamisessa. Fama ja French (1996) esittivät multifaktoriaalisia selityksiä omaisuuslajien hinnoittelupoikkeavuuksille. Näiden mallien avulla voidaan tarkastella, miten useat riskitekijät, kuten markkinariskit, koko talouden kehityssuunnat ja sektorikohtaiset riskit, vaikuttavat osakkeiden ja muiden omaisuuserien hintoihin. Samalla on kuitenkin ymmärrettävä, että nämä mallit ovat teoreettisia ja niiden käyttö vaatii huolellista empiiristä testausta.
Tässä yhteydessä datatiede tuo mukanaan uudenlaisen tavan tutkia ja mallintaa taloudellisia ilmiöitä. Koneoppimisen ja suurten tietoaineistojen käyttö on mahdollistanut entistä tarkempien ja realistisempien ennusteiden tekemisen rahoitusmarkkinoilla. Esimerkiksi López de Prado (2018) esitteli "Financial Machine Learning" -teoksessaan, miten rahoitusmarkkinoiden analysointiin voidaan soveltaa kehittyneitä koneoppimismenetelmiä, jotka mahdollistavat suurempien datamassojen käsittelyn ja poikkeuksellisten markkinatilanteiden tunnistamisen. Datatiede ei ole kuitenkaan ongelmatonta: datan puhdistaminen, validointi ja oikeiden mallien valinta voivat olla vaikeita ja aikaa vieviä prosesseja, ja epävarmuus liittyy usein myös mallien ennusteiden luotettavuuteen.
Yksi merkittävä ongelma, joka liittyy sekä taloustieteellisiin että datatieteellisiin malleihin, on niin sanottu monen testin ongelma. Kun samalle datalle suoritetaan useita tilastollisia testejä, riskinä on, että löydetään tilastollisesti merkitseviä tuloksia sattumalta, mikä voi johtaa virheellisiin johtopäätöksiin. Tämän ongelman tunnistaminen ja sen hallitseminen on keskeinen osa nykyaikaista taloustieteellistä tutkimusta. Erityisesti López de Prado (2019) esitti ratkaisun tähän ongelmaan esittelemällä tavan, jolla useita testejä voidaan tehdä huomioiden kerronnan ja virheiden hallinnan näkökohdat.
Datatieteen sovelluksia rahoitusmarkkinoilla käsitellään usein myös siihen liittyvissä empiirisissä tutkimuksissa, joissa analysoidaan markkinailmiöitä ja ennustetaan tulevia tuottoja. Näissä tutkimuksissa käytetään monenlaisia menetelmiä, kuten aikasarjatietojen analysointia ja regressiomalleja, jotka voivat auttaa ymmärtämään, miten tietyt taloudelliset tekijät, kuten korkotasot tai bruttokansantuotteen kasvu, vaikuttavat osaketuottoihin. Yksi merkittävä tutkimusperinne tällä alalla on Grangerin ja Newboldin (1974) esittelemä spurious regression -ilmiö, jossa tilastollinen yhteys saattaa syntyä vain sattumalta, vaikka todellista kausaalista yhteyttä ei olekaan.
Datatieteellisten ja kokeellisten tutkimusmenetelmien yhdistäminen tarjoaa rahoitustutkimukselle uusia mahdollisuuksia. Esimerkiksi Grangerin (1969) ja myöhemmin Grangerin, Hyungin ja Jeonin (2001) kehittämä kausaalisuuden testaus tarjoaa keinon tutkia, voidaanko tietyn taloudellisen muuttujan muutokset selittää toisen muuttujan avulla, vai ovatko ne pelkästään satunnaisia korrelaatioita. Tällaiset lähestymistavat auttavat tutkijoita ja käytännön talouden asiantuntijoita arvioimaan, mikä on todellista syy-seuraussuhdetta ja mikä saattaa johtua vain tilastollisista fluktuatioista.
Erityisen tärkeä asia, joka usein jää huomiotta, on tilastollisten mallien ja datan soveltamisen eettinen ulottuvuus. Vaikka datatiede tuo valtavia etuja, kuten paremman ennustettavuuden ja nopeamman analyysin, se tuo mukanaan myös haasteita, kuten datan valikoimisen vääristymät ja mallien selittämättömyyden. Tämän vuoksi on tärkeää, että tutkijat ja asiantuntijat suhtautuvat kriittisesti mallien tuloksiin ja arvioivat niiden rajoitteet.
Lopuksi on tärkeää muistaa, että vaikka datatiede ja kokeelliset menetelmät tarjoavat paljon uusia työkaluja taloustieteelliseen tutkimukseen, ne eivät ole täydellisiä. On tärkeää suhtautua varovaisesti ja kriittisesti tutkimustuloksiin, ja ymmärtää, että kaikki tutkimus – olipa kyseessä perinteinen taloustiede tai uudet datatieteelliset menetelmät – on altis virheille ja rajoitteille. Tämän vuoksi on keskeistä yhdistää uudet ja vanhat tutkimusmenetelmät ja kehittää entistä tarkempia ja luotettavampia malleja, jotka voivat auttaa meitä ymmärtämään talouden ja rahoitusmarkkinoiden toimivuutta entistä paremmin.

Deutsch
Francais
Nederlands
Svenska
Norsk
Dansk
Suomi
Espanol
Italiano
Portugues
Magyar
Polski
Cestina
Русский