Montako faktoria ajaa tuottoja Helsingin pörssissä?

13 minute read

Published:

Osaketuottoja ajavien faktorien lukumäärää voi arvioida satunnaismatriisien teorian avulla. Tämän blogin tulosten mukaan Nasdaq Helsinki:in listattujen osakkeiden tuottoja ajaa vain viisi lineaarista faktoria. Näistä tärkein on markkinariski. Seuraavina faktoreina ovat pienten yhtiöiden preemio ja arvoyhtiöpreemio.

1 Helsingin Pörssissä listatut osakkeet

Tällä hetkellä Nasdaq Helsinki:in on listattu 134 osaketta ja First Northissa 48. Tarkastellaan seuraavassa Helsingin pörssissä (Nasdaq OMXH) listattuja 97 osaketta, joista löytyy yhtenäinen aikasarja vuosille 2015-2025. Niistä on saatavissa päivädataa Yahoon palvelun kautta. Osakkeiden päivätuotot lasketaan yksinkertaisuuden vuoksi suoraan kursseista ilman osinkojen huomiointia. Kurssikehitys muutetaan logaritmisiksi tuotoiksi.

Yahoo Finance löytää päivänoteeraukset 97:ltä Helsingin pörssin osakkeelta periodilta, joka alkaa 2015-08-15 ja loppuu 2025-08-15. Tarkastellut tikkerit ovat ACG1V , AFAGR, AKTIA, ALBAV, ALBBV, ALMA, APETIT, ASPO, ATRAV, BIOBV, BITTI, BOREO, CAPMAN, CTH1V, CTY1S, DIGIA, DIGIGR, DOV1V, ELEAV, ELISA, ENENTO, EQV1V, ETTE, EXL1V, FORTUM, FSKRS, GLA1V, HONBS, HUH1V, ICP1V, ILKKA2, INVEST, KCR, KELAS, KEMIRA, KESKOA, KESKOB, KNEBV, LAT1V, LINDEX, MARAS, MEKKO, METSA, METSB, METSO, NESTE, NLG1V, NOHO, NOKIA, OLVAS, ORNAV, ORNBV, OUT1V, OVARO, PIHLIS, PNA1V, PON1V, QPR1V, RAIVV, RAP1V, RAUTE, REBL, REG1V, REKA, ROBIT, SAGCV, SAMPO, SANOMA, SCANFL, SIILI, SOLTEQ, SOSI1, SRV1V, SSH1V, STEAV, STERV, SUY1V, TAALA, TELIA1, TEM1V, TIETO, TLT1V, TNOM, TRH1V, TULAV, TYRES, UNITED, UPM, VAIAS, VALMT, VERK, VIK1V, WETTERI, WITH, WRT1V, WUF1V, YIT.

2 Faktorit pääkomponenttimenetelmällä

Pääkomponenttimenetelmällä (PCA) voi etsiä tuottoja selittäviä tekijöitä. Korrelaatio kuvaa tuottojen keskinäistä lineaarista riippuvuutta. Osakkeiden tuottojen välisten korrelaatioiden avulla voi etsiä pääkomponentit, jotka kuvaava osaketuottojen faktoreita. Kuvio 1 näyttää, miten hyvin pääkomponenttien avulla voi kuvata tuottoaikasarjaa.

Menetelmä toimii korrelaatiomatriisin ominaisarvojen avulla. Suurin ominaisarvo kuvaa markkinan liikettä ja se on tyypillisesti selvästi muita suurempi (Kuvio 2).

nettomaahanmuutto
Kuvio 1. Tuottojen replikointi neljällä faktorilla.

PCA-menetelmässä oletetaan, että tuotot on normitettu niin, että keskituotto on nolla ja keskihajonta 1. Tämä hävittää informaatiota, mutta silti menetelmä toimii melko hyvin. Tuottomatriisin $X$ korrelaatiomatriisi on $X^TX$ ja koko PCA-hajotelma osaketuotoille on $H = XW,$ missä $W$ koostuu korrelaatiomatriisin ominaisvektoreista. Tämä projisoi alkuperäiset tuottoaikasarjat faktoreille. Alkuperäiselle datalle saa siivotun esityksen $XW_kW_k^T$, missä $W_k$ sisältää vain $k$ ominaisvektoria. Tämä esitys sisältää vain faktorien kuvaaman osan datasta.

Ominaisarvot
Kuvio 2. Analysoitujen osakkeiden tuottojen korrelaatiomatriisin ominaisarvojen jakauma. Suurin ominaisarvo kuvaa markkinaliikettä.

Ominaisvektorit ovat kuitenkin kohtisuorassa toisiaan kohti. Ominaisvektorit on normitettu siten, että $\sum_mW_{k,m}^2=1$. Tämä ei ole suoraan salkkupainojen normitus, joka olisi $\sum_mW_{k,m}=1$.

3 Satunnaismatriisit

Satunnaismatriisit ovat satunnaislukujen yleistys. Todennäköisyysjakautuneen satunnaisluvun sijaan tarkastellaan matriiseita, joiden alkiot ovat satunnaislukuja ja lisäksi alkioiden väillä voi olla keskinäisiä riippuvuuksia. Voidaan ajatella, että tuottojen korrelaatiomatriisi on ortogonaalisten matriisien ensemblen jäsen. Todennäköisyyslaskennalla voidaan arvioida satunnaismatriisien ominaisuuksia. Esimerkki satunnaismatriisien joukosta on kaikkien korrelaatiomatriisien joukko varustettuna todennäköisyysmitalla.

Satunnaismatriisien teoriasta tiedetään, että korrelaatiomatriisien ominaisarvot noudattavat todennäköisyysjakaumaa. Pastur-Marchenko-teoreema kertoo, että satunnaisen korrelaatiomatriisin ominaisarvot jakautuvat \(p(x) = \frac{1}{2\pi\sigma^2}\frac{\sqrt{(\lambda_+-x)(x-\lambda_-)}}{\lambda x},\) missä $\lambda=m/n$, $x\in(\lambda_-,\lambda_+)$ ja $\lambda_\pm=\sigma^2(1+\sqrt{\lambda})$. Kaava pätee suurten matriisien $R^{m\times n}$ rajalla $n,m\to\infty$.

Laloux et al. sovelsiv Pastur-Marchenko -teoreemaa S&P 500:n korrelaationmatriisiin. Heidät havaintojensa mukaan noin 94 prosenttia ominaisarvoista jakautui Pastur-Marchenkon jakauman mukaan ja vain muutama ominaisarvo poikkeaa jakaumasta. Bouchaud ja Potters jatkoivat Laloux et al. tutkimusta eteenpäin.

Mitä Pastur-Marchenko -teoreema sitten tarkoittaa? Sen voi tulkita tarkoittavan, että suurin osa korrelaatiomatriisista on kohinaa ja että vain muutama lineaarinen faktori ajaa osaketuottoja. Tämä ei tarkoita, ettei tuottoja voisi ajaa jokin ei-lineaarinen tekijä, mutta PCA ei sellaista löytäisi.

5 Montako faktoria ajaa Helsingin osakkeiden tuottoja?

Pastur-Marchenko-teoreemassa ainoat parametrit ovat keskihajonta $s$ ja osakkeiden lukumäärän $N$ ja havaintojen lukumäärän $M$ suhde N/M. Pastur-Marchenko kuitenkin olettaa, että havainnot ovat toisistaan riippumattomia ajallisesti. Näinhän ei ole. Siksi efektiivinen havaintojen lukumäärä $M^\dagger$ on pienempi kuin havaintojen todellinen lukumäärä $M$. Tässä tutkimuksessa suhteena käytettiin $M^\dagger = 0,4M$.

Suurin ominaisarvo vastaa suurimman varianssi portfoliota, jossa painot vastaavat ominaisvektorin alkioita. Näin tulkittuna OMXH:ssa on viisi merkitsevää toisistaan riippumatonta faktoria, muut varianssin lähteet ovat kohinaa.

Ominaisarvot
Kuvio 3. Pastur-Marchenko -jakauma verrattuna osaketuottojen korrelaatiomatriisin ominaisarvojen tiheyteen.

Ensimmäisillä 5:llä faktorilla selittyy osakekurssien heilunnasta 24 prosenttia. Tämä on melko vähän. Tästä huolimatta muutama faktori riittää tuottamaan alkuperäistä aikasarjaa vastaavan tuottoaikasarjan (Kuvio 1). Satunnaismatriisien teorian mukaan vain muutama ominaisarvo on merkitsevä, loppuja ei voi erottaa kohinasta.

Lettau ja Pelger (2018) päätyivät siihen, että eri kriteereillä tarkasteltuna vain ensimmäiset viisi faktoria ovat merkitseviä tuottojen PCA-analyysissä. Heidän analyysinsä kohdistuu kuitenkin täysin eri aineistoon kuin tässä: Lettau ja Pelgar tarkastelevat S&P500-osaketuottoja vuosilta 1972-2014.

Number of factorsExplanation of variance (%)
116.7
219.2
321.2
422.8
524.3
625.7
727.0
828.3
929.6
1030,8

Taulukko 1. Varianssin selitysosuus faktorien lukumäärän funktiona.

FaktoriKeskiarvoKeskihajonta
10,095483006177023030,03452931916377785
2-0,0234287227951412230,09879460156660337
3-0,00064031107567485570,10153259748593965
4-0,0084931305535088570,10117877783367679
50,0063947602851266340,10133304195281624

Taulukko 2. Faktorien tunnusluvut.

6 Mitä faktori kertovat?

6.1 Faktori 1 eli markkina

Faktoreista ensimmäinen on markkinariski. Ominaisvektorin arvot ovat jotakuinkin yhtä suuri kaikille osakkeille, joten faktori sijoittaa oleellisesti kaikkii kohteisiin yhtä paljon. Keskiarvo on noin 0,095 (Taulukko 2). Painojen keskihajonta on ensimmäisessä faktorissa pienintä tarkastelluista faktoreista.

 ACG1VAFAGRAKTIAALBAVALBBVALMAAPETITASPOATRAVBIOBVBITTIBOREOCAPMANCTH1VCTY1SDIGIADIGIGRDOV1VELEAVELISAENENTOEQV1VETTEEXL1VFORTUMFSKRSGLA1VHONBSHUH1VICP1VILKKA2INVESTKCRKELASKEMIRAKESKOAKESKOBKNEBVLAT1VLINDEXMARASMEKKOMETSAMETSBMETSONESTENLG1VNOHONOKIAOLVASORNAVORNBVOUT1VOVAROPIHLISPNA1VPON1VQPR1VRAIVVRAP1VRAUTEREBLREG1VREKAROBITSAGCVSAMPOSANOMASCANFLSIILISOLTEQSOSI1SRV1VSSH1VSTEAVSTERVSUY1VTAALATELIA1TEM1VTIETOTLT1VTNOMTRH1VTULAVTYRESUNITEDUPMVAIASVALMTVERKVIK1VWETTERIWITHWRT1VWUF1VYIT
Arvot0.007707330.007034440.01521720.005491440.01116280.009617130.007715330.01427930.01162930.007416980.009725370.007896150.01603020.005514920.01502040.01043850.004187270.008496870.005157820.009414680.006698230.0120780.008489140.006580380.01508380.01356910.01183820.008389330.01539810.0103450.009097280.006438380.01697680.007195280.01567770.01319480.01258920.01254520.01366930.009862450.007688730.01289250.0116730.01508480.01568890.01247490.005270180.01084680.01362490.01169520.009221220.0092620.01562730.008655450.007890630.007426810.01266910.004660620.01203460.008815660.009657020.002259750.01122260.006296550.007473330.006091060.0181510.012250.01089790.008699880.007599310.006911650.009995540.007059680.01295480.01828490.008124080.01234660.00731150.008123910.01644420.00896360.01004980.005158050.007373390.01505140.005319770.01742390.01195890.01639270.009923570.003594140.004428240.01097620.0163450.005906380.0149074

Markkinan painossa teknologia (5020) korostuu, koska sen sektorin toimijoita on eniten.

Faktorien tulkinta sektorien mukaan
Kuvio. Faktorin yksi painojen etumerkit sektoreittain. Siniset positiivisia, oranssit negatiivia.

Faktorien tulkinta sektorien mukaan
Kuvio. Faktorin yksi skaalatut salkkupainot verrattuna markkinarvoihin mukaisiin painoihin ja vakioallokaatioon.

6.2 Faktori 2 eli shortattu pienten yhtiöiden preemio

Toinen faktori onkin sitten epäselvempi. Siinä painojen etumerki vaihtelee, joten kyse on Long-Short -strategiasta. Siinä keskipaino on selvästi negatiivinen, noin -0,023 (Taulukko 2).

Toisessa faktorissa paino on negatiivinen suurammissa osassa osakkeista.

 ACG1VAFAGRAKTIAALBAVALBBVALMAAPETITASPOATRAVBIOBVBITTIBOREOCAPMANCTH1VCTY1SDIGIADIGIGRDOV1VELEAVELISAENENTOEQV1VETTEEXL1VFORTUMFSKRSGLA1VHONBSHUH1VICP1VILKKA2INVESTKCRKELASKEMIRAKESKOAKESKOBKNEBVLAT1VLINDEXMARASMEKKOMETSAMETSBMETSONESTENLG1VNOHONOKIAOLVASORNAVORNBVOUT1VOVAROPIHLISPNA1VPON1VQPR1VRAIVVRAP1VRAUTEREBLREG1VREKAROBITSAGCVSAMPOSANOMASCANFLSIILISOLTEQSOSI1SRV1VSSH1VSTEAVSTERVSUY1VTAALATELIA1TEM1VTIETOTLT1VTNOMTRH1VTULAVTYRESUNITEDUPMVAIASVALMTVERKVIK1VWETTERIWITHWRT1VWUF1VYIT
Arvot-0,0987624-0,0502853-0,0481837-0,153289-0,14999-0,0562425-0,117011-0,100118-0,0610231-0,0953434-0,0835772-0,121439-0,0839265-0,07404670,029333-0,0676031-0,0855886-0,109142-0,1000420,0631662-0,0382328-0,116545-0,1335-0,06701710,0361017-0,023166-0,0974569-0,1114070,175734-0,0708022-0,0858016-0,09530580,129731-0,06390250,139417-0,000264770,02539770,1650550,000419409-0,0221606-0,0810495-0,07413860,1249510,2610010,1306150,0800201-0,0883547-0,114680,0248014-0,06213010,02196510,02826650,127533-0,0621109-0,0765798-0,07921-0,0634239-0,03938-0,0166029-0,125951-0,101233-0,0473239-0,0311402-0,0714979-0,112449-0,1254490,04100680,0319837-0,0907293-0,0410517-0,0994497-0,0386931-0,0662552-0,08397760,2373430,284039-0,106576-0,146940,02727-0,07458790,1053-0,0392802-0,0470736-0,0833072-0,106350,0660218-0,04298610,276294-0,02343910,156107-0,0498271-0,0613148-0,02579130,02312580,133236-0,1170750,0807628

Sektoreista kuitenkin yleishyödylliset palvelut (6510), pankit (4010), kemikaalit (5520) ovat ainoastaan positiivisia. Teknologia (1010) on valtaosin negatiivinen, samoin teollisuushyödykkeet ja -palvelut (5020). Kulutustuotteet ja -palvelu (4020) on ainoastaan negatiivinen.

Faktorien tulkinta sektorien mukaan
Kuvio. Faktorin kaksi painojen etumerkit sektoreittain. Siniset positiivisia, oranssit negatiivia.

Faktori näyttää painottavan suuria, arvokkaita yhtiöitä. Rajana tässä on markkina-arvo yli yksi miljardi euroa. Faktori lienee lähellää Fama-Frenchin SMB-faktoria, joka kuvaa pienten yhtiöiden ylituottoa verrattuna suuriin yhtiöihin. Tässä tosin eri etumerkki kertoo, että SMB-faktoria shortataan.

Faktorien tulkinta markkina-arvon mukaan
Kuvio. Faktorin kaksi painot jaoteltuna yrityksen markkina-arvon mukaan (yli vai alle 1 mrd euroa). Siniset positiivisia, oranssit negatiivisia.

6.3 Faktori 3 eli arvoyhtiöpreemio

Kolmas faktori kuvaa Long-Short -strategiaa, jossa osaan kohteista sijoitetaan (long), osaa myydään (short). Keskimääräinen paino on lähes nolla (Taulukko 2). Vastaavan kolmannen PCA-faktorin löysivät myös Lettau ja Pelger (2018).

Entä mihin kohteisiin kolmas faktori sijoittaa? Faktori kolme painottaa vahvasti arvo-osakkeita. Se ei täysin selitä faktoria, mutta kertoo painotuksen.

 ACG1VAFAGRAKTIAALBAVALBBVALMAAPETITASPOATRAVBIOBVBITTIBOREOCAPMANCTH1VCTY1SDIGIADIGIGRDOV1VELEAVELISAENENTOEQV1VETTEEXL1VFORTUMFSKRSGLA1VHONBSHUH1VICP1VILKKA2INVESTKCRKELASKEMIRAKESKOAKESKOBKNEBVLAT1VLINDEXMARASMEKKOMETSAMETSBMETSONESTENLG1VNOHONOKIAOLVASORNAVORNBVOUT1VOVAROPIHLISPNA1VPON1VQPR1VRAIVVRAP1VRAUTEREBLREG1VREKAROBITSAGCVSAMPOSANOMASCANFLSIILISOLTEQSOSI1SRV1VSSH1VSTEAVSTERVSUY1VTAALATELIA1TEM1VTIETOTLT1VTNOMTRH1VTULAVTYRESUNITEDUPMVAIASVALMTVERKVIK1VWETTERIWITHWRT1VWUF1VYIT
Arvot0,0383032-0,008866640,0148879-0,002197410,005267660,0339320,04621580,06395680,002912290,03218590,003657830,0464083-0,0270050,01309930,001591990,04698960,03146030,006329410,0142583-0,2390120,022324-0,02401610,004476370,02015270,00401227-0,03118550,05940660,0538222-0,01537890,0382594-0,05293910,006400410,0617870,01221260,0229221-0,297551-0,292541-0,129453-0,002324050,0136942-0,0127959-0,003860630,08177460,1294960,0793578-0,0002590220,0474760,05876090,00216131-0,0584443-0,509304-0,5117510,09876710,0518446-0,005487080,02959890,01794390,0214282-0,04653780,01390970,08430170,0577647-0,1005280,003349220,05915760,0744520,00690699-0,0792870,0257852-0,0004292840,0003003660,0412370,0463542-0,009280660,1323620,145164-0,05587640,049348-0,0819190,0155175-0,06218080,110073-0,005932150,04540560,04162980,04494740,03161880,108314-0,06332710,02685220,03502870,01423980,0449774-0,04213150,03932370,03499040,0368445

Faktorien tulkinta sektorien mukaan
Kuvio. Faktorin kolme painojen etumerkit sektoreittain. Siniset positiivisia, oranssit negatiivia.

Arvo/Kasvu -erottelu
Kuvio. Faktorin kolme painojen etumerkit arvo/kasvu-erottelulla. Siniset positiivisia, oranssit negatiivia.

6.4 Faktori 4

Neljäs faktori onkin sitten epäselvempi.

 ACG1VAFAGRAKTIAALBAVALBBVALMAAPETITASPOATRAVBIOBVBITTIBOREOCAPMANCTH1VCTY1SDIGIADIGIGRDOV1VELEAVELISAENENTOEQV1VETTEEXL1VFORTUMFSKRSGLA1VHONBSHUH1VICP1VILKKA2INVESTKCRKELASKEMIRAKESKOAKESKOBKNEBVLAT1VLINDEXMARASMEKKOMETSAMETSBMETSONESTENLG1VNOHONOKIAOLVASORNAVORNBVOUT1VOVAROPIHLISPNA1VPON1VQPR1VRAIVVRAP1VRAUTEREBLREG1VREKAROBITSAGCVSAMPOSANOMASCANFLSIILISOLTEQSOSI1SRV1VSSH1VSTEAVSTERVSUY1VTAALATELIA1TEM1VTIETOTLT1VTNOMTRH1VTULAVTYRESUNITEDUPMVAIASVALMTVERKVIK1VWETTERIWITHWRT1VWUF1VYIT
Arvot-0,0998106-0,04462520,06154020,01845840,00428632-0,0843223-0,01340140,00872459-0,0252623-0,0467516-0,09402230,0694705-0,00431648-0,03919210,0954103-0,0944217-0,03392170,01649860,003752070,0202990,04143360,0107286-0,0552413-0,004584130,09861910,0643935-0,0463447-0,0428970,01924320,0312305-0,0433251-0,0006755630,0820787-0,05447710,008974120,4275290,4389390,1083990,03392710,0520375-0,03011370,0690498-0,119016-0,098344-0,04977510,0758030,0194581-0,05387170,008600670,127554-0,387769-0,388383-0,0357605-0,0496947-0,0321234-0,0508550,005151580,02411190,0380187-0,00488167-0,00252104-0,05695790,0344185-0,0574819-0,0476811-0,09181050,05036660,0543022-0,0167812-0,1024020,03367350,00690586-0,0575701-0,0670082-0,147661-0,109402-0,04241070,0131749-0,02830110,02628060,0594698-0,02079240,0560062-0,0480243-0,01784030,1062140,0276758-0,1189150,002553510,0206749-0,0389004-0,0585835-0,105833-0,09381430,03409860,01896020,00654115

Faktorien tulkinta sektorien mukaan
Kuvio. Faktorin neljä painojen etumerkit sektoreittain. Siniset positiivisia, oranssit negatiivia.

6.5 Faktori 5

Viides faktori onkin sitten epäselvempi. Sen etumerkit jakautuvat tasaisesti sektorien sisällä, joten se tuskin liittyy juurikaan sektorijakoon. Keskiarvopaino on hieman positiivinen, 0,0063. Keskihajonta on viidestä faktorista toiseksi suurin, 0,1013. Faktorin merkitys on vähäisempi kuin neljän muun faktorin, joten sitä emme tutki enempää.

 ACG1VAFAGRAKTIAALBAVALBBVALMAAPETITASPOATRAVBIOBVBITTIBOREOCAPMANCTH1VCTY1SDIGIADIGIGRDOV1VELEAVELISAENENTOEQV1VETTEEXL1VFORTUMFSKRSGLA1VHONBSHUH1VICP1VILKKA2INVESTKCRKELASKEMIRAKESKOAKESKOBKNEBVLAT1VLINDEXMARASMEKKOMETSAMETSBMETSONESTENLG1VNOHONOKIAOLVASORNAVORNBVOUT1VOVAROPIHLISPNA1VPON1VQPR1VRAIVVRAP1VRAUTEREBLREG1VREKAROBITSAGCVSAMPOSANOMASCANFLSIILISOLTEQSOSI1SRV1VSSH1VSTEAVSTERVSUY1VTAALATELIA1TEM1VTIETOTLT1VTNOMTRH1VTULAVTYRESUNITEDUPMVAIASVALMTVERKVIK1VWETTERIWITHWRT1VWUF1VYIT
Arvot0,0790022-0,0882495-0,05046080,0237683-0,009077470,01236530,01090410,03986830,04182640,00591652-0,07156460,156077-0,0845007-0,0447667-0,0484104-0,01923130,02930590,03564130,1195070,05173960,01828920,03827120,03472050,0663156-0,0904822-0,0690511-0,02854410,0370308-0,038613-0,0571747-0,02888940,078189-0,185093-0,00877028-0,0517540,2678020,275661-0,0841113-0,013830,0032576-0,002720460,003350090,3494030,307823-0,118197-0,1857270,111320,00314863-0,08321480,05777370,00732941-0,0015242-0,09454850,109128-0,0383690,0780073-0,0202643-0,07921580,04151230,08812850,0308910,0625239-0,1395820,0013066-0,00592150,0242666-0,0449767-0,0236362-0,07231520,0460974-0,074702-0,0928199-0,005744340,015780,2600230,1956250,06101820,0516594-0,0639264-0,052284-0,0566690,0257612-0,006033580,05647210,149313-0,0972607-0,02281450,149819-0,0610897-0,146814-0,03201560,01506210,00221875-0,0844506-0,2737580,06986-0,126617

Faktorien tulkinta sektorien mukaan
Kuvio 4. Faktorin viisi painojen etumerkit sektoreittain. Siniset positiivisia, oranssit negatiivia.

7 Yhteenveto

Muutama faktori on vastuussa suuresta osasta osakeindeksin tuottoa. Tämän tutkimuksen mukaan Helsingin Pörssin NASDAQ Helsinki -indeksin tuottoja ajaa vain viisi faktoria. Tärkein faktori on markkinariski. Seuraavaksi tärkein faktori on kokofaktori, jonka mukaan vuosina 2015-2025 pienet yhtiöt ovat tuottaneet huonommin kuin suuret. Kolmas faktori on arvoyhtiöiden tuotto. Neljäs ja viides faktori jäävät tässä blogissa ilman selkeää selitystä.