Voiko syntyvyyttä ennustaa?
Published:
Suomessa syntyvyys on pudonnut rajusti vuoden 2010 jälkeen: Syntyneiden lasten määrä on Suomessa laskenut 61 000 lapsesta vuonna 2010 noin 44 900:ään vuonna 2022. Hedelmällisyysluku on jäämässä vuoden 2022 alustavien tietojen mukaan 1,31:een, joka on kaikkien aikojen matalin (Tilastokeskus, 2023). Laskeva trendi on jatkunut lähes koko aikavälin 2010-2023, joten satunnaisvaihtelusta ei ole kysymys (Kuva 1). Tulevaisuus näyttää synkältä, mutta rakkaus voi yllättää.
Vuoden 2018 syntyvyysennuste
Syntyvyyden ennustaminen on vaikeaa, koska syntyvyyden muutokseen vaikuttavia tekijöitä ei kovin hyvin tunneta. Tein marraskuussa 2018 ennusteen (Tanskanen, 2018) syntyvien lasten lukumäärän ja kokonaishedelmällisyysluvun kehityksestä vuosille 2018-2030. Nyt muutaman vuoden jälkeen on hyvä palata aiheeseen ja tarkastaa, osuiko ennuste kohdilleen. Hieman yllättäen ennuste osoittautui kokolailla hyväksi.
Kokonaishedelmällisyysluku
Kuva 1. Vertailu vuoden 2018 faktorimallilla tehdyn kokonaishedelmällisyysluku-ennusteen (vihreä Ennuste) osuvuudesta. Musta käyrä näyttää ennusteeseen käytettävissä olleen datan kokonaishedelmällisyysluvusta. Punaisella on merkitty havainnot kokonaishedelmällisyysluvusta, joka ei ollut saatavilla ennustetta tehtäessä. Sovite-käyrä näyttää faktorimallin sovitteen käytettävissä olleeseen aineistoon.
Ennusteen vuosien 2018-2030 syntyvyydelle ja kokonaishedelmällisyysluvulle perustui yksinkertaiseen bayesilaiseen faktorimalliin (Clyde, 2022). Kuva 1 näyttää faktorimallin ennusteen kokonaishedelmällisyysluvulle yhdessä havaintojen ja vaihtoehtoisten ennusteiden kanssa. Kuvassa 1 musta käyrä näyttää havaitut kokonaishedelmällisyysluvut vuosina 1990-2017 ja arvion vuoden 2018 kokonaishedelmällisyysluvuksi. Turkoosi käyrä näyttää sovitteen vuosille 1990-2017.
Vuonna 2018 tehty ennuste vuosille 2018-2030 on kuvassa merkitty katkoviivalla. Kun ennustetta vertaa vuosien 2018-2022 havaintoihin, huomaa että ennuste on vuosina 2020 ja 2022 kohdallaan, mutta vuosien 2019 ja 2021 ennusteet poikkeavat toteutuneista. Vuoden 2021 koronapiikkiä tuskin olisi voinut edes ennustaa vuonna 2018. Erityisesti vuoden 2022 arvio on hyvä: toteutunut oli 1,31 ja ennuste 1,32. Onnistumisesta huolimatta on pettynyt olo: en olisi halunnut nähdä laskevan trendin jatkuvan.
Vertailun vuoksi kuvaan 1 on lisätty kokonaishedelmällisyysluku Tilastokeskuksen väestöennusteesta 2018 (pilkkuviiva; Tilastokeskus, 2018) ja kokonaishedelmällisyysluvun trendin lineaarinen jatko (viiva-piste). Kiinnostavasti lineaarinen jatko ennustaa vuosien 2018 ja 2019 kokonaishedelmällisyysluvut hyvin, mutta poikkeaa sen jälkeen toteutuneista luvuista. Näistä kolmesta ennusteesta faktorimalli on selvästi paras. Tämä ei tosin välttämättä tarkoita, että näin on enää muutaman vuoden kuluttua, kun havaintoja on kertynyt enemmän.
Syntyneiden määrä
Syntyneiden määrään vaikuttaa kokonaishedelmällisyysluvun lisäksi synnytysikäisten naisten määrä, mistä johtuu syntyvyydessä näkyvä hedelmällisyysluvussa näkyvää pidempään kestänyt laskeva trendi. Syntyneiden määrä kertoo hyvin samankaltaista tarinaa kuin kokonaishedelmällisyysluku. Myös sillä mitattuna faktorimalli tuotti parhaan ennusteen. Osan syntyneiden lukumäärän laskusta selittää synnytysikäisten naisten lukumäärän pieneneminen, mutta ei kaikkea.
Kuva 2. Syntyneiden lukumäärä 2018 verrattuna toteutuneeseen. Vihreä katkoviiva näyttää vuoden 2018 faktorimallilla tehdyn syntyneiden määrä -ennusteen (Ennuste). Musta käyrä näyttää ennusteeseen käytettävissä olleen datan syntyneiden lukumäärästä. Punaisella on merkitty havainnot syntyneiden lukumääristä, jotka eivät olleet saatavilla ennustetta tehtäessä. Sininen Sovite-käyrä näyttää faktorimallin sovitteen käytettävissä olleeseen aineistoon.
Mitkä tekijät selittävät syntyvyyttä?
Selityksiksi syntyvyyden laskulle on esitetty mm. työttömyyttä (Hiilamo, 2017) ja miesten heikkoa kiinnittymistä työsuhteeseen (Miettinen ja Jalovaara, 2015). Muissa maissa syntyvyyden laskun on arvioitu aiheutuvan mm. lapsikuolleisuuden vähenemisestä (Becker ja Barro, 1988), kaupungistumisesta (Martine et al., 2013) ja vanhuuseläkkeiden korkeammasta korvausasteesta (Boldrin et al., 2015). Sen lisäksi että työttömyys alentaisi syntyvyyttä, taloudellisten kriisien on myös havaittu lisänneen syntyvyyttä (Kohler ja Kohler, 2002). Suomessa Korona-kriisin aikana syntyvyys kasvoi vuosina 2020 ja 2021, mutta ei enää 2022. Myös Väestöntutkimuslaitos on analysoinut syitä syntyvyyden laskulle, mutta selkeätä syytä ei ole löytynyt (Rotkirch et al, 2017).
Tässä tarkastellussa faktorimallissa tärkeimmät tekijät ovat kaupungistuminen, avioliittojen määrän lasku ja sosiaalisen median päivittäisen käytön lisääntyminen.
Ennuste faktoreiden kehotyksestä on tehty jatkamalla lineaarisesti ajassa eteenpäin havaittuja trendeja avioituvuudelle, kaupungistumiselle ja aktiivisten somen käyttäjien osuudelle. Muut faktorit pidetään vakioina. Tarkastellaan näitä kolmea tärkeintä faktoria seuraavassa erikseen.
Kaupungistuminen
Kaupungistumista kuvaa sisemmässä kaupungissa, ulommassa kaupungissa ja kehyskaupungissa asuvien osuudet väestöstä. Tilastokeskuksen määritelmät kaupunkialueille ovat:
- Sisempi kaupunkialue on kaupunkien tiivis yhtenäinen tehokkaasti rakennettu alue.
- Ulompi kaupunkialue on sisemmän kaupunkialueen reunasta yhtenäisesti jatkuvan taajamarakenteen reunalle ulottuva kaupunkimaisen tehokkuuden alue.
- Kaupungin kehysalue on kaupunkiin välittömästi kytkeytyvä osa kaupungin ja maaseudun välivyöhykkeestä.
- Maaseutualueet rajataan kaupunkien kehysalueiden ulkopuolelle.
Mallissa erityisesti sisemmässä kaupungissa asuvien osuus väestöstä vaikuttaa syntyvyyteen. Mitä suurempi osa väestöstä asuu tiiviisti kaupunkien keskustoissa, sen alempi syntyvyys. Tämä osuus tulee todenäköisesti kasvamaan Suomessa edelleen, mikä faktorimallin mukaan tulee jatkossakin alentamaan syntyvyyttä. Kuva 3 näyttää sisemmässä kaupungissa asuvien osuuden (Tilastokeskus, 2023b).
Kuva 3. Sisemmässä kaupungissa asuvien osuus väestöstä vuoden 2018 ennusteen (punainen) aineistossa ja vuoden 2023 (vaaleanpunainen) ennusteen aineistossa. Yhtenäiset viivat näyttävät tilastoaineisto, katkoviivat ennusteet.
Kuvassa 3 näkyvä tasoero käyrien välillä johtuu siitä, että uudemmassa aineistossa on hieman eri määritelmä.
Ei ole täysin selvää, miksi kaupungistuminen alentaa syntyvyyttä. Kaupungistumiseen liittyy ainakin anekdotaalisen tiedon mukaan “ikisinkkuus”, johon eivät mahdu pysyvät parisuhteet eivätkä lapset. Kaupungistumisen vaikutus kytkeytyy siten osin parisuhteiden laadun muutokseen. Toinen syy, miksi sisempi kaupunki kytkeytyy syntyvyyteen, on se, että perheasuntojen hinnat ovat sisemmässä kaupungissa korkeita ja saattavat vähentää lasten hankintaa.
Parisuhteet
Lienee melko ilmeistä, että syntyvyyden aleneminen liittyy uusien pysyvien parisuhteiden määrän laskuun (Jalovaara ja Fasang, 2017). Avioituvuus tarkoittaa avioliiton solmineiden määrää suhteessa niihin, jotka voisivat mennä naimisiin. Avioituvuutta käytetään mallissa kuvastamaan uusien pysyvien parisuhteiden määrää, jolle se on proksi. Kuva 4 näyttää avioituvuuden kehitystä (Tilastokeskus, 2023c).
Kuva 4. Avioituvuus vuoden 2018 ennusteen (punainen) aineistossa ja vuoden 2023 ennusteen (vaaleanpunainen) aineistossa. Yhtenäiset viivat näyttävät tilastoaineisto, katkoviivat ennusteet.
Kuviossa 4 avioituvuuden tulevaa kehitystä on arvioitu (katkoviiva) niin että avioituvuus laskuaan. Kulmakertoimen on kuitenkin arvioitu olevan aiempaa loivempi.
Sosiaalinen media
Sosiaalisen median vaikutusta mallissa kuvaa sosiaalisen median aktiivikäyttäjien osuus Tilastokeskuksen Viestintä- ja tietotekniikan käyttö-tutkimuksesta (“Seuraa jotain yhteisöpalvelua yleensä jatkuvasti kirjautuneena tai useasti päivässä”; Tilastokeskus, 2023a). Kuva 5 näyttää vuoden 2018 ennusteessa käytetyn datan ja Tilastokeskuksen uuden datan (2023a). Katkoviiva esittää ennustetta sosiaalisen median käytön kehitykselle.
Kuva 5. Sosiaalisen median päivittäinen käyttö vuoden 2018 ennusteen (punainen) aineistossa ja vuoden 2023 ennusteen (vaaleanpunainen) aineistossa. Yhtenäiset viivat näyttävät tilastoaineisto, katkoviivat ennusteet.
Sosiaalisen median käyttö kasvoi koronavuonna 2020 voimakkaasti. Käyttö näyttää saturoituneen, jolloin sen kasvu ei enää jatkossa vaikuttaa syntyvyyttä alentavasti.
Uusi ennuste
Sovittamalla faktorimalli uuteen dataan ja arvioimalla faktoreiden tulevaa kehitystä voi tehdä uuden ennusteen kokonaishedelmällisyysluvulle ja syntyneiden lukumäärälle. Kuvassa 6 on näin tehty uusi ennuste kokonaishedelmällisyysluvulle.Vuoden 2018 ennusteessa kokonaishedelmällisyysluku aleni 1,1:een vuonna 2030. Päivitetty, vuoden 2023 ennuste menee vielä alemmas: kokonaishedelmällisyysluku on 1,044 vuonna 2030.
Tuloksissa parhaana näkyy kahden faktorin, yhden dummy ja vakiotermin malli, jossa faktoreina ovat 30-34 -vuotiaiden avioituvuus vuoden viiveellä ja sisäkaupungissa asuvien osuus. Dummy-muuttuja kuvaa tässä vuoden 2021 poikkeavaa muutosta. Näillä faktoreilla on mahdollista selittää noin 97 % kokonaishedelmällisyysluvun varianssista datassa.
Kuva 6. Uusi ennuste kokonaishedelmällisyysluvulle vuosina 2023-2030, joka on tehty vuoden 2023 faktorimallilla (vihreä katkoviiva). Musta käyrä näyttää ennusteeseen käytettävissä olevan datan kokonaishedelmällisyysluvusta. Sovite-käyrä näyttää faktorimallin sovitteen käytettävissä olevaan kokonaishedelmällisyysluku-aineiston. Vertailun vuoksi mukana on myös Tilastokeskuksen vuoden 2021 väestöennusteessa käytetyn kokonaishedelmällisyysluvun.
Kuten vuoden 2018 ennusteessa, tässäkään ennusteessa käytetty menetelmä ei mahdollista kausaalista tulkintaa faktoreille. Aineiston perusteella ei siis voi tehdä kausaalisia päätelmiä, ainostaan assosiatiivisuutta koskevia. Tämä tietenkin rajoittaa tulkintamahdollisuuksia.
Syntyneiden määrä
Syntyneiden määrässä näkyy samanlainen kehitys kuin kokonaishedelmällisyysluvussa. Syntyneiden määrään vaikuttaa kokonaishedelmällisyysluvun lisäksi myös synnytysikäisten naisten määrä, mistä johtuu pidempään kestänyt laskeva trendi.
Kuva 7. Uusi ennuste syntyneiden määrälle vuosina 2023-2030. Musta Havainto-käyrä näyttää ennusteeseen käytettävissä olevan datan syntyneiden lukumääristä. Sovite-käyrä näyttää faktorimallin sovitteen käytettävissä olevaan syntyneiden lukumäärään. Vertailun vuoksi mukana on myös Tilastokeskuksen vuoden 2021 väestöennuste syntyneiden lukumääristä.
Vertailu aiempaan ennusteeseen
Uusi, vuoden 2023 kokonaishedelmällisyyslukuennuste on muistuttaa aiempaa, vuoden 2018 ennustetta. Uudessa ennusteessa kokonaishedelmällisyysluku on hieman alempi vuosina 2023-2030 on hieman vuoden 2018 ennusteessa (kuva 8).
Kuva 8. Vuoden 2018 ennuste (pistekatkoviiva) ja vuoden 2023 ennuste (katkoviiva) kokonaishedelmällisyysluvulle. Musta käyrä näyttää ennusteeseen käytettävissä olevan datan syntyneiden lukumääristä (Havainto).
Uuden ennusteen mukaan vuoden 2030 kokonaishedelmällisyysluku on 1,044, kun aiemman ennusteen mukaan se tulee olemaan 1,103. Ennuste on vielä synkempi kuin aiempi huolimatta korona-ajan noususta. Uuden ennusteen mukaan korona-vuosien nousu se jää väliaikaiseksi.
Faktorimalli
Taulukoissa 1-3 esitetään bayesilaisten faktorimallien yksityiskohtia. Ne ovat valitettavasti hieman vaikealukuisia. Taulukoissa HPM viittaa todennäköisimpään malliin, kun taas BMA viittaa agregaattiin 1024:stä todenäköisimmästä faktorimallista.
Taulukko 1. Todennäköisin faktorimalli
Taulukko 2. Aggregaatti faktorimallit
Taulukko 3. Todennäköisyys että faktorin kerroin poikkeaa nollasta (P(B!=0)) kaikissa malleissa. Lisäksi näytetään kuuluvatko faktorit todennäköisimpiin malleihin. Rivi R2 kertoo kuinka suuren osuuden varianssista malli selittää.
Mallit 1-3 selittävät 97 - 97,9 % datan varianssista. Tällä mittarilla ne siis ovat selitysvoimaisia. Malleissa on 2-5 tekijää, jos vuoden 2021 poikkeavaa hedelmällisyyttä kuvaava dummy-muuttuja huomioidaan. Uudessa ennusteessa on käytetty dummy-muuttujaa kuvaamaan vuoden 2021 poikkeuksellista kehitystä.
Johtopäätökset
Vuonna 2018 tehty ennuste osui kohdalleen yllättävän hyvin, erityisesti vuosina 2020 ja 2022. Koronan vaikutusta syntyvyyteen 2021 tuskin olisi ollut mahdollista ennustaa vuonna 2018. Ennusteessa kokonaishedelmällisyyslukuun vaikuttavat erityisesti kaupungistuminen, avioituvuus ja päivittäinen some käyttö, joista erityisesti kaupungistuminen ja avioituminen vaikuttavat jatkossa.
Pysyvien parisuhteiden määrään tuskin voi vaikuttaa etuuksilla, joten on epätodennäköistä, että etuusmuutoksilla voi kovin paljon vaikuttaa syntyvyyteen. Kaupungistumista taas ei välttämättä ole mahdollista tai edes syytä hidastaa. On epäselvää, miksi kaupungistuminen alentaa syntyvyyttä. Mahdollisia selityksiä ovat esimerkiksi kaupunkilainen ikisinkkuus ja lapsiperheille pienet asunnot. Tämän blogin jatkona .
Tulevaisuus näyttää entistä vähälapsiselta, mutta rakkaus - ja sen seurauksena lapsiluku - saattaa yllättää.
Viittaukset
Becker, G.S., Barro, R.J., Reformulation of the economic theory of fertility, The quarterly journal of economics, 1988
Boldrin, M., De Nardi, M., Jones, L.E. Fertility and social security, Journal of Demographic Economics 81, 261-299, https://doi.org/10.1017/dem.2014.14, 2015
Clyde, M., BAS: Bayesian Variable Selection and Model Averaging using Bayesian Adaptive Sampling, R package version 1.6.4, 2022
Doepke, M., Child mortality and fertility decline: Does the Barro-Becker model fit the facts?
Hiilamo, H. T., Fertility Response to Economic Recessions in Finland 1991–2015 Finnish Yearbook of Population Research 52, 15-28 . DOI: 10.23979/fypr.65254, 2017
Jalovaara, M., Fasang, A.E., From never partnered to serial cohabitors: Union trajectories to childlessness. Demographic Research 36, 1703-1720, 2017
Kohler, H.-P., Kohler, I., Fertility Decline in Russia in the Early and Mid 1990s: The Role of Economic Uncertainty and Labour Market Crises, European Journal of Population 18, 233-262, https://doi.org/10.1023/A:1019701812709, 2002.
Martine, G., Alves, J.E., Cavenaghi, S., Urbanization and fertility decline: Cashing in on structural change, IIED Working paper, 2013
Miettinen, A., Miksi syntyvyys laskee? Suomalaisten lastensaantiin liittyviä toiveita ja odotuksia. Perhebarometri 2015. Väestöliitto, 2015.
Miettinen, A., Jalovaara, M. Stable employment – more babies? Life stage and educational differences in the effects of labour market attachment on first birth among Finnish men and women. Working Papers on Social and Economic Issues 15/2016, Turku Center for Welfare Research, 2016
Rotkirch, A., Tammisalo, K., Miettinen, A., Berg, V. Miksi vanhemmuutta lykätään? Perhebarometri, 2017.
Tanskanen, A.J. Sosiaalisen median aktiivikäyttö ja syntyvyys. https://ajtanskanen.github.io/posts/2018/11/Sosiaalisen-median-aktiivik%C3%A4ytt%C3%B6-ja-syntyvyys/, 2018
Tikanmäki, H., Huomisen aikuiset syntyvät nyt, Eläketurvakeskuksen blogi https://www.etk.fi/blogit/huomisen-aikuiset-syntyvat-nyt/, 2017
Tilastokeskus (2023) Väestön ennakkotilasto.
Tilastokeskus (2023a) Suomen virallinen tilasto (SVT): Väestön tieto- ja viestintätekniikan käyttö / 13ud – Väestön tieto- ja viestintätekniikan käyttö sukupuolen ja ikäluokan mukaan, 2013-2022 sarja “Käyttänyt yhteisöpalvelua päivittäin tai lähes päivittäin, %” ISSN=1797-6413. Helsinki: Tilastokeskus [Viitattu: 7.3.2023]. Saantitapa: https://stat.fi/tilasto/sutivi
Tilastokeskus (2023b) Suomen virallinen tilasto (SVT): Väestörakenne [verkkojulkaisu]. Taulukko 11ra – Tunnuslukuja väestöstä alueittain, 1990-2021. ISSN=1797-6413. Helsinki: Tilastokeskus [Viitattu: 7.3.2023]. Saantitapa: https://stat.fi/tilasto/vaerak
Tilastokeskus (2023c) Avioituvuus promillea, Suomen virallinen tilasto (SVT): Siviilisäädyn muutokset [verkkojulkaisu]. ISSN=1797-6413. Helsinki: Tilastokeskus [Viitattu: 7.3.2023]. Saantitapa: https://stat.fi/tilasto/ssaaty