Sosiaalisen median aktiivikäyttö ja syntyvyys

10 minute read

Published:

Sosiaalisen median aktiivikäyttö ja syntyvyys

Johdanto

Syntyneiden lasten määrä on Suomessa laskenut 61 000 lapsesta vuonna 2010 noin 50 300:ään vuonna 2017. Alkuvuoden 2018 luvuilla laskemalla vaikuttaa siltä että tämän vuoden syntyneden määrä jää ehkä 48 000:een ja hedelmällisyysluku 1,43:een alle vuoden 1973 pohjien. Laskeva trendi on jatkunut koko aikavälin 2010-2018, joten satunnaisvaihtelusta tuskin on kysymys. Osan syntyneiden lukumäärän laskusta selittää synnytysikäisten naisten lukumäärän pieneneminen, mutta ei läheskään kaikkea. Muiksi selityksiksi on tarjottu mm. työttömyyttä (Hiilamo, 2017) ja miesten heikkoa työsuhteeseen kiinnittymistä (Miettinen ja Jalovaara, 2015). Muissa maissa syntyvyyden laskun on arvioitu aiheutuvan mm. lapsikuolleisuuden vähenemisestä (Becker ja Barro, 1988), kaupungistumisesta (Martine et al., 2013) ja vanhuuseläkkeiden korkeammasta korvausasteesta (Boldrin et al., 2015). Sen lisäksi että työttömyys alentaisi syntyvyyttä, taloudellisten kriisien on myös havaittu lisänneen syntyvyyttä (Kohler ja Kohler, 2002).

Syntyneiden määrällä on viiveellä vaikutusta työikäisen väestön määrään, ja sitä kautta syntyvyyden laskulla on vaikutuksia mm. sosiaaliturvan rahoituksen kestävyyteen. Eläketurvakeskuksen laskelmien mukaan syntyvyyden lasku aiheuttaa työeläkemaksussa pitkällä aikavälillä useiden prosenttiyksiköiden nousupaineen (Tikanmäki, 2017). Myös Väestöntutkimuslaitos on analysoinut syitä syntyvyyden laskulle, mutta selkeätä syytä ei ole löytynyt (Rotkirch et al, 2017)

Tässä tutkimuksessa jatketaan aiemman harjoituksen mallilla ja kokeillaan miten hyvin ennuste toimii. Tämän lisäksi tutkimuksessa pyritään tarkastelemaan, onko sosiaalisen median aktiivikäytön lisääntymisellä kytkentää syntyvyyden laskuun.

Aineisto

Tutkimuksessa käytetty aikasarja-aineisto on peräisin tilastokeskuksen StatFin-tietokannasta ja Human Mortality Databasesta. Aineisto koostuu vuosien 1989-2017 datasta. Väestörakenteesta (Tilastokeskus) mukana on syntyneidet lukumäärät, kokonaishedelmällisyysluvut, synnyttäjien keski-ikä ja naisten lukumäärät 5-vuotisikäryhmittäin. Mukana ovat myös avioliittojen määrät 10-vuotisikäluokittain suhteutettuna ikäluokkien suuruuteen (Tilastokeskus).

Työllisyyttä (Tilastokeskus) kuvataan 10-vuotisikäluokittaisilla työllisyysasteilla sukupuolittain, 10-vuotisikäluokkakohtaisista työttömyysasteista sukupuolittain (suhteutettu ikäluokan kokoon, ), ja työsuhteiden tyyppitiedoilla (jatkuva/määräaikainen; kokoaikainen/osa-aikainen) vuosilta 1997-2017. Kaupungistumista kuvaa sisemmässä kaupungissa, ulommassa kaupungissa ja kehyskaupungissa asuvien osuudet väestöstä (Tilastokeskus)

Verrattuna aiempiin harjoitelmiin, mukaan on otettu myös sosiaalisen median aktiivikäyttäjien osuus Tilastokeskuksen Viestintä- ja tietotekniikan käyttö-tutkimuksesta (“Seuraa jotain yhteisöpalvelua yleensä jatkuvasti kirjautuneena tai useasti päivässä”).

Kaikkiaan lähtöaineistossa on 53 aikasarjaa, joissa on 29 havaintoa vuosilta 1989-2017, tosin osasta aikasarjoja vuosien 1989 ja/tai 2017 luvut puuttuvat. Kaikkia aineistossa olevia muuttujia ei ole tutkimuksessa käytetty, vaan keskitytty kokeiluissa lupaavimpiin 9:ään muuttujiin.

Aineiston perusteella ei voi tehdä kausaalisia päätelmiä, ainostaan assosiatiivisuutta koskevia. Tämä tietenkin rajoittaa tulkintamahdollisuuksia.

Tarkoituksena on avoimen, toistettavan tutkimuksen hengessä näyttää täsmällisesti mitä on tehty. Tästä syystä alkuperäinen aineisto (myös tämä työkirja koodeineen, Rmd-muotoisena; data Rdata-muodossa) on kokonaisuudessaan saatavissa osoitteesta https://github.com/ajtanskanen/Syntyvyyden-tekij-t

Hedelmällisyysluvun muutoksia selittävä malli

Synnytysikäisten naisten lukumäärää pystytään lyhyellä aikavälillä ennustamaan melko hyvin, eikä siihen vaikuta juurikaan muut tekijät, kuten vaikkapa työllisyys tai taloudellinen tilanne. Jos sellaiset tekijät vaikuttavat syntyvyyteen, vaikutuksen pitäisi näkyä hedelmällisyysluvussa.

Yritetään sitten selittää hedelmällisyysluvun muutoksia käyttäen faktoreina kokoelmaa erilaisia tekijöitä ikäluokka- ja sukupuolikohtaisia avioituvuuksia ja pienituloisuusosuusasteita (60% mediaanitulosta); synnyttäjien keski-ikää, alle 1-vuotiaiden kuolleisuutta, sekä sisäkaupungissa, ulkokaupungissa ja kehyskaupungissa asuvien osuutta väestöstä. Lisäksi mukana on 25-34- ja 35-44 -vuotiaiden somen aktiivikäyttäjien osuus väestöstä.

syntyvyys_reg = bas.lm(hedelmallisyysluku ~lapsikuolleisuus + synnyttajien_keskiika + avioituvuus_naiset_25_29_lag1 + avioituvuus_naiset_30_34_lag1  + kehyskaupunki + sisempikaupunki + ulompikaupunki + some_25_34_lag1 + some_35_44_lag1, data = syntyvyysaineisto_redusoitu,
prior = "ZS-null", modelprior = uniform())

Tuloksissa parhaana näkyy neljän faktorin ja vakiotermin malli, jossa faktoreina ovat 30-34 -vuotiaiden avioituvuus, sisäkaupungissa ja kehyskaupungissa asuvien osuus, sekä 35-44 -vuotiaiden sosiaalisen median aktiivikäyttäjien osuus. Näillä faktoreilla on mahdollista selittää noin 96 % hedelmällisyysluvun varianssista datassa.

##                               P(B != 0 | Y) model 1 model 2 model 3
## Intercept                             1.000   1.000   1.000   1.000
## lapsikuolleisuus                      0.132   0.000   0.000   0.000
## synnyttajien_keskiika                 0.221   0.000   0.000   0.000
## avioituvuus_naiset_25_29_lag1         0.283   0.000   0.000   1.000
## avioituvuus_naiset_30_34_lag1         0.741   1.000   1.000   0.000
## kehyskaupunki                         0.821   1.000   1.000   1.000
## sisempikaupunki                       0.982   1.000   1.000   1.000
## ulompikaupunki                        0.342   0.000   0.000   1.000
## some_25_34_lag1                       0.276   0.000   1.000   0.000
## some_35_44_lag1                       0.777   1.000   0.000   1.000
## BF                                       NA   1.000   0.247   0.153
## PostProbs                                NA   0.287   0.071   0.044
## R2                                       NA   0.957   0.951   0.959
## dim                                      NA   5.000   5.000   6.000
## logmarg                                  NA  29.125  27.726  27.249

Regressiokertoimet todennäköisimmässä mallissa ovat

## 
##  Marginal Posterior Summaries of Coefficients: 
## 
##  Using  HPM 
## 
##  Based on the top  1 models 
##                                post mean  post SD    post p(B != 0)
## Intercept                       1.766071   0.003690   1.000000     
## lapsikuolleisuus                0.000000   0.000000   0.131822     
## synnyttajien_keskiika           0.000000   0.000000   0.221484     
## avioituvuus_naiset_25_29_lag1   0.000000   0.000000   0.282738     
## avioituvuus_naiset_30_34_lag1   0.004126   0.001100   0.741447     
## kehyskaupunki                   0.153860   0.035479   0.820823     
## sisempikaupunki                -0.105842   0.011180   0.982289     
## ulompikaupunki                  0.000000   0.000000   0.342396     
## some_25_34_lag1                 0.000000   0.000000   0.276363     
## some_35_44_lag1                -0.004924   0.001048   0.776825

Hedelmällisyysluku on laskenut 0,38 vuosien 2010 ja 2017 välillä. Regressiokertoimista näkyy, että avioituvuus lisää syntyvyyttä: yhden prosenttiyksikön nousu avioituvuudessa kytkeytyisi hedelmällisyysluvun maltilliseen kasvuun 1,43:stä 1,434:ään. Avioituvuus on laskenut 20,8 prosenttiyksikköä 30-34-vuotiaissa vuodesta 2008 vuoteen 2017, jolloin mallin mukaan sillä voi selittää -0,086:n verran hedelmällisyysluvun pudotuksesta. Muutos avioituvuudessa selittää siis noin 23 prosenttia muutoksesta.

Kaupungistuminen liittyy jälleen regression mukaan hedelmällisyyslukuun: sisäkaupungissa asuvien osuuden kasvu alentaa hedelmällisyyslukua (kerroin -0,105). Tiedetään, että Suomen suurissa kaupungeissa on alimmat hedelmällisyysluvut, joten tulos on uskottava. Kehyskaupungissa asuvien osuus taas kasvattaa selvästi syntyvyyttä (kerroin 0,154). Näiden aggregaattivaikutus on -0,106 hedelmällisyyslukuun 2010-2017. Kaupungistuminen selittää siis 28 prosenttia muutoksesta.

Sosiaalisen median aktiivikäyttö kertoimien mukaan syrjäyttää syntyvyyttä. Vuodesta 2012 vuoteen 2017 välillä somen aktiivikäyttäjien osuus on kasvanut 13 prosentista 41:een prosenttiin, ja hedelmällisyysluku on samana aikana laskenut 0,33. Jos regressiokerroin on kohdallaan, selittää somen aktiivikäyttäjien osuuden kasvu -0,14 tästä laskusta, eli noin 42 prosenttia muutoksesta vuosien 2012 ja 2017 välillä.

Aggregaattikertoimet kaikissa mallissa todennäköisyyksillä painotettuna ovat

## 
##  Marginal Posterior Summaries of Coefficients: 
## 
##  Using  BMA 
## 
##  Based on the top  512 models 
##                                post mean   post SD     post p(B != 0)
## Intercept                       1.7660714   0.0039520   1.0000000    
## lapsikuolleisuus                1.1436705   8.4071449   0.1318216    
## synnyttajien_keskiika          -0.0139343   0.0632090   0.2214843    
## avioituvuus_naiset_25_29_lag1   0.0009143   0.0019889   0.2827381    
## avioituvuus_naiset_30_34_lag1   0.0031339   0.0023273   0.7414475    
## kehyskaupunki                   0.1299530   0.0819301   0.8208232    
## sisempikaupunki                -0.1034641   0.0260476   0.9822892    
## ulompikaupunki                  0.0311084   0.0551343   0.3423957    
## some_25_34_lag1                -0.0003363   0.0018411   0.2763632    
## some_35_44_lag1                -0.0039367   0.0027980   0.7768252

Näistä näkyy hyvin useimmat mallit sisältävät kehyskaupungin, sisempikaupungin, some_35_44_lag1:n sekä avioituvuus_naiset_30_34_lag1:n tekijöinä. Faktorien painot vastaavat hyvin todennäköisimmän mallin painoja: sosiaalisen median aktiivikäytön kasvuja sisemmän kaupungin väestöosuuden kasvu alentavat syntyvyyttä, avioituvuuden ja kehyskaupungin väestöosuuden kasvut lisäävät syntyvyyttä.

Tarkastetaan vielä, millaisia residuaaleja jää selittämättä mallilla

Ja lopuksi verrataan mallin sovitetta

Residuaaleista näkee, että malli selittää heikoimmin viimeisimpiä havaintoja (erityisesti outlier #27). Aiemmin laskettiin, että juuri tällä aikavälillä faktorit selittivät vain hieman yli puolet varianssista.

Ennuste

Pyritään sitten arvioimaan miten hedelmällisyysluku kehittyy, mikäli 10 viime vuoden trendi jatkuisi näiden neljän tekijän osalta. Jatketaan trendiä lineaarisesti avioituvuudelle, kaupungistumiselle ja aktiivisten somen käyttäjien osuudelle. Muut tekijät pidetään vakiona.

Meillä on nyt ennuste hedelmällisyysluvusta, joten käytetään sitä ja väestöennusteen naisten lukumääriä arvioimaan syntyvien lasten määriä

Syntyvyyden laskun syyt

Vaikka tällä tutkimuksella ei pääse kiinni syntyvyyden laskun kausaalisiin syihin, näkyy tuloksista selvästi, että syntyvyyden laskua ajaa kaksi erilaista tekijää: hedelmällisyysluvun lasku ja synnytysikäisten naisten lukumäärän lasku. Vaikeampaa on yrittää selittää, mistä hedelmällisyysluvun lasku johtuu.

Uutena syntyvyyteen vaikuttana tekijänä tässä tutkimuksessa näkyy sosiaalisen median aktiivikäyttäjien osuuden kasvun vaikutus syntyvyyteen. Kausaalista kytkentää tämä tutkimus ei osoita, lähinnä sen että sosiaalinen media ja sen aktiivikäyttö saattaa syrjäyttää syntyvyyttä.

Sisäkaupungissa asuvien osuuden kasvu kytkeytyi tässä tutkimuksessa synnyttäneiden keski-iän nousuun. Tilastokeskuksen tiedoista tiedetään, että kaupungeissa syntyvyys on alempaa kuin muussa maassa: “Vastaavasti matalin syntyvyys oli jaksolla 2013–2017 Helsingissä, jossa kokonaishedelmällisyysluku oli 1,27. Turussa luku oli 1,29 ja Tampereella 1,34. Myös kaikkien kuntien vertailussa viimeksi mainittujen kaupunkien syntyvyys oli matalimpien joukossa.” (Tilastokeskus, väestörakenne 2018).

Regressiokerrointen mukaan sisemmässä kaupungissa asuvien osuuden kasvu alentaa syntyvyyttä ja lykkää lasten hankintaa. Toisaalta ulommassa kaupungissa (samoin kuin maaseudulla) asuvien osuuden kasvu näyttäisi lisäävän syntyvyyttä ja vähentävän lastenhankinnan lykkäämistä. Tulokset ovat intuition mukaisia, koska sisemmissä kaupungeissa erityisesti lapsiperheille sopivien asuntojen hintataso on korkea, kun taas kauempana kaupunkien keskustoista hintataso on alempi. Kaupungistuminen ei siis välttämättä alenna syntyvyyttä, vaikka sisäkaupungeissa asuvien osuuden kasvu näyttää alentavan syntyvyyttä.

Suurin osa lapsiperheistä on edelleen avioperheitä. Avioituvuus erityisesti 30-34-vuotiailla kytkeytyy selvästi syntyneiden lasten määrään. Ainakin aiemmin on argumentoitu, että verrattuna avoliittoihin, avioliitoissa syntyy enemmän lapsia. Kyse voi olla myös valinnasta, mutta osaltaan avioituvuuden aleneminen kertoo asenne- tai preferenssimuutoksesta.

Tässä tutkimuksessa aineisto koostui pienestä määrästä havaintoja. Tästä syystä tuloksiin on syytä suhtautua varovaisuudella, vaikka usealle löydetylle tekijälle on selkeä selitys. Sovellettaessa faktorimallia eteenpäin, näkyy selvästi että hedelmällisyysluku jatkaa jyrkkää laskuaan. Faktorimallin tulokset ovat melko herkkiä sille, mitä selittäviä muuttujia valitaan mukaan, erityisesti eri muuttujien keskinäiset painoarvot muuttuvat helposti.

Verrattuna Tilastokeskuksen väestöennusteeseen 2018 ovat tämän mallin ennusteet selvästi synkempiä syntyvyyden osalta.

Johtopäätökset

Ennustemallilla saatu tulos vastaa havaittua alenevaa syntyvyyskehitystä. Jos eri syntyvyyteen vaikuttavien tekijöiden kehitys jatkuu nykyisenkaltaisena, voi kokonaishedelmällisyysluvun ja syntyvyyden arvioida jatkavan alenevaa trendiään kohti kokonaishedelmällisyyslukua 1,1 vuoteen 2030 mennessä.

Viittaukset

Becker, G.S., Barro, R.J., Reformulation of the economic theory of fertility, The quarterly journal of economics, 1988

Boldrin, M., De Nardi, M., Jones, L.E. Fertility and social security, Journal of Demographic Economics 81, 261-299, https://doi.org/10.1017/dem.2014.14, 2015

Doepke, M., Child mortality and fertility decline: Does the Barro-Becker model fit the facts?

Hiilamo, H. T., Fertility Response to Economic Recessions in Finland 1991–2015 Finnish Yearbook of Population Research 52, 15-28 . DOI: 10.23979/fypr.65254, 2017

Kohler, H.-P., Kohler, I., Fertility Decline in Russia in the Early and Mid 1990s: The Role of Economic Uncertainty and Labour Market Crises, European Journal of Population 18, 233-262, https://doi.org/10.1023/A:1019701812709, 2002.

Martine, G., Alves, J.E., Cavenaghi, S., Urbanization and fertility decline: Cashing in on structural change, IIED Working paper, 2013

Miettinen, A., Miksi syntyvyys laskee? Suomalaisten lastensaantiin liittyviä toiveita ja odotuksia. Perhebarometri 2015. Väestöliitto, 2015.

Miettinen, A., Jalovaara, M. Stable employment – more babies? Life stage and educational differences in the effects of labour market attachment on first birth among Finnish men and women. Working Papers on Social and Economic Issues 15/2016, Turku Center for Welfare Research, 2016

Rotkirch, A., Tammisalo, K., Miettinen, A., Berg, V. Miksi vanhemmuutta lykätään? Perhebarometri, 2017.

Tikanmäki, H., Huomisen aikuiset syntyvät nyt, Eläketurvakeskuksen blogi https://www.etk.fi/blogit/huomisen-aikuiset-syntyvat-nyt/, 2017

Liite: Aika-sarjojen kuvaukset

syntyneet Syntyneiden lasten lukumäärä. Lähde: Tilastokeskus

hedelmallisyysluku “Kokonaishedelmällisyysluku saadaan laskemalla yhteen yhdelle ikävuodelle lasketut hedelmällisyysluvut. Näin saatu luku tarkoittaa laskennallista lasten määrää, jonka nainen synnyttää kyseisen vuoden hedelmällisyyden pysyessä voimassa naisen koko hedelmällisen kauden edellyttäen, ettei hän kuole ennen tämän kauden päättymistä.” Lähde: Tilastokeskus, Väestörakenne-tilasto

lapsikuolleisuus Alle 1-vuotiaana kuolleiden osuus elävänä syntyneistä. Lähde: Human mortality database

tyollisyysaste_miehet_15_24_lag1, tyollisyysaste_naiset_25_34_lag1, tyollisyysaste_miehet_35_44_lag1, tyollisyysaste_naiset_15_24_lag1, tyollisyysaste_miehet_25_34_lag1, tyollisyysaste_naiset_45_44_lag1 Yhden vuoden viivästetty 10-vuotisikäluokittainen työllisyysaste miehille ja naisille. Lähde: Tilastokeskus

synnyttajien_keskiika Laskettu synnyttäneiden äitien ikien keskiarvona. Lähde: Tilastokeskus

avioituvuus_naiset_25_29, avioituvuus_naiset_30_34 Naisten solmittujen avioliittojen lukumäärä suhteessa samanikäisten naisten lukumäärään. Lähde: Tilastokeskus

sisempikaupunki, ulompikaupunki, kehykaupunki Sisempi kaupunkialue on kaupunkien tiivis yhtenäinen tehokkaasti rakennettu alue. Ulompi kaupunkialue on sisemmän kaupunkialueen reunasta yhtenäisesti jatkuvan taajamarakenteen reunalle ulottuva kaupunkimaisen tehokkuuden alue. Kaupungin kehysalue on kaupunkiin välittömästi kytkeytyvä osa kaupungin ja maaseudun välivyöhykkeestä. Lähde: Ympäristöministeriö

naisten_lkm_15_19, naisten_lkm_20_24, naisten_lkm_25_29, naisten_lkm_30_34,naisten_lkm_35_39, naisten_lkm_40_45, naisten_lkm_45_49 Synnytysikäiset naiset 5-vuotisikäluokittain Lähde: Tilastokeskus

miesten_tyottomyysaste_15_24_lag1, naisten_tyottomyysaste_15_24_lag1, miesten_tyottomyysaste_25_34_lag1, naisten_tyottomyysaste_25_34_lag1, miesten_tyottomyysaste_35_44_lag1, naisten_tyottomyysaste_35_44_lag1 Yhden vuoden viivästetty 10-vuotisikäluokittainen työttömyysaste miehille ja naisille Lähde: Tilastokeskus

some_25_34, some_35_44 “Seuraa jotain yhteisöpalvelua yleensä jatkuvasti kirjautuneena tai useasti päivässä”. Tilastokeskuksen Viestintä- ja tietotekniikan käyttö-tutkimuksesta 10-vuotisikäluokat