# AbstractsMathematics

by Elina Numminen

Institution: University of Helsinki 2015 tilastotiede 02/05/2017 2124961 http://hdl.handle.net/10138/156556

## Abstract

A central goal in science is to learn from observations about the process that generated the observations. The principles of statistical inference describe a systematic approach for such learning, in which prior information, knowledge about the underlying mechanisms and the observed data can be combined. In practice, lack of mathematical tractability, huge amounts of missing information, and the sensitivity of the conclusions on the assumptions made represent genuine challenges in the theoretically sound statistical framework. Statistical studies on the dynamics of infectious diseases easily face all these problems at once. In the thesis we present case-studies in which the datasets on bacterial diversity, mostly on Streptococcus pneumoniae, described in terms of either genotypes or serotypic strains, are analysed. By utilizing the machinery of modern computational statistics different strategies for inference are formulated, which aim to take the special characteristics of each of the studied problem into account, while overcoming the previously mentioned challenges in computational studies. For instance, an approximate Bayesian computation scheme is formulated for analysing cross-sectional strain prevalence data and an importance sampling scheme for analysing transmission trees with a priori known complex features. The obtained results unravel the mechanisms of seasonality in pneumococcal carriage, consequences of the host population structure and the nature of within-host competition between the bacterial strains. Tilastotieteessä keskeinen päämäärä on kehitellä työkaluja, joilla aineistosta voidaan päätellä miten aineisto on syntynyt. Haasteeksi muodostuu se, että jokaisessa yksittäisessä kysymyksessä ja aineistossa on erityispiirteensä, jotka tässä päättelyssä tulisi ottaa huomioon. Eräs tapa tehdä näin on rakentaa matemaattinen malli tutkittavalle ilmiölle, tutkia kuinka hyvin malli sopii havaintoihin ja tarkastella millaiset malliparametrit vaikuttavat uskottavimmilta aineiston valossa. Ihanteena on tarkastella mahdollisimman todenmukaista mallia, koska silloin mallin parametreilla on vastineensa tosimaailmassa. Realistiset mallit ovat kuitenkin usein hankalampia analysoida, ja niiden vertaaminen havaintoihin asettaa myös aineistolle korkeat vaatimukset. Väitöskirjassa esitetään erilaisia strategioita, joiden avulla erilaisista havainnoista voidaan päätellä, millaista bakteerien tartunta- ja populaatiodynamiikka on. Siitä miten pneumokokkibakteerin eri kantoja esiintyy yksittäisissä lapsissa, kotitalouksissa tai päiväkodeissa päätellään millaisella intensiteetillä tartuntoja tapahtuu erilaisten yksilöiden välillä, miten pitkään bakteeria kannetaan, sekä miten nämä tekijät riippuvat esimerkiksi vuodenajasta. Analyysi paljastaa myös, miten voimakasta pneumokokin lajinsisäinen kilpailu on. Lisäksi väitöskirjassa tarkastellaan, kuinka bakteerien genotyypeistä voidaan päätellä varsinaisia tartuntaketjuja, eli kuka tartutti taudin kellekin. Tämän päättelyyn ehdotetaan menetelmää, jonka puitteissa voidaan…