AbstractsBiology & Animal Science

Logistic regression: fundamentals and application in breed specific feline asthma data

by Maria Katariina Vapalahti




Institution: University of Helsinki
Department:
Year: 2015
Keywords: Matematiikka
Record ID: 1139300
Full text PDF: http://hdl.handle.net/10138/154819


Abstract

Pro gradussa kuvataan logistisen regressioanalyysin perusteet ja havainnollistetaan esimerkillä sen käyttöä suomalaisia koti- ja rotukissoja koskeneen terveyskyselyn astma-aineistossa. Logistista regressiota käytetään yleensä aineistoissa, joissa selitettävä muuttuja on kaksiluokkainen, mutta sovelluksia on myös useampiluokkaisille aineistoille samoin kuin aineistoille, joissa on useampi kuin yksi kaksiluokkainen selitettävä muuttuja. Logistista regressiota käytetään tutkimuksissa monilla eri tieteenaloilla, mutta erityisen hyvin se sopii epidemiologisiin tutkimuksiin. Usein tutkittava havaintoaineisto sisältää ryhmiä. Tällaiset rakenteet voivat vääristää tutkimuksen tuloksia, ellei niitä oteta huomioon aineiston analyysissa. Yksi vaihtoehto havaintoaineiston ryhmärakenteiden hallintaan on sisällyttää malliin satunnaisvaikutuksia (random effect) eli kertoimia, jotka koskevat vain ryhmän sisäisiä havaintoja. Tällaista mallia kutsutaan satunnaisten vaikutusten malliksi. Myös sekoittavat tekijät, muuttujien multikollineaarisuus ja interaktiot on pyrittävä löytämään analyysissa ja niiden vaikutus hallitsemaan. Tutkielman luvussa 1 kuvataan logistisen regression historia ja annetaan esimerkkejä logistisen regression käytöstä eri tieteenaloilla. Kissojen astmaa koskevaa esimerkkiä pohjustetaan selittämällä tarkemmin epidemiologisen tutkimuksen periaatteita ja logistisen regression käyttöä epidemiologiassa. Luvussa 2 esitellään logistisen regression matemaattinen teoria, joka pitää sisällään logistisen regressiomallin käsitteen esittelyn, regressiokertoimien tulkinnan, estimoinnin ja merkitsevyyden testaamisen sekä logistisen regressiomallin hyvyyden testaamisen. Lopuksi luvussa esitellään satunnaisvaikutusten käyttö aineistoissa, joissa havainnot muodostavat ryhmiä. Luvussa 3 logistista regressiota sovelletaan kissojen terveyskyselyn astma-aineistoon. Luvussa 4 pohditaan logistisen regressiomallin etuja ja puutteita sekä kissojen astma-aineistosta saatuja tuloksia. Luku 5 sisältää esimerkkiin liittyvät taulukot ja kuvat. Logistinen regressio on tehokas väline analysoitaessa aineistoja, joissa selitettävä muuttuja on kaksiluokkainen. Analyysissa on kuitenkin tärkeää ottaa huomioon aineiston mahdolliset ryhmärakenteet sekä löytää ja huomioida muuttujien väliset assosioituneisuudet, jotka voivat vääristää tuloksia. Esimerkin kissa-aineistossa kissarodut muodostivat ryhmiä. Analyysissa käytettiin muun muassa logistisen regressiomallin sovellusta, jossa kissojen rodut huomioidaan sisällyttämällä malliin kissarotujen satunnaisvaikutukset (random intercept). Kun lisäksi interaktioden, multikollineaarisuuden ja sekoittavien tekijöiden vaikutukset otettiin huomioon, kissojen astman todettiin olevan assosioitunut varsinkin korat-rotuisiin kissoihin. Vain tiivistelmä. Opinnäytteiden arkistokappaleet ovat luettavissa Helsingin yliopiston kirjastossa. Hae HELKA-tietokannasta (http://www.helsinki.fi/helka/index.htm). Abstract only. The paper copy of the whole thesis is available for reading room use at the Helsinki University…