AbstractsBusiness Management & Administration

Adjustment for Covariate Measurement Errors in Complex Surveys: A Simulation Study of Three Competing Methods

by Maria Valaste




Institution: University of Helsinki
Department: Department of Social Research
Year: 2015
Keywords: tilastotiede
Record ID: 1144993
Full text PDF: http://hdl.handle.net/10138/153562


Abstract

In sample surveys, the uncertainty of parameter estimates comes from two main sources: sampling and measuring the study units. Some aspects of survey errors are quite well understood (e.g. sampling errors, nonresponse errors) and reported but others, like measurement errors, are often neglected. This thesis studies measurement uncertainty in covariates. Focus is on the adjustment for covariate measurement errors in logistic regression for cluster-correlated data. Three methods for adjustment for covariate measurement errors in surveys are studied. The methods are Maximum Likelihood, Multiple Imputation and Regression Calibration. These methods require information obtained from validation study. The thesis consists of a theoretical part and extensive Monte Carlo simulation experiments. At the first simulation experiment, the simulation study is conducted with artificial data and with independent observations to test and have experience of the three methods: MI, ML and RC. The second and third simulation study is performed with cluster-correlated data. In these simulation studies, the first simulation uses artificial data and the latter uses real data. In both simulations regression calibration and multiple imputation approaches are examined in various simulation designs. The quality of the methods is assessed by the bias and accuracy. The bias is measured by absolute relative bias percentages (ARB%) and the accuracy by relative root mean-squared error percentages (RRMSE%). The results suggest that additional information from validation (calibration) data enables more accurate estimates in terms of bias percentages. Väitöskirjassa tarkastellaan mittausvirheitä. Epätarkat mittaukset ja niistä johtuvat mittausvirheet ovat tutkimuksessa yleisiä. Jos mittauksen epävarmuus jätetään huomioimatta, voidaan päätyä harhaisiin tuloksiin ja näin ollen virhepäätelmiin. Väitöskirjan alkuosassa käsitellään mittausvirheisiin liittyvää teoriaa ja loppuosassa on kolme simulointikoetta. Työssä tutkitaan ja vertaillaan kolmen menetelmän toimivuutta mittausvirheiden huomioimiseksi. Tarkasteltavat menetelmät ovat regressiokalibrointi, moni-imputointi ja suurimman uskottavuuden menetelmä. Menetelmien käyttämiseksi tarvitaan lisätietoa mittausvirheestä. Lisätieto saadaan validointidatasta. Menetelmien toimivuutta tarkastellaan simulointikokeissa. Ensimmäisessä simulointikokeessa havaintojen oletetaan olevan riippumattomia ja kahdessa jälkimmäisessä simulointikokeessa havainnot ovat sisäkorreloituneita. Mittausvirheitä tarkastellaan logistisen mallin ja logistisen sekamallin yhteydessä. Vastemuuttuja oletetaan kaksiarvoikseksi ja sen ei oleteta sisältävän mittausvirhettä. Osa mallin selittäjistä sisältää mittausvirhettä, mutta mallissa voi myös olla selittäjiä, joissa ei ole mittausvirhettä. Oletetaan, että ainakin osalle havainnoista on saatavissa tarkasti mitatut vastineet. Erityisesti mielenkiinnon kohteena on tilanne, jossa mallinnettava aineisto on sisäkorreloitunut. Tällainen on tyypillistä mm. kotitalousaineistoissa,…