AbstractsBiology & Animal Science

Diferenciální exprese genů na zakladě negativního binomického modelu

by Tereza Janáková




Institution: Brno University of Technology
Department:
Year: 0
Keywords: RNA-sekvenování; sekvenování nové generace; diferenciální genová exprese; rakovina prostaty; RNA-sequencing; Next Generation Sequencing; Differential gene expression; Prostate Cancer
Record ID: 1097241
Full text PDF: http://hdl.handle.net/11012/31553


Abstract

Hlavním cílem této diplomové práce je analýza diferenciální exprese genů na základě negativního binomického modelu. Úvodní část je věnována teoretickému základu, pojednává o sekvenování RNA, sekvenování nové generace, výhodách a možném využití, formátu fastQ aj. Následující část už se zabývá samotnou praktickou částí, zde byl vybrán vhodný set genů, které budou později analyzovány a příslušná data byla stažena. Tato data byla zarovnána k lidskému genomu verze 37 Burrowsovou-Wheelerovou transformací s využitím bowtie mapovače, byly tak vytvořeny soubory ve formátu SAM. Toto soubory dat byly později setříděny pomocí nástroje SAMtools. Následně byly v programovém prostředí Matlab (verze R2013b) vytvořeny anotované objekty genů s využitím služby Ensembl´s BioMart. Dále byla určena genová exprese a byly odhadnuty faktory velikosti knihovny. Na závěr byly odhadnuty parametry negativního binomického rozložení a byla vyhodnocena diferenciální exprese genů.; The main goal of this master thesis is to carry out the analysis of differential gene expression using a negative binomial model. The first part is devoted to theoretical basis, discusses the RNA sequencing, Next-Generation Sequencing (NGS), the benefits and applications, and FASTAQ format. The second part is the practical part, there was chosen a suitable data set of genes, that will be later analyzed, and the relevant data was downloaded. This data was aligned to the human genome version 37 by Burrows-Wheeler transform and the SAM formatted files were created using the Bowtie mapper. The SAM formatted files were sorted by SAMtools. In the following part of this work was created an annotation object of target genes using Ensembl´s BioMart service and Matlab (version R2013b). Next, digital gene expression was determined and library size factor was estimated. In the end the negative binomial distribution parameters were estimated and data was tested for a differential gene expression.