Protein-protein interaction network : management of databases and its applications on the computational study of protein-protein interactions

by Javier García-García

Institution: Universitat Pompeu Fabra
Year: 2015
Keywords: Protein; Interactions; Database; Integration; Interactome; Binding interface; Proteïna; Base de dades; Integració; Interactoma; Prediccions; Lloc d'unió
Record ID: 1126705
Full text PDF: http://hdl.handle.net/10803/286512


The use of protein-protein interaction networks has become crucial due to the emergence of systems biology. The completeness and quality of networks, crucial to understand the biochemical mechanisms underlying a system such as a cell, are still challenging the scientific community. This thesis focuses on the data completeness challenge by the development of flexible tools for biological data management. It presents a database framework, BIANA, in which the integrated access to several information sources tackles this problem by unraveling hidden biological associations. BIANA is used to develop protein-protein interaction inference tools based on sequence similarity and protein-protein interactions. I have applied the approach on Salmonella-host infection, a case study where experimental data is scarce. Finally, I have focused on the integration problem of protein sequence annotation, also addressing the prediction of protein-protein interaction interfaces. I have developed a new evaluation measure to compare the predictive power of interface inference approaches.; Les xarxes d'interacció proteïna-proteïna han esdevingut crucials des del naixement de la biologia de sistemes. La integritat i qualitat de les xarxes, que són essencials per entendre els mecanismes subjacents a un sistema com la cèl•lula, segueixen desafiant a la comunitat científica. Aquesta tesi se centra en el repte de la integritat de les dades mitjançant el desenvolupament d'eines flexibles per a la gestió de dades biològiques. Presento BIANA, un paquet informàtic que enfoca aquest problema facilitant l'accés integrat a diverses fonts d'informació. BIANA ha servit per desenvolupar eines de predicció d'interaccions proteïna-proteïna combinant les xarxes amb similitud entre seqüències. He aplicat aquest mètode sobre la infecció per Salmonella-hoste, un cas en el qual les dades experimentals són escasses. Finalment, m'he centrat en la integració associada a l'anotació de seqüències, abordant la predicció d'interfícies d'interacció proteïna-proteïna. Una nova mesura d'avaluació m'ha permès comparar el poder predictiu de diferents mètodes.