Many gene defects have been associated to genetic disorders, but the details of molecular mechanisms by which they contribute to the disease are often unclear. The study of mutation effects at the protein level can help elucidate the biological processes involved in the disease and the role of the protein in it. Bioinformatics can help to address this problem, being the connection between different disciplines including clinical, genetics, structural biology, and biochemistry. By using a computational approach I tackled the analysis of some examples of biomedical interesting proteins integrating various sources of data and addressing experimental and clinical investigations. Experimentally defined structures and molecular modelling were used as a basis to determine the protein structure-function relationship, which is essential to gain insights into disease genotype-phenotype correlation. Proteins have been further analyzed in their context, considering interactions that they take in specific cellular compartments. The results have been used to formulate functional hypotheses, which in some cases have been tested and confirmed by further investigations performed by cooperation groups. Mutations found in genes encoding these proteins have been evaluated for their impact on the protein structure and function by using several available prediction methods. These studies provided the idea for developing novel approaches, using residue interaction networks and an ensemble of methods. A novel strategy has been also designed to evaluate genomic data obtained by next generation sequencing technology. This consists in using available resources and software to prioritize rare functional variants and estimate their contribution to the disease. The novel approaches developed in this thesis have been applied and assessed at the Critical Assessment of Genome Interpretation (CAGI) experiment in 2011, providing in some cases very successful results

Alterazioni genetiche sono state identificate per molte malattie di natura genetica, ma in molti casi i meccanismi molecolari che contribuiscono all’insorgere della malattia non sono ancora chiari. Lo studio degli effetti delle mutazioni a livello della proteina permette di chiarire i processi biologici coinvolti nella malattia e il ruolo della proteina in essa. La bioinformatica può aiutare a affrontare questo problema rappresentando il punto di connessione tra diverse discipline quali la clinica, la genetica, la biologia strutturale e la biochimica. In questa tesi ho impiegato un approccio computazionale per affrontare l’analisi di alcuni esempi di proteine di interesse biomedico, integrando diverse risorse di dati e indirizzando la ricerca sperimentale e clinica. Strutture proteiche determinate sperimentalmente o mediante il modelling molecolare sono state utilizzate come base per determinare la relazione tra struttura e funzione, essenziale per ottenere informazioni sulla correlazione genotipo-fenotipo. Le proteine prese in esame sono state inoltre analizzate nel loro contesto, considerando le interazioni che avvengono con altre proteine o ligandi nei diversi compartimenti cellulari. I risultati dell’analisi bioinformatica sono stati poi utilizzati per formulare ipotesi funzionali che in alcuni casi sono state verificate e confermate sperimentalmente da altri gruppi di ricerca. Le mutazioni identificate nei geni codificanti per le proteine in esame sono state valutate per il loro impatto sulla struttura e funzione della proteina utilizzando numerosi metodi di predizione disponibili online. Le diverse applicazioni descritte in questa tesi hanno fornito l’idea per lo sviluppo di nuovi approcci computazionali per lo caratterizzazione strutturale e funzionale di proteine e dei loro mutanti. Si è visto che la predizione migliora utilizzando un ensemble dei diversi metodi di predizione disponibili. Inoltre, per la predizione degli effetti di mutazioni è stato ideato un nuovo approccio computazionale che utilizza le reti di interazione tra residui per rappresentare la struttura proteica. Questi metodi sono stati utilizzati anche nell’analisi di dati genomici originati da nuove tecnologie di sequenziamento. Questo ambito necessita di nuove strategie di indagine per l’individuazione di poche varianti causative in un’enorme quantità di varianti identificate di dubbio significato. A questo scopo viene proposta una strategia di analisi che utilizza informazioni derivanti dalle reti di interazioni proteiche. I nuovi approcci formulati in questa tesi sono stati applicati e valutati ad un nuovo esperimento internazionale, chiamato Critical Assessment of Genome Interpretation (CAGI), fornendo in alcuni casi ottimi risultati

Bioinformatic Analysis of Protein Mutations / Leonardi, Emanuela. - (2012 Jan 30).

Bioinformatic Analysis of Protein Mutations

Leonardi, Emanuela
2012

Abstract

Alterazioni genetiche sono state identificate per molte malattie di natura genetica, ma in molti casi i meccanismi molecolari che contribuiscono all’insorgere della malattia non sono ancora chiari. Lo studio degli effetti delle mutazioni a livello della proteina permette di chiarire i processi biologici coinvolti nella malattia e il ruolo della proteina in essa. La bioinformatica può aiutare a affrontare questo problema rappresentando il punto di connessione tra diverse discipline quali la clinica, la genetica, la biologia strutturale e la biochimica. In questa tesi ho impiegato un approccio computazionale per affrontare l’analisi di alcuni esempi di proteine di interesse biomedico, integrando diverse risorse di dati e indirizzando la ricerca sperimentale e clinica. Strutture proteiche determinate sperimentalmente o mediante il modelling molecolare sono state utilizzate come base per determinare la relazione tra struttura e funzione, essenziale per ottenere informazioni sulla correlazione genotipo-fenotipo. Le proteine prese in esame sono state inoltre analizzate nel loro contesto, considerando le interazioni che avvengono con altre proteine o ligandi nei diversi compartimenti cellulari. I risultati dell’analisi bioinformatica sono stati poi utilizzati per formulare ipotesi funzionali che in alcuni casi sono state verificate e confermate sperimentalmente da altri gruppi di ricerca. Le mutazioni identificate nei geni codificanti per le proteine in esame sono state valutate per il loro impatto sulla struttura e funzione della proteina utilizzando numerosi metodi di predizione disponibili online. Le diverse applicazioni descritte in questa tesi hanno fornito l’idea per lo sviluppo di nuovi approcci computazionali per lo caratterizzazione strutturale e funzionale di proteine e dei loro mutanti. Si è visto che la predizione migliora utilizzando un ensemble dei diversi metodi di predizione disponibili. Inoltre, per la predizione degli effetti di mutazioni è stato ideato un nuovo approccio computazionale che utilizza le reti di interazione tra residui per rappresentare la struttura proteica. Questi metodi sono stati utilizzati anche nell’analisi di dati genomici originati da nuove tecnologie di sequenziamento. Questo ambito necessita di nuove strategie di indagine per l’individuazione di poche varianti causative in un’enorme quantità di varianti identificate di dubbio significato. A questo scopo viene proposta una strategia di analisi che utilizza informazioni derivanti dalle reti di interazioni proteiche. I nuovi approcci formulati in questa tesi sono stati applicati e valutati ad un nuovo esperimento internazionale, chiamato Critical Assessment of Genome Interpretation (CAGI), fornendo in alcuni casi ottimi risultati
30-gen-2012
Many gene defects have been associated to genetic disorders, but the details of molecular mechanisms by which they contribute to the disease are often unclear. The study of mutation effects at the protein level can help elucidate the biological processes involved in the disease and the role of the protein in it. Bioinformatics can help to address this problem, being the connection between different disciplines including clinical, genetics, structural biology, and biochemistry. By using a computational approach I tackled the analysis of some examples of biomedical interesting proteins integrating various sources of data and addressing experimental and clinical investigations. Experimentally defined structures and molecular modelling were used as a basis to determine the protein structure-function relationship, which is essential to gain insights into disease genotype-phenotype correlation. Proteins have been further analyzed in their context, considering interactions that they take in specific cellular compartments. The results have been used to formulate functional hypotheses, which in some cases have been tested and confirmed by further investigations performed by cooperation groups. Mutations found in genes encoding these proteins have been evaluated for their impact on the protein structure and function by using several available prediction methods. These studies provided the idea for developing novel approaches, using residue interaction networks and an ensemble of methods. A novel strategy has been also designed to evaluate genomic data obtained by next generation sequencing technology. This consists in using available resources and software to prioritize rare functional variants and estimate their contribution to the disease. The novel approaches developed in this thesis have been applied and assessed at the Critical Assessment of Genome Interpretation (CAGI) experiment in 2011, providing in some cases very successful results
bioinformatics, protein function, protein structure, mutations / bioinformatica, funzione proteica, struttura proteica, mutazioni
Bioinformatic Analysis of Protein Mutations / Leonardi, Emanuela. - (2012 Jan 30).
File in questo prodotto:
File Dimensione Formato  
Tesi_Leonardi_finale.pdf

accesso aperto

Tipologia: Tesi di dottorato
Licenza: Creative commons
Dimensione 29.71 MB
Formato Adobe PDF
29.71 MB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11577/3426280
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact