In the last years the increasing number of sequencing projects and the availability of completely sequenced genomes pose the problem of searching for gene sequences in a rapid and reliable way. Bioinformatics is playing a fundamental role in this research field. In fact, many bioinformatic tools and software that consider multiple and heterogeneous evidence sources have been developed in order to improve the genome annotation. Genome annotation can be divided in two distinct phases: gene prediction and functional annotation. The prediction phase is the process to identify the exact gene structure, delimiting the exon-intron boundaries and the localization of genes on the genome. Otherwise, the functional annotation is the action of characterizing predicted genes, assigning them a biological function, a metabolic role or describing structural features. This PhD project focuses on the development of computational methods for the management of data coming from a genome sequencing project. The work consists on the implementation of a bioinformatic platform for gene prediction and functional annotation of the Vitis vinifera genome. This work has been carried out in collaboration with CRIBI bioinformatic group, that is member of the Grape sequencing project. The annotation platform consists of two distinct modules. The first module regards gene prediction. Different computational methods showed a great reliability to discover molecular signals and to reconstruct gene boundaries, becoming fundamental in the annotation at genome-level. These methods are represented by ab-initio predictors, genome alignments of ESTs or proteins or comparative genomics. Otherwise, in the second module of annotation platform, the predicted genes are functionally characterized, adopting mainly a similarity approach. This approach bases on the assumption that regions highly conserved maintain the original functions or roles also in different species. This project includes also the development of databases and tools to store and retrieve genome data. In particular, the PhD work focused on the implementation of a XML-based query system that permits the information retrieval through web page access and, in the next future, also through web-services workflows.

Negli ultimi anni il crescente numero di progetti di sequenziamento e la disponibilità di genomi completamente sequenziati hanno posto il problema della ricerca di sequenze geniche in modo rapido e affidabile. La Bioinformatica sta giocando un ruolo fondamentale in questo campo di ricerca. Infatti, sono stati sviluppati molti strumenti informatici che utilizzano dati molteplici ed eterogenei al fine di migliorare l’annotazione genomica. L’annotazione genomica può essere suddivisa in due fasi distinte: la predizione genica e l’annotazione funzionale. La predizione genica consiste nell’individuazione dell’esatta struttura del gene, determinando il confine esone-introne e la localizzazione dei geni sul genoma. Invece, l’annotazione funzionale è il processo di caratterizzazione dei geni, che assegna loro una funzione biologica, un ruolo metabolico o che descrive le loro caratteristiche strutturali. Questo progetto di dottorato prevede lo sviluppo di metodi computazionali per la gestione dei dati provenienti da progetti di sequenziamento genomico. Il lavoro consiste nella realizzazione di una piattaforma bioinformatica per la predizione genica e l’annotazione funzionale del genoma di Vitis vinifera. Questo lavoro è stato svolto in collaborazione con il gruppo di bioinformatica del CRIBI, membro del progetto internazionale di sequenziamento del genoma di vite. La piattaforma di annotazione è suddivisa in due moduli. Il primo modulo riguarda la predizione genica. Diverse metodiche computazionali hanno mostrato una grande affidabilità nella ricerca di segnali molecolari e nella ricostruzione della struttura genica, diventando strumenti fondamentali per l’annotazione genomica. Questi metodi sono rappresentati da predittori ab-initio, da allineamenti di EST o proteine sul genoma o dalla genomica comparata. Invece, nel secondo modulo della piattaforma di annotazione, i geni predetti sono caratterizzati funzionalmente attraverso l’utilizzo di un approccio di similarità. Questo approccio si basa sul presupposto che le regioni altamente conservate mantengono le funzioni e i ruoli originali anche in specie diverse. Questo progetto prevede anche lo sviluppo di banche dati e strumenti per immagazzinare e recuperare i dati di annotazione. In particolare, il lavoro di dottorato si è concentrato sulla realizzazione di un sistema di query basato su XML che permette il recupero delle informazioni attraverso pagine web e, nel prossimo futuro, anche attraverso l’utilizzo di workflow basati sui web services.

Gene prediction and functional annotation in the Vitis vinifera genome / Forcato, Claudio. - (2010 Jan 19).

Gene prediction and functional annotation in the Vitis vinifera genome

Forcato, Claudio
2010-01-19

Abstract

In the last years the increasing number of sequencing projects and the availability of completely sequenced genomes pose the problem of searching for gene sequences in a rapid and reliable way. Bioinformatics is playing a fundamental role in this research field. In fact, many bioinformatic tools and software that consider multiple and heterogeneous evidence sources have been developed in order to improve the genome annotation. Genome annotation can be divided in two distinct phases: gene prediction and functional annotation. The prediction phase is the process to identify the exact gene structure, delimiting the exon-intron boundaries and the localization of genes on the genome. Otherwise, the functional annotation is the action of characterizing predicted genes, assigning them a biological function, a metabolic role or describing structural features. This PhD project focuses on the development of computational methods for the management of data coming from a genome sequencing project. The work consists on the implementation of a bioinformatic platform for gene prediction and functional annotation of the Vitis vinifera genome. This work has been carried out in collaboration with CRIBI bioinformatic group, that is member of the Grape sequencing project. The annotation platform consists of two distinct modules. The first module regards gene prediction. Different computational methods showed a great reliability to discover molecular signals and to reconstruct gene boundaries, becoming fundamental in the annotation at genome-level. These methods are represented by ab-initio predictors, genome alignments of ESTs or proteins or comparative genomics. Otherwise, in the second module of annotation platform, the predicted genes are functionally characterized, adopting mainly a similarity approach. This approach bases on the assumption that regions highly conserved maintain the original functions or roles also in different species. This project includes also the development of databases and tools to store and retrieve genome data. In particular, the PhD work focused on the implementation of a XML-based query system that permits the information retrieval through web page access and, in the next future, also through web-services workflows.
Negli ultimi anni il crescente numero di progetti di sequenziamento e la disponibilità di genomi completamente sequenziati hanno posto il problema della ricerca di sequenze geniche in modo rapido e affidabile. La Bioinformatica sta giocando un ruolo fondamentale in questo campo di ricerca. Infatti, sono stati sviluppati molti strumenti informatici che utilizzano dati molteplici ed eterogenei al fine di migliorare l’annotazione genomica. L’annotazione genomica può essere suddivisa in due fasi distinte: la predizione genica e l’annotazione funzionale. La predizione genica consiste nell’individuazione dell’esatta struttura del gene, determinando il confine esone-introne e la localizzazione dei geni sul genoma. Invece, l’annotazione funzionale è il processo di caratterizzazione dei geni, che assegna loro una funzione biologica, un ruolo metabolico o che descrive le loro caratteristiche strutturali. Questo progetto di dottorato prevede lo sviluppo di metodi computazionali per la gestione dei dati provenienti da progetti di sequenziamento genomico. Il lavoro consiste nella realizzazione di una piattaforma bioinformatica per la predizione genica e l’annotazione funzionale del genoma di Vitis vinifera. Questo lavoro è stato svolto in collaborazione con il gruppo di bioinformatica del CRIBI, membro del progetto internazionale di sequenziamento del genoma di vite. La piattaforma di annotazione è suddivisa in due moduli. Il primo modulo riguarda la predizione genica. Diverse metodiche computazionali hanno mostrato una grande affidabilità nella ricerca di segnali molecolari e nella ricostruzione della struttura genica, diventando strumenti fondamentali per l’annotazione genomica. Questi metodi sono rappresentati da predittori ab-initio, da allineamenti di EST o proteine sul genoma o dalla genomica comparata. Invece, nel secondo modulo della piattaforma di annotazione, i geni predetti sono caratterizzati funzionalmente attraverso l’utilizzo di un approccio di similarità. Questo approccio si basa sul presupposto che le regioni altamente conservate mantengono le funzioni e i ruoli originali anche in specie diverse. Questo progetto prevede anche lo sviluppo di banche dati e strumenti per immagazzinare e recuperare i dati di annotazione. In particolare, il lavoro di dottorato si è concentrato sulla realizzazione di un sistema di query basato su XML che permette il recupero delle informazioni attraverso pagine web e, nel prossimo futuro, anche attraverso l’utilizzo di workflow basati sui web services.
genome, annotation, prediction, Vitis vinifera, bioinformatics
Gene prediction and functional annotation in the Vitis vinifera genome / Forcato, Claudio. - (2010 Jan 19).
File in questo prodotto:
File Dimensione Formato  
thesis_claudio_forcato.pdf

accesso aperto

Tipologia: Tesi di dottorato
Licenza: Non specificato
Dimensione 3.79 MB
Formato Adobe PDF
3.79 MB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

Caricamento pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: http://hdl.handle.net/11577/3426547
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact