Pathways are formal descriptions of the biological processes involving finely regulated structures by which a cell converts molecules or processes signals. The study of gene expression in terms of pathways is defined as pathway analysis and aims at identifying groups of functionally related genes that show coordinated expression changes. Recently, pathway analysis moved from algorithms using merely gene list to ones exploiting the topology that define gene connections. A crucial, and unfortunately limiting step for these novel methods are the availability of the pathways as gene networks in which nodes are genes and edges are the relations between two elements. To this aim, we develop a pathway data interpreter, called graphite, able to uniformly store, process and convert pathway information into gene networks. graphite has been made publicly available as R package within the Bioconductor platform. In the field of the topological pathway analysis, graphite fills the existing gap lying between technical and methodological aspects. graphite i) allows performing more informative analysis on omics data and ii) allows developing new methods based on the increased accessibil- ity of biological knowledge. However, the pathways of the four main public resources integrated into graphite (KEGG, Reactome, Biocarta and PID), still lack of crucial interactors: the microRNAs. The microRNAs are small non-coding RNAs that post-transcriptionally regulate gene expression, their function on the messenger target is repressive but their effect on the transcription is dependent of the topology of the pathway in which the miRNA is involved. In the last decade, many targets have been discovered and experimentally validated, dedicated databases are available providing these information. Thus, I worked on an extension of graphite package able to integrate microRNAs in pathway topology, i) linking the non-coding RNAs to their validated target genes, ii) providing integrated networks suitable for the topological pathway analyses. The feasibility of this approach has been validated on a specific biological context, the early stage of Epithelial Ovarian Cancer (EOC). EOC has long been considered as a single disease. The emerging opinion, however, sees ovarian cancer as a general term that encloses a group of histo-pathological subtypes sharing a common anatomic location. In collaboration with the Mario Negri institute, 257 stage I EOC tumour biopsies were collected and stratified into training and validation sets. miRNA microarray data was used to generate the most highly reproducible signatures for each histotype through a dedicated resampling inferential strategy. qRT- PCR was used to validate the results in both the training and validation set. The results indicate that the clear cell histotype is characterized by high expression levels of miR- 30a and miR-30a*, while mucinous patients by high levels of miR-192 and miR-194, interestingly as well as mucinous non-ovarian tissues. Then, the integrative approach that combines mRNA and miRNA profiles using graphite has been applied to identify the mucinous specific regulatory circuits. Taken together our findings demonstrate that EOC histotypes have discriminant regulatory circuits that drive the differentiation of the tumour environment. Our approach successfully guides us towards important biological results with interesting therapeutic implications in EOC.

I pathway sono descrizioni formali ed accurate dei processi biologici, che sono serie di eventi, finemente regolati, attraverso i quali la cellula opera trasformazioni su molecole o altri processi. Lo studio dell’espressione genica attraverso i pathway è definita come ”analisi di pathway” e cerca di identificare gruppi di geni correlati da un punto di vista funzionale con cambiamenti coordinati nell’espressione. Recentemente, la sua più promettente è stato il passaggio da algoritmi che considerano i pathway semplici elenchi di geni, ad algoritmi che sfruttano la topologia del pathway stesso, ovvero le reti delle connessioni geniche. Uno dei limiti di questi nuovi metodi di analisi è la mancanza dei pathway sotto forma di reti, in cui i nodi sono geni e gli archi sono le relazioni che intercorrono tra di essi. Durante il mio dottorato abbiamo sviluppato un interprete per i pathway, denominato graphite, in grado di memorizzare in modo uniforme, elaborare e convertire le informazioni contenute in essi. graphite è stato reso pubblicamente disponibile come pacchetto R all’interno della piattaforma Bioconductor. Nel campo d’indagine delle analisi topologiche, graphite colma il divario esistente tra gli aspetti tecnici e metodologici. graphite i) permette di eseguire analisi più avanzate dei dati omici e ii) consente lo sviluppo di nuovi metodi offrendo una maggiore e più facile accessibilità ai dati. Tuttavia, i pathway provenienti dalle quattro principali risorse pubbliche che sono state integrate in graphite (KEGG, Reactome, BioCarta e PID), mancano ancora di interattori cruciali: i microRNA. I microRNA sono piccoli RNA non codificanti che regolano l’espressione genica post-trascrizionale, la loro funzione sul target messaggero è repressiva ma il loro effetto generale sull’espressione va interpretato a seconda delle interazioni del contesto biologico in cui sono descritti, cioè della topologia del pathway in cui coinvolto il miRNA. Negli ultimi dieci anni, molti geni target di miRNA sono stati scoperti e validati sperimentalmente, informazioni a riguardo sono fornite in diversi database pubblici. Durante il mio dottorato ho lavorato su un’estensione del pacchetto graphite per integrare i microRNA all’interno dei pathway, i) collegando i miRNA ai loro geni target validati, ii) fornendo reti bipartite adatte per le analisi di pathway topologiche. Questo approccio è stato applicato allo studio di dati di espressione ottenuti da pazienti allo stadio iniziale di tumore ovarico epiteliale. Il tumore ovarico epiteliale è stato a lungo considerato come una singola malattia. Recentemente, tuttavia, si ritiene che ”tumore ovarico epiteliale” sia solo un termine generale che racchiude un gruppo di sottotipi istopatologici che condividono solo una comune localizzazione anatomica. In collaborazione con l’Istituto ”Mario Negri” di Milano, sono state raccolte le biopsie di 257 tumori ovarici epiteliali di stadio I e sono state stratificate in un training set e in un validation set. I dati di espressione di microRNA del training setsono stati analizzati con una specifica strategia di ricampionamento inferenziale con l’intento di trovare le firme molecolari specifiche di ogni istotipo. La qRT-PCR è stata utilizzata per validare i risultati sia nel training set che nel validation set. I nostri risultati mostrano come l’istotipo a cellule chiare sia caratterizzato da elevati livelli di espressione di miR-30a e miR-30a*, mentre l’istotipo mucinoso da elevati livelli di miR-192 e miR-194. Questi ultimi due microRNA sono marcatori riconosciuti e validati di tumore al colon, a sostegno dell’ipotesi che l’istotipo mucinoso sia una patologia molto diversa da gli altri istotipi ovarici piuttosto che di altri tumori mucinosi. E’ stato applicato, poi, un approccio integrativo che utilizzando i profili di espressione sia dei miRNA sia dei geni, sugli stessi campioni, ha permesso di identificare un circuito regolativo che si ritiene essere specifico dei pazienti mucinosi. Nel loro insieme, i nostri risultati dimostrano che i diversi istotipi di tumore ovarico epiteliale hanno circuiti regolatori distinti, inoltre ci permettono di affermare che attraverso l’uso di graphite abbiamo saputo affrontare in modo nuovo l’analisi integrata dei dati biologici, rivelando anche interessanti implicazioni terapeutiche per il tumore ovarico epiteliale.

The integration of gene and miRNA expression using pathway topology: a case study on Epithelial Ovarian Cancer / Calura, Enrica. - (2013 Jan 31).

The integration of gene and miRNA expression using pathway topology: a case study on Epithelial Ovarian Cancer

Calura, Enrica
2013

Abstract

I pathway sono descrizioni formali ed accurate dei processi biologici, che sono serie di eventi, finemente regolati, attraverso i quali la cellula opera trasformazioni su molecole o altri processi. Lo studio dell’espressione genica attraverso i pathway è definita come ”analisi di pathway” e cerca di identificare gruppi di geni correlati da un punto di vista funzionale con cambiamenti coordinati nell’espressione. Recentemente, la sua più promettente è stato il passaggio da algoritmi che considerano i pathway semplici elenchi di geni, ad algoritmi che sfruttano la topologia del pathway stesso, ovvero le reti delle connessioni geniche. Uno dei limiti di questi nuovi metodi di analisi è la mancanza dei pathway sotto forma di reti, in cui i nodi sono geni e gli archi sono le relazioni che intercorrono tra di essi. Durante il mio dottorato abbiamo sviluppato un interprete per i pathway, denominato graphite, in grado di memorizzare in modo uniforme, elaborare e convertire le informazioni contenute in essi. graphite è stato reso pubblicamente disponibile come pacchetto R all’interno della piattaforma Bioconductor. Nel campo d’indagine delle analisi topologiche, graphite colma il divario esistente tra gli aspetti tecnici e metodologici. graphite i) permette di eseguire analisi più avanzate dei dati omici e ii) consente lo sviluppo di nuovi metodi offrendo una maggiore e più facile accessibilità ai dati. Tuttavia, i pathway provenienti dalle quattro principali risorse pubbliche che sono state integrate in graphite (KEGG, Reactome, BioCarta e PID), mancano ancora di interattori cruciali: i microRNA. I microRNA sono piccoli RNA non codificanti che regolano l’espressione genica post-trascrizionale, la loro funzione sul target messaggero è repressiva ma il loro effetto generale sull’espressione va interpretato a seconda delle interazioni del contesto biologico in cui sono descritti, cioè della topologia del pathway in cui coinvolto il miRNA. Negli ultimi dieci anni, molti geni target di miRNA sono stati scoperti e validati sperimentalmente, informazioni a riguardo sono fornite in diversi database pubblici. Durante il mio dottorato ho lavorato su un’estensione del pacchetto graphite per integrare i microRNA all’interno dei pathway, i) collegando i miRNA ai loro geni target validati, ii) fornendo reti bipartite adatte per le analisi di pathway topologiche. Questo approccio è stato applicato allo studio di dati di espressione ottenuti da pazienti allo stadio iniziale di tumore ovarico epiteliale. Il tumore ovarico epiteliale è stato a lungo considerato come una singola malattia. Recentemente, tuttavia, si ritiene che ”tumore ovarico epiteliale” sia solo un termine generale che racchiude un gruppo di sottotipi istopatologici che condividono solo una comune localizzazione anatomica. In collaborazione con l’Istituto ”Mario Negri” di Milano, sono state raccolte le biopsie di 257 tumori ovarici epiteliali di stadio I e sono state stratificate in un training set e in un validation set. I dati di espressione di microRNA del training setsono stati analizzati con una specifica strategia di ricampionamento inferenziale con l’intento di trovare le firme molecolari specifiche di ogni istotipo. La qRT-PCR è stata utilizzata per validare i risultati sia nel training set che nel validation set. I nostri risultati mostrano come l’istotipo a cellule chiare sia caratterizzato da elevati livelli di espressione di miR-30a e miR-30a*, mentre l’istotipo mucinoso da elevati livelli di miR-192 e miR-194. Questi ultimi due microRNA sono marcatori riconosciuti e validati di tumore al colon, a sostegno dell’ipotesi che l’istotipo mucinoso sia una patologia molto diversa da gli altri istotipi ovarici piuttosto che di altri tumori mucinosi. E’ stato applicato, poi, un approccio integrativo che utilizzando i profili di espressione sia dei miRNA sia dei geni, sugli stessi campioni, ha permesso di identificare un circuito regolativo che si ritiene essere specifico dei pazienti mucinosi. Nel loro insieme, i nostri risultati dimostrano che i diversi istotipi di tumore ovarico epiteliale hanno circuiti regolatori distinti, inoltre ci permettono di affermare che attraverso l’uso di graphite abbiamo saputo affrontare in modo nuovo l’analisi integrata dei dati biologici, rivelando anche interessanti implicazioni terapeutiche per il tumore ovarico epiteliale.
31-gen-2013
Pathways are formal descriptions of the biological processes involving finely regulated structures by which a cell converts molecules or processes signals. The study of gene expression in terms of pathways is defined as pathway analysis and aims at identifying groups of functionally related genes that show coordinated expression changes. Recently, pathway analysis moved from algorithms using merely gene list to ones exploiting the topology that define gene connections. A crucial, and unfortunately limiting step for these novel methods are the availability of the pathways as gene networks in which nodes are genes and edges are the relations between two elements. To this aim, we develop a pathway data interpreter, called graphite, able to uniformly store, process and convert pathway information into gene networks. graphite has been made publicly available as R package within the Bioconductor platform. In the field of the topological pathway analysis, graphite fills the existing gap lying between technical and methodological aspects. graphite i) allows performing more informative analysis on omics data and ii) allows developing new methods based on the increased accessibil- ity of biological knowledge. However, the pathways of the four main public resources integrated into graphite (KEGG, Reactome, Biocarta and PID), still lack of crucial interactors: the microRNAs. The microRNAs are small non-coding RNAs that post-transcriptionally regulate gene expression, their function on the messenger target is repressive but their effect on the transcription is dependent of the topology of the pathway in which the miRNA is involved. In the last decade, many targets have been discovered and experimentally validated, dedicated databases are available providing these information. Thus, I worked on an extension of graphite package able to integrate microRNAs in pathway topology, i) linking the non-coding RNAs to their validated target genes, ii) providing integrated networks suitable for the topological pathway analyses. The feasibility of this approach has been validated on a specific biological context, the early stage of Epithelial Ovarian Cancer (EOC). EOC has long been considered as a single disease. The emerging opinion, however, sees ovarian cancer as a general term that encloses a group of histo-pathological subtypes sharing a common anatomic location. In collaboration with the Mario Negri institute, 257 stage I EOC tumour biopsies were collected and stratified into training and validation sets. miRNA microarray data was used to generate the most highly reproducible signatures for each histotype through a dedicated resampling inferential strategy. qRT- PCR was used to validate the results in both the training and validation set. The results indicate that the clear cell histotype is characterized by high expression levels of miR- 30a and miR-30a*, while mucinous patients by high levels of miR-192 and miR-194, interestingly as well as mucinous non-ovarian tissues. Then, the integrative approach that combines mRNA and miRNA profiles using graphite has been applied to identify the mucinous specific regulatory circuits. Taken together our findings demonstrate that EOC histotypes have discriminant regulatory circuits that drive the differentiation of the tumour environment. Our approach successfully guides us towards important biological results with interesting therapeutic implications in EOC.
microRNAs, pathway analysis, gene expression, Ovarian Cancer
The integration of gene and miRNA expression using pathway topology: a case study on Epithelial Ovarian Cancer / Calura, Enrica. - (2013 Jan 31).
File in questo prodotto:
File Dimensione Formato  
Calura_Enrica_Tesi.pdf

accesso aperto

Tipologia: Tesi di dottorato
Licenza: Non specificato
Dimensione 18.21 MB
Formato Adobe PDF
18.21 MB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11577/3423417
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact