Genomic studies aim at identifying genes’ location and function across the genome of living organisms of interest. In the last decades, this field of research has been the object of lively interest, motivated by the introduction of microarray and sequencing technologies, capable of providing huge amounts of data concern- ing several aspects of the genome. Statistical tools have proven to be necessary in this context, to support and sometimes lead biological investigation, impractical or impossible to be conducted over the whole set of data provided by the above men- tioned technologies. In this Thesis, we introduce novel statistical tools for dealing with well-known problems in the genomic field, such as identifying differential expression in microarray data, and evaluating differential binding in the context of ChIP-Seq data. Our specific interest will be inference on quantiles, motivated by their interpretability, even for irregularly shaped distributions of the data, and by the fact that they allow to compare different aspects of the whole distribution of the data. We propose Studentized and pseudo-Studentized statistics, whose struc- ture resembles closely that of a classic t-test, and evaluate their performances via simulated studies and application to real data.

Gli studi di genomica hanno l’obiettivo di identificare posizione e funzione dei geni all’interno del genoma di organismi oggetto di interesse. Negli ultimi vent’anni, questo campo di ricerca e` stato oggetto di vivace interesse, motivato dall’introduzione di microarray e tecnologie di sequenziamento, capaci di produrre enormi quantità di dati riguardanti diversi aspetti del genoma. In questo contesto, gli strumenti statistici si sono dimostrati necessari per supportare e in alcuni casi guidare la ricerca biologica, poco pratica o impossibile da condurre sull’intero insieme di dati prodotto dalle tecnologie di cui sopra. In questa Tesi, si introdurranno nuovi strumenti statistici per affrontare problemi noti nell’ambito genomico, come l’identificazione di geni differenzialmente espressi tramite dati di microarray, e l’analisi dei siti di legame nel contesto dei dati di ChIP-Seq. L’interesse specifico sara` l’inferenza sui quantili, motivato dalla loro interpretabilità, anche per distribuzioni dei dati dalle forme irregolari, e dal fatto che permettono di confrontare differenti aspetti della distribuzione dei dati. Si proporranno statistiche Studentizzate e pseudo-Studentizzate, la cui struttura richiama da vicino quella di un t-test classico, e si valuterà il loro comportamento attraverso studi di simulazione e applicazione su dati reali.

Quantile Inference In Genomic Studies / Maragoni, Lorenzo. - (2014 Jul 31).

Quantile Inference In Genomic Studies

Maragoni, Lorenzo
2014

Abstract

Gli studi di genomica hanno l’obiettivo di identificare posizione e funzione dei geni all’interno del genoma di organismi oggetto di interesse. Negli ultimi vent’anni, questo campo di ricerca e` stato oggetto di vivace interesse, motivato dall’introduzione di microarray e tecnologie di sequenziamento, capaci di produrre enormi quantità di dati riguardanti diversi aspetti del genoma. In questo contesto, gli strumenti statistici si sono dimostrati necessari per supportare e in alcuni casi guidare la ricerca biologica, poco pratica o impossibile da condurre sull’intero insieme di dati prodotto dalle tecnologie di cui sopra. In questa Tesi, si introdurranno nuovi strumenti statistici per affrontare problemi noti nell’ambito genomico, come l’identificazione di geni differenzialmente espressi tramite dati di microarray, e l’analisi dei siti di legame nel contesto dei dati di ChIP-Seq. L’interesse specifico sara` l’inferenza sui quantili, motivato dalla loro interpretabilità, anche per distribuzioni dei dati dalle forme irregolari, e dal fatto che permettono di confrontare differenti aspetti della distribuzione dei dati. Si proporranno statistiche Studentizzate e pseudo-Studentizzate, la cui struttura richiama da vicino quella di un t-test classico, e si valuterà il loro comportamento attraverso studi di simulazione e applicazione su dati reali.
31-lug-2014
Genomic studies aim at identifying genes’ location and function across the genome of living organisms of interest. In the last decades, this field of research has been the object of lively interest, motivated by the introduction of microarray and sequencing technologies, capable of providing huge amounts of data concern- ing several aspects of the genome. Statistical tools have proven to be necessary in this context, to support and sometimes lead biological investigation, impractical or impossible to be conducted over the whole set of data provided by the above men- tioned technologies. In this Thesis, we introduce novel statistical tools for dealing with well-known problems in the genomic field, such as identifying differential expression in microarray data, and evaluating differential binding in the context of ChIP-Seq data. Our specific interest will be inference on quantiles, motivated by their interpretability, even for irregularly shaped distributions of the data, and by the fact that they allow to compare different aspects of the whole distribution of the data. We propose Studentized and pseudo-Studentized statistics, whose struc- ture resembles closely that of a classic t-test, and evaluate their performances via simulated studies and application to real data.
quantile inference, hypothesis testing, microarray, chip-seq
Quantile Inference In Genomic Studies / Maragoni, Lorenzo. - (2014 Jul 31).
File in questo prodotto:
File Dimensione Formato  
maragoni_lorenzo_thesis.pdf

accesso aperto

Tipologia: Tesi di dottorato
Licenza: Non specificato
Dimensione 3.26 MB
Formato Adobe PDF
3.26 MB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11577/3424071
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact