Gli studi di genomica hanno l’obiettivo di identificare posizione e funzione dei geni all’interno del genoma di organismi oggetto di interesse. Negli ultimi vent’anni, questo campo di ricerca è stato oggetto di vivace interesse, motivato dall’introduzione di microarray e tecnologie di sequenziamento, capaci di produrre enormi quantità di dati riguardanti diversi aspetti del genoma. In questo contesto, gli strumenti statistici si sono dimostrati necessari per supportare e in alcuni casi guidare la ricerca biologica, poco pratica o impossibile da condurre sull’intero insieme di dati prodotto dalle tecnologie di cui sopra. In questa Tesi, si introdurranno nuovi strumenti statistici per affrontare problemi noti nell’ambito genomico, come l’identificazione di geni differenzialmente espressi tramite dati di microarray, e l’analisi dei siti di legame nel contesto dei dati di ChIP-Seq. L’interesse specifico sarà l’inferenza sui quantili, motivato dalla loro interpretabilità, anche per distribuzioni dei dati dalle forme irregolari, e dal fatto che permettono di confrontare differenti aspetti della distribuzione dei dati. Si proporranno statistiche Studentizzate e pseudo-Studentizzate, la cui struttura richiama da vicino quella di un t-test classico, e si valuterà il loro comportamento attraverso studi di simulazione e applicazione su dati reali.

Quantile inference in genomic studies

MARAGONI, LORENZO
2014

Abstract

Gli studi di genomica hanno l’obiettivo di identificare posizione e funzione dei geni all’interno del genoma di organismi oggetto di interesse. Negli ultimi vent’anni, questo campo di ricerca è stato oggetto di vivace interesse, motivato dall’introduzione di microarray e tecnologie di sequenziamento, capaci di produrre enormi quantità di dati riguardanti diversi aspetti del genoma. In questo contesto, gli strumenti statistici si sono dimostrati necessari per supportare e in alcuni casi guidare la ricerca biologica, poco pratica o impossibile da condurre sull’intero insieme di dati prodotto dalle tecnologie di cui sopra. In questa Tesi, si introdurranno nuovi strumenti statistici per affrontare problemi noti nell’ambito genomico, come l’identificazione di geni differenzialmente espressi tramite dati di microarray, e l’analisi dei siti di legame nel contesto dei dati di ChIP-Seq. L’interesse specifico sarà l’inferenza sui quantili, motivato dalla loro interpretabilità, anche per distribuzioni dei dati dalle forme irregolari, e dal fatto che permettono di confrontare differenti aspetti della distribuzione dei dati. Si proporranno statistiche Studentizzate e pseudo-Studentizzate, la cui struttura richiama da vicino quella di un t-test classico, e si valuterà il loro comportamento attraverso studi di simulazione e applicazione su dati reali.
File in questo prodotto:
Non ci sono file associati a questo prodotto.
Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11577/3033161
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact