Our work has developed from a real epidemiological problem. The carcinogenic effect of cigarette smoking on head and neck cancer has been extensively studied in the literature highlighting a non linear dose-response relationship. Recently, the use of linear regression splines, within semiparametric models framework, has allowed an improvement in the evaluation of the association between smoking habits and head and neck cancer. Our work focuses on the development of a methodology able to improve several aspects of the estimation of the aforementioned relationship. In particular, the approximation of the spline function, represented by truncated linear basis, has been refined by addressing the problem of estimating two key quantities for the definition of a spline function: the number and position of the knots. The proposed methodology uses a Bayesian approach. We then focused on developing a streamlined methodology applicable to generalised linear models for cross-classified data. In particular, the steps necessary to calculate the covariance matrix are optimised with respect to one of the two random effects, allowing a computational gain both in terms of time and memory usage. The proposed algorithms are applied in the context of the inferential variational methods in detail to the mean field variational Bayes.

Il nostro lavoro si è sviluppato a partire da un problema epidemiologico reale. L’effetto carcinogenico del fumo di sigaretta sui tumori testa-collo è stato ampiamente studiato in letteratura evidenziando una relazione dose-risposta non lineare. Recentemente, l’utilizzo di spline lineari di regressione nell’ambito di modelli semiparametrici, ha permesso un miglioramento nella valutazione dell’associazione tra fumo e tumori testa-collo. Il nostro lavoro si concentra sullo sviluppo di una metodologia capace di migliorare la stima della suddetta relazione sotto diversi aspetti. In particolare, l'approssimazione della funzione spline, rappresentata attraverso basi lineari troncate, è stata affinata affrontando il problema di stima di due quantità chiave per sua la definizione: il numero e la posizione dei nodi. La metodologia proposta si serve di un approccio Bayesiano. Successivamente ci siamo concentrati sullo sviluppo di una metodologia streamline applicabile a modelli lineari generalizzati per dati con struttura cross-classified. In particolare, gli step necessari al calcolo della matrice di covarianza vengono ottimizzati rispetto ad uno dei due effetti random permettendo un guadagno computazionale sia in termini di tempo che di utilizzo della memoria. Gli algoritmi proposti vengono applicati nell’ambito dei metodi variazionali inferenziali nel dettaglio al mean field variational Bayes.

Some developments in semiparametric and cross-classified multilevel models / Di Credico, Gioia. - (2018 Nov 30).

### Some developments in semiparametric and cross-classified multilevel models

#### Abstract

Il nostro lavoro si è sviluppato a partire da un problema epidemiologico reale. L’effetto carcinogenico del fumo di sigaretta sui tumori testa-collo è stato ampiamente studiato in letteratura evidenziando una relazione dose-risposta non lineare. Recentemente, l’utilizzo di spline lineari di regressione nell’ambito di modelli semiparametrici, ha permesso un miglioramento nella valutazione dell’associazione tra fumo e tumori testa-collo. Il nostro lavoro si concentra sullo sviluppo di una metodologia capace di migliorare la stima della suddetta relazione sotto diversi aspetti. In particolare, l'approssimazione della funzione spline, rappresentata attraverso basi lineari troncate, è stata affinata affrontando il problema di stima di due quantità chiave per sua la definizione: il numero e la posizione dei nodi. La metodologia proposta si serve di un approccio Bayesiano. Successivamente ci siamo concentrati sullo sviluppo di una metodologia streamline applicabile a modelli lineari generalizzati per dati con struttura cross-classified. In particolare, gli step necessari al calcolo della matrice di covarianza vengono ottimizzati rispetto ad uno dei due effetti random permettendo un guadagno computazionale sia in termini di tempo che di utilizzo della memoria. Gli algoritmi proposti vengono applicati nell’ambito dei metodi variazionali inferenziali nel dettaglio al mean field variational Bayes.
##### Scheda breve Scheda completa Scheda completa (DC)
30-nov-2018
Our work has developed from a real epidemiological problem. The carcinogenic effect of cigarette smoking on head and neck cancer has been extensively studied in the literature highlighting a non linear dose-response relationship. Recently, the use of linear regression splines, within semiparametric models framework, has allowed an improvement in the evaluation of the association between smoking habits and head and neck cancer. Our work focuses on the development of a methodology able to improve several aspects of the estimation of the aforementioned relationship. In particular, the approximation of the spline function, represented by truncated linear basis, has been refined by addressing the problem of estimating two key quantities for the definition of a spline function: the number and position of the knots. The proposed methodology uses a Bayesian approach. We then focused on developing a streamlined methodology applicable to generalised linear models for cross-classified data. In particular, the steps necessary to calculate the covariance matrix are optimised with respect to one of the two random effects, allowing a computational gain both in terms of time and memory usage. The proposed algorithms are applied in the context of the inferential variational methods in detail to the mean field variational Bayes.
semiparametric models, bivariate regression splines, free-knots regression splines, streamlined variational inference, MFVB, head and neck cancers, cross-classified models
Some developments in semiparametric and cross-classified multilevel models / Di Credico, Gioia. - (2018 Nov 30).
File in questo prodotto:
File
DiCredico_Gioia_Thesis.pdf

accesso aperto

Tipologia: Tesi di dottorato
Licenza: Non specificato
Dimensione 14.11 MB
Utilizza questo identificativo per citare o creare un link a questo documento: `https://hdl.handle.net/11577/3424946`