Nowadays, the increasing dimension and complexity of real data problems pose hard theoretical and practical challenges to researchers working in any field of science. The study of complex non-linear, eventually non-observable, phenomena deserves the development of new mathematical and statistical techniques able to explain the actual empirical evidence, taking into account of different sources of information. On the other hand, technological constraints may limit our capabilities to process massive multidimensional datasets in a reasonable amount of time and not exceeding the available memory space. For these reasons, the continuous development of new flexible models, reliable estimation methods and efficient algorithms is of prominent importance from an applied point of view. In this thesis, we try to address some of these methodological issues, proposing two original contributions, an algorithmic one and a modelling one. In the first part of this thesis, we consider the estimation of robust regression models within a Bayesian inferential framework. In this case, we propose a new deterministic variational approximation for general posterior distributions, which build upon alternative methods in the literature, improving their performances in terms of accuracy. We then discuss several extensions and generalizations, so that to enlarge the range of application of the proposed method. In the second part of this thesis, we study a new quantile regression model for heterogeneous data gathered on spatial, possibly complex, domains. To this end, we adopt a nonparametric penalized regression approach with differential regularization, which allow us to incorporate additional spatial information in the form of a partial differential equation. Upon that, we develop a new computational estimation method and we analyze the theoretical and empirical properties of the proposed estimator, showing its comparative advantages with respect to state-of-the-art methods in the literature.

Al giorno d’oggi, la crescente dimensionalità e complessità dei dati generati da problemi applicativi reali pone nuove sfide teoriche e pratiche ai ricercatori che operano in qualsiasi campo della scienza. Lo studio di fenomeni non lineari, e tal volta non osservabili, richiede lo sviluppo di nuove tecniche matematiche e statistiche in grado di spiegare l’evidenza empirica attuale tenendo conto di varie fonti d’informazione. D’altra parte, vincoli tecnologici possono limitare le nostre capacità di elaborazione d’insiemi di dati complessi in un tempo ragionevole e senza eccedere lo spazio di memoria disponibile. Per queste ragioni, il continuo sviluppo di modelli flessibili, metodi di stima robusti e algoritmi efficienti `e di primaria importanza dal punto di vista applicativo. In questa tesi, cerchiamo di affrontare alcuni di questi problemi metodologici, proponendo due contributi originali, il primo algoritmico e il secondo modellistico. Nella prima parte di questa tesi, viene considerata la stima di modelli di regressione robusti in una cornice inferenziale Bayesiana. In questo caso, proponiamo una nuova approssimazione variazionale deterministica per distribuzioni a posteriori generalizzate, la quale, costruendo su metodi esistenti in letteratura, ne migliora le prestazioni in termini di accuratezza. Discutiamo poi numerose estensioni e generalizzazioni, al fine di ampliare lo spettro di applicazione di tale metodo. Nella seconda parte di questa tesi, studiamo un nuovo modello di regressione quantilica per dati raccolti su domini spaziali, possibilmente complessi. A tal fine, proponiamo un approccio di regressione nonparametrica penalizzata con regolarizzazione differenziale, la quale permette d’incorporare informazione spaziale aggiuntiva in forma di equazioni alle derivate parziali. Sviluppiamo poi questo problema, sia in termini computazionali che di analisi teorica ed empirica delle proprietà dello stimatore, mostrandone limiti e vantaggi comparati rispetto a metodi alternativi presenti in letteratura.

Inferenza approssimata per modelli di regressione additivi e ad effetti misti mal specificati / Castiglione, Cristian. - (2023 May 02).

Inferenza approssimata per modelli di regressione additivi e ad effetti misti mal specificati

CASTIGLIONE, CRISTIAN
2023

Abstract

Nowadays, the increasing dimension and complexity of real data problems pose hard theoretical and practical challenges to researchers working in any field of science. The study of complex non-linear, eventually non-observable, phenomena deserves the development of new mathematical and statistical techniques able to explain the actual empirical evidence, taking into account of different sources of information. On the other hand, technological constraints may limit our capabilities to process massive multidimensional datasets in a reasonable amount of time and not exceeding the available memory space. For these reasons, the continuous development of new flexible models, reliable estimation methods and efficient algorithms is of prominent importance from an applied point of view. In this thesis, we try to address some of these methodological issues, proposing two original contributions, an algorithmic one and a modelling one. In the first part of this thesis, we consider the estimation of robust regression models within a Bayesian inferential framework. In this case, we propose a new deterministic variational approximation for general posterior distributions, which build upon alternative methods in the literature, improving their performances in terms of accuracy. We then discuss several extensions and generalizations, so that to enlarge the range of application of the proposed method. In the second part of this thesis, we study a new quantile regression model for heterogeneous data gathered on spatial, possibly complex, domains. To this end, we adopt a nonparametric penalized regression approach with differential regularization, which allow us to incorporate additional spatial information in the form of a partial differential equation. Upon that, we develop a new computational estimation method and we analyze the theoretical and empirical properties of the proposed estimator, showing its comparative advantages with respect to state-of-the-art methods in the literature.
Approximate inference for misspecified additive and mixed regression models
2-mag-2023
Al giorno d’oggi, la crescente dimensionalità e complessità dei dati generati da problemi applicativi reali pone nuove sfide teoriche e pratiche ai ricercatori che operano in qualsiasi campo della scienza. Lo studio di fenomeni non lineari, e tal volta non osservabili, richiede lo sviluppo di nuove tecniche matematiche e statistiche in grado di spiegare l’evidenza empirica attuale tenendo conto di varie fonti d’informazione. D’altra parte, vincoli tecnologici possono limitare le nostre capacità di elaborazione d’insiemi di dati complessi in un tempo ragionevole e senza eccedere lo spazio di memoria disponibile. Per queste ragioni, il continuo sviluppo di modelli flessibili, metodi di stima robusti e algoritmi efficienti `e di primaria importanza dal punto di vista applicativo. In questa tesi, cerchiamo di affrontare alcuni di questi problemi metodologici, proponendo due contributi originali, il primo algoritmico e il secondo modellistico. Nella prima parte di questa tesi, viene considerata la stima di modelli di regressione robusti in una cornice inferenziale Bayesiana. In questo caso, proponiamo una nuova approssimazione variazionale deterministica per distribuzioni a posteriori generalizzate, la quale, costruendo su metodi esistenti in letteratura, ne migliora le prestazioni in termini di accuratezza. Discutiamo poi numerose estensioni e generalizzazioni, al fine di ampliare lo spettro di applicazione di tale metodo. Nella seconda parte di questa tesi, studiamo un nuovo modello di regressione quantilica per dati raccolti su domini spaziali, possibilmente complessi. A tal fine, proponiamo un approccio di regressione nonparametrica penalizzata con regolarizzazione differenziale, la quale permette d’incorporare informazione spaziale aggiuntiva in forma di equazioni alle derivate parziali. Sviluppiamo poi questo problema, sia in termini computazionali che di analisi teorica ed empirica delle proprietà dello stimatore, mostrandone limiti e vantaggi comparati rispetto a metodi alternativi presenti in letteratura.
Inferenza approssimata per modelli di regressione additivi e ad effetti misti mal specificati / Castiglione, Cristian. - (2023 May 02).
File in questo prodotto:
File Dimensione Formato  
tesi_definitiva_Cristian_Castiglione.pdf

accesso aperto

Descrizione: Tesi definitiva
Tipologia: Tesi di dottorato
Dimensione 6.02 MB
Formato Adobe PDF
6.02 MB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11577/3478313
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact