We concentrate on the statistical methods used in Biogeography for modelling the spatial distribution of bird species. Due to the difficulty of specifying a joint multivariate spatial covariance structure in environmental processes, we factor such a joint distribution into a series of conditional models linked together in a hierarchical framework. We have a process that corresponds to an unobservable map with the actual information about a bird species, and the data correspond to the observations that are connected to that process. Markov chain Monte Carlo (MCMC) simulation approaches are used for models involving multiple levels incorporating dependence structures. We use a Bayesian algorithm for drawing samples from the posterior distribution in order to obtain estimates of the parameters and reconstruct the true map based on data. We present different methods to overcome the problem of calculating the distribution of the Markov random field that is used in the MCMC algorithm. During the analysis it is desirable to delete some of the predictors from the model and only use a subset of covariates in the estimation procedure. We use the method by Kuo & Mallick (1998) (KM) for variable selection and combine it with multiple independent chains which successfully improves the mixing behaviour. In simulation studies we show the better performance of the pseudolikelihood over other likelihood approximation methods, and the good performance of the KM method with this type of data. We illustrate the application of the methods with the complete analysis of the spatial distribution of two bird species (Sturnella magna and Anas rubripes) based on a real data set. We show the advantages of using the hidden structure and the spatial interaction parameter in the spatial hidden Markov model over other simpler models, like the ordinary logistic model or the autologistic model without observation errors.

Ci concentriamo sui metodi statistici utilizzati in Biogeografia per modellare la distribuzione spaziale delle specie di uccelli. A causa della difficoltà nello specificare una struttura multivariata congiunta della covarianza spaziale nei processi ambientali, fattorizziamo tale distribuzione congiunta in una serie di modelli condizionati connessi asieme in un modello gerarchico. Abbiamo un processo che corrisponde ad una mappa non osservabile con le informazioni effettive su una specie di uccelli, ed i dati corrispondono alle osservazioni che sono collegate a tale processo. Vengono utilizzati gli approcci di simulazione Markov chain Monte Carlo (MCMC) per i modelli a più livelli che incorporano strutture di dipendenza. Usiamo un algoritmo Bayesiano per estrarre campioni dalla distribuzione a posteriori al fine di ottenere stime dei parametri e ricostruire la vera immagine basata sui dati. Presentiamo diversi metodi per superare il problema del calcolo della distribuzione del campo aleatorio markoviano che viene utilizzato nell’ algoritmo MCMC. Durante l’analisi, è opportuno eliminare alcuni predittori dal modello e utilizzare solo un sottoinsieme di covariate nella procedura di stima. Usiamo il metodo di Kuo & Mallick (1998) (KM) per la selezione delle variabili che, combinato all’uso dei più catene independenti, incrementa con successo il mixing delle catene. Negli studi di simulazione, presentiamo le migliori prestazioni della pseudo-verosimiglianza rispetto agli altri metodi di approssimazione e le buone prestazioni del metodo KM per queso tipo di dati. Illustriamo l’applicazione dei metodi con l’analisi completa della distribuzione spaziale di due specie di uccelli (Sturnella magna e Anas rubripes), basandoci su di un insieme di dati reale. Dimostriamo i vantaggi nell’uso della struttura latente e del parametro di interazione spaziale nel modello spaziale markoviano latente rispetto agli altri modelli più semplici, come l’ordinario modello logistico o il modello autologistico senza errori di osservazione.

Statistical models in biogeography / Alvarado Barrantes, Ricardo. - (2013 Jan 30).

Statistical models in biogeography

Alvarado Barrantes, Ricardo
2013

Abstract

Ci concentriamo sui metodi statistici utilizzati in Biogeografia per modellare la distribuzione spaziale delle specie di uccelli. A causa della difficoltà nello specificare una struttura multivariata congiunta della covarianza spaziale nei processi ambientali, fattorizziamo tale distribuzione congiunta in una serie di modelli condizionati connessi asieme in un modello gerarchico. Abbiamo un processo che corrisponde ad una mappa non osservabile con le informazioni effettive su una specie di uccelli, ed i dati corrispondono alle osservazioni che sono collegate a tale processo. Vengono utilizzati gli approcci di simulazione Markov chain Monte Carlo (MCMC) per i modelli a più livelli che incorporano strutture di dipendenza. Usiamo un algoritmo Bayesiano per estrarre campioni dalla distribuzione a posteriori al fine di ottenere stime dei parametri e ricostruire la vera immagine basata sui dati. Presentiamo diversi metodi per superare il problema del calcolo della distribuzione del campo aleatorio markoviano che viene utilizzato nell’ algoritmo MCMC. Durante l’analisi, è opportuno eliminare alcuni predittori dal modello e utilizzare solo un sottoinsieme di covariate nella procedura di stima. Usiamo il metodo di Kuo & Mallick (1998) (KM) per la selezione delle variabili che, combinato all’uso dei più catene independenti, incrementa con successo il mixing delle catene. Negli studi di simulazione, presentiamo le migliori prestazioni della pseudo-verosimiglianza rispetto agli altri metodi di approssimazione e le buone prestazioni del metodo KM per queso tipo di dati. Illustriamo l’applicazione dei metodi con l’analisi completa della distribuzione spaziale di due specie di uccelli (Sturnella magna e Anas rubripes), basandoci su di un insieme di dati reale. Dimostriamo i vantaggi nell’uso della struttura latente e del parametro di interazione spaziale nel modello spaziale markoviano latente rispetto agli altri modelli più semplici, come l’ordinario modello logistico o il modello autologistico senza errori di osservazione.
30-gen-2013
We concentrate on the statistical methods used in Biogeography for modelling the spatial distribution of bird species. Due to the difficulty of specifying a joint multivariate spatial covariance structure in environmental processes, we factor such a joint distribution into a series of conditional models linked together in a hierarchical framework. We have a process that corresponds to an unobservable map with the actual information about a bird species, and the data correspond to the observations that are connected to that process. Markov chain Monte Carlo (MCMC) simulation approaches are used for models involving multiple levels incorporating dependence structures. We use a Bayesian algorithm for drawing samples from the posterior distribution in order to obtain estimates of the parameters and reconstruct the true map based on data. We present different methods to overcome the problem of calculating the distribution of the Markov random field that is used in the MCMC algorithm. During the analysis it is desirable to delete some of the predictors from the model and only use a subset of covariates in the estimation procedure. We use the method by Kuo & Mallick (1998) (KM) for variable selection and combine it with multiple independent chains which successfully improves the mixing behaviour. In simulation studies we show the better performance of the pseudolikelihood over other likelihood approximation methods, and the good performance of the KM method with this type of data. We illustrate the application of the methods with the complete analysis of the spatial distribution of two bird species (Sturnella magna and Anas rubripes) based on a real data set. We show the advantages of using the hidden structure and the spatial interaction parameter in the spatial hidden Markov model over other simpler models, like the ordinary logistic model or the autologistic model without observation errors.
campo aleatorio markoviano latente selezione delle variabili MCMC distribuzione spaziale modello autologistico hidden Markov random field variable selection MCMC spatial distribution autologistic model
Statistical models in biogeography / Alvarado Barrantes, Ricardo. - (2013 Jan 30).
File in questo prodotto:
File Dimensione Formato  
Alvarado_Ricardo_Tesi.pdf

accesso aperto

Tipologia: Tesi di dottorato
Licenza: Non specificato
Dimensione 8.36 MB
Formato Adobe PDF
8.36 MB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11577/3423067
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact