Recent advancements in miniaturized fluorescence microscopy have made it possible to investigate neuronal responses to external stimuli in awake behaving animals through the analysis of intra-cellular calcium signals. An ongoing challenge is deconvolving the noisy calcium signals to extract the spike trains, and understanding how this activity is affected by external stimuli and conditions. In this thesis, we aim to provide novel approaches to tackle various aspects of the analysis of calcium imaging data within a Bayesian framework. Following the standard methodology to the analysis of calcium imaging data based on a two-stage approach, we investigate efficient computational methods to link the output of the deconvolved fluorescence traces with the experimental conditions. In particular, we focus on the use of Poisson regression models to relate the number of detected spikes with several covariates. Motivated by this framework, but with a general impact in terms of application to other fields, we develop an efficient Metropolis-Hastings and importance sampling algorithm to simulate from the posterior distribution of the parameters of Poisson log-linear models under conditional Gaussian priors, with superior performance with respect to the state-of-the-art alternatives. Motivated by the lack of clear uncertainty quantification resulting from the use of a two-stage approach, and the impossibility to borrow information between the two stages, we focus on the analysis of individual neurons, and develop a coherent mixture model that allows for estimation of spiking activity and, simultaneously, reconstructing the distributions of the calcium transient spikes' amplitudes under different experimental conditions. More specifically, our modeling framework leverages two nested layers of random discrete mixture priors to borrow information between experiments and discover similarities in the distributional patterns of the neuronal response to different stimuli. Finally, we move to the multivariate analysis of populations of neurons. Here the interest is not only to detect and analyze the spiking activity but also to investigate the existence of groups of co-activating neurons. Estimation of such groups is a challenging problem due to the need to deconvolve the calcium traces and then cluster the resulting latent binary time series of activity. We describe a nonparametric mixture model that allows for simultaneous deconvolution and clustering of time series based on common patterns of activity. The model makes use of a latent continuous process for the spike probabilities to identify groups of co-activating cells. Neurons' dependence is taken into account by informing the mixture weights with their spatial location, following the common neuroscience assumption that neighboring neurons often activate together.

Grazie alle recenti innovazioni tecnologiche nel campo della microscopia miniaturizzata e, in particolare, allo sviluppo di una speciale tecnica che permette di misurare otticamente il livello intra-cellulare di ioni di calcio, si è resa possibile l'analisi dell'attività neuronale in risposta alla stimolazione esterna in animali svegli e liberi di muoversi. Tuttavia, l'analisi del livello di fluorescenza osservato presenta diverse complessità. Una prima difficoltà deriva dalla necessità di estrarre le serie del segnale (i cosiddetti spike train), ovvero le serie di attività neuronale. Dopodiché, il segnale estratto deve essere messo in relazione con con le condizioni sperimentali che l'hanno generato. Con questa tesi si vogliono introdurre degli approcci innovativi per l'analisi di dati di imaging del calcio, nell'ambito di un'analisi statistica bayesiana. L'approccio classico all'analisi di dati di imaging del calcio si basa su una procedura in due passi: in una prima fase vengono estratti gli spike train; successivamente, queste serie vengono messe in relazione alle condizioni esterne. Muovendoci all'interno di questo contesto, ma con validità più generale in termini di ambiti di applicazione, si introducono dei nuovi metodi computazionali per stimare in modo efficiente la relazione tra il segnale osservato e le condizioni sperimentali. In particolare, si pone l'interesse su modelli di regressione di Poisson, comunemente usati per studiare la dipendenza del numero di attivazioni da un insieme di fattori esterni. Si sviluppano un algoritmo Metropolis-Hastings e un importance sampler per simulare dalla distribuzione a posteriori dei coefficienti di tali modelli, sotto l'assunzione di distribuzioni a priori Gaussiane (o condizionatamente Gaussiane) sui parametri di regressione. Un'analisi in due passi comporta alcuni svantaggi: per esempio, l'impossibilità di ottenere una chiara valutazione dell'incertezza complessiva, oltre all'impossibilità di condividere informazione tra le due fasi. Per questo motivo, ci focalizziamo sull'analisi di singoli neuroni e introduciamo un modello mistura che permette di stimare l'attività neuronale e, allo stesso tempo, di analizzare la distribuzione delle attivazioni in risposta a diverse condizioni sperimentali. In particolare, il modello proposto sfrutta una distribuzione a priori basata su due livelli annidati di misture finite, che permette di condividere l'informazione tra condizioni sperimentali, e indagare similitudini e differenze nella risposta ai diversi stimoli. Infine, si introduce un'analisi multivariata di popolazioni di neuroni. In questo contesto l'interesse non è volto solo ad analizzare le singole serie di attività, ma anche ad indagare l'esistenza di gruppi di neuroni con modelli di attivazioni simili. In questa tesi si introduce un modello mistura nonparametrico che permette di estrarre le serie delle attivazioni e, allo stesso tempo, di raggruppare i neuroni con un modello di attivazioni simile. Il modello si basa sull'introduzione di un processo latente continuo che descrive, per ogni istante temporale, la probabilità di osservare un'attivazione. Inoltre, per includere la dipendenza spaziale tra neuroni, i pesi della mistura sono funzione della distanza tra le cellule, come suggerito da diversi studi di neuroscienze.

Modellazione bayesiana di dati di calcium imaging / D'Angelo, Laura. - (2022 May 04).

Modellazione bayesiana di dati di calcium imaging

D'ANGELO, LAURA
2022

Abstract

Recent advancements in miniaturized fluorescence microscopy have made it possible to investigate neuronal responses to external stimuli in awake behaving animals through the analysis of intra-cellular calcium signals. An ongoing challenge is deconvolving the noisy calcium signals to extract the spike trains, and understanding how this activity is affected by external stimuli and conditions. In this thesis, we aim to provide novel approaches to tackle various aspects of the analysis of calcium imaging data within a Bayesian framework. Following the standard methodology to the analysis of calcium imaging data based on a two-stage approach, we investigate efficient computational methods to link the output of the deconvolved fluorescence traces with the experimental conditions. In particular, we focus on the use of Poisson regression models to relate the number of detected spikes with several covariates. Motivated by this framework, but with a general impact in terms of application to other fields, we develop an efficient Metropolis-Hastings and importance sampling algorithm to simulate from the posterior distribution of the parameters of Poisson log-linear models under conditional Gaussian priors, with superior performance with respect to the state-of-the-art alternatives. Motivated by the lack of clear uncertainty quantification resulting from the use of a two-stage approach, and the impossibility to borrow information between the two stages, we focus on the analysis of individual neurons, and develop a coherent mixture model that allows for estimation of spiking activity and, simultaneously, reconstructing the distributions of the calcium transient spikes' amplitudes under different experimental conditions. More specifically, our modeling framework leverages two nested layers of random discrete mixture priors to borrow information between experiments and discover similarities in the distributional patterns of the neuronal response to different stimuli. Finally, we move to the multivariate analysis of populations of neurons. Here the interest is not only to detect and analyze the spiking activity but also to investigate the existence of groups of co-activating neurons. Estimation of such groups is a challenging problem due to the need to deconvolve the calcium traces and then cluster the resulting latent binary time series of activity. We describe a nonparametric mixture model that allows for simultaneous deconvolution and clustering of time series based on common patterns of activity. The model makes use of a latent continuous process for the spike probabilities to identify groups of co-activating cells. Neurons' dependence is taken into account by informing the mixture weights with their spatial location, following the common neuroscience assumption that neighboring neurons often activate together.
Bayesian modeling of calcium imaging data
4-mag-2022
Grazie alle recenti innovazioni tecnologiche nel campo della microscopia miniaturizzata e, in particolare, allo sviluppo di una speciale tecnica che permette di misurare otticamente il livello intra-cellulare di ioni di calcio, si è resa possibile l'analisi dell'attività neuronale in risposta alla stimolazione esterna in animali svegli e liberi di muoversi. Tuttavia, l'analisi del livello di fluorescenza osservato presenta diverse complessità. Una prima difficoltà deriva dalla necessità di estrarre le serie del segnale (i cosiddetti spike train), ovvero le serie di attività neuronale. Dopodiché, il segnale estratto deve essere messo in relazione con con le condizioni sperimentali che l'hanno generato. Con questa tesi si vogliono introdurre degli approcci innovativi per l'analisi di dati di imaging del calcio, nell'ambito di un'analisi statistica bayesiana. L'approccio classico all'analisi di dati di imaging del calcio si basa su una procedura in due passi: in una prima fase vengono estratti gli spike train; successivamente, queste serie vengono messe in relazione alle condizioni esterne. Muovendoci all'interno di questo contesto, ma con validità più generale in termini di ambiti di applicazione, si introducono dei nuovi metodi computazionali per stimare in modo efficiente la relazione tra il segnale osservato e le condizioni sperimentali. In particolare, si pone l'interesse su modelli di regressione di Poisson, comunemente usati per studiare la dipendenza del numero di attivazioni da un insieme di fattori esterni. Si sviluppano un algoritmo Metropolis-Hastings e un importance sampler per simulare dalla distribuzione a posteriori dei coefficienti di tali modelli, sotto l'assunzione di distribuzioni a priori Gaussiane (o condizionatamente Gaussiane) sui parametri di regressione. Un'analisi in due passi comporta alcuni svantaggi: per esempio, l'impossibilità di ottenere una chiara valutazione dell'incertezza complessiva, oltre all'impossibilità di condividere informazione tra le due fasi. Per questo motivo, ci focalizziamo sull'analisi di singoli neuroni e introduciamo un modello mistura che permette di stimare l'attività neuronale e, allo stesso tempo, di analizzare la distribuzione delle attivazioni in risposta a diverse condizioni sperimentali. In particolare, il modello proposto sfrutta una distribuzione a priori basata su due livelli annidati di misture finite, che permette di condividere l'informazione tra condizioni sperimentali, e indagare similitudini e differenze nella risposta ai diversi stimoli. Infine, si introduce un'analisi multivariata di popolazioni di neuroni. In questo contesto l'interesse non è volto solo ad analizzare le singole serie di attività, ma anche ad indagare l'esistenza di gruppi di neuroni con modelli di attivazioni simili. In questa tesi si introduce un modello mistura nonparametrico che permette di estrarre le serie delle attivazioni e, allo stesso tempo, di raggruppare i neuroni con un modello di attivazioni simile. Il modello si basa sull'introduzione di un processo latente continuo che descrive, per ogni istante temporale, la probabilità di osservare un'attivazione. Inoltre, per includere la dipendenza spaziale tra neuroni, i pesi della mistura sono funzione della distanza tra le cellule, come suggerito da diversi studi di neuroscienze.
Modellazione bayesiana di dati di calcium imaging / D'Angelo, Laura. - (2022 May 04).
File in questo prodotto:
File Dimensione Formato  
tesi_definitiva_Laura_DAngelo.pdf

accesso aperto

Descrizione: tesi_definitiva_Laura_DAngelo
Tipologia: Tesi di dottorato
Dimensione 5.86 MB
Formato Adobe PDF
5.86 MB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11577/3454772
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact