The primary objective was to estimate the cumulative incidence function (CIF), defined as the probability of occurrence of the main event of interest over time, allowing patients to be censored or to fail from competing events. The CIF is often of great interest in medical research and can be estimated by different regression models and inferential approaches. The performance among cause-specific hazard (CSH), sub-distribution hazard (SDH), pseudo-value, and binomial regression approaches were compared using a simulation study in the presence of competing risks survival data. The empirical bias was found higher under some of these approaches. However, no substantial differences between the estimated and empirical standard errors of the estimators, were reported among the regression approaches, and this is essential in clinical studies to establish a treatment effect with precision. Meanwhile, a slight under-estimation was observed only for the pseudovalue approach. It was found that time-varying regression coefficients improve the coverage probability under the binomial approach. Furthermore, the binomial and pseudo-value approaches showed a gain in efficiency compared to the CSH approach. Additionally, a real data application was illustrated for estimating the CIF of dying from Covid-19 as well as for other causes. Several risk factors and patient characteristics such as sex, age, and race, were found to increase significantly the cumulative risk of death due to Covid. SDH and CSH approaches showed very similar model-based predictions of CIF. Another objective of the thesis was to give guidelines to a new user for estimating the sample size under a fixed design and a group sequential (Gs) design, following the CSH and SDH approaches. For this scope, several simulation studies were performed. The Weibull, exponential, and Gompertz time-to-event distributions were studied under fixed design. When there was a positive treatment effect on the competing event, CSH provided a smaller required sample size than the SDH approach, given a fixed power for all these distributions. Under Gs design, the contribution of a new treatment was studied by analyzing interim stage clinical data under various competing risks scenarios. Within this scope, efficacy and futility boundaries were computed, and the decision to continue or stop a trial was taken by calculating the conditional power. It was concluded that the SDH approach could be preferred when the main attention is devoted to increasing conditional power, and on the other hand, CSH is the best choice when the main focus is to reduce the required number of events.

L'obiettivo principale della tesi è stato quello di stimare la funzione d'incidenza cumulata (CIF), definita come la probabilità cumulata che accada l'evento di interesse nel tempo, sotto la condizione che i soggetti possano essere censurati a destra o sperimentare altri eventi competitivi. La CIF è spesso di grande interesse nella ricerca medica e può essere stimata con diversi modelli di regressione ed approcci inferenziali. È stato condotto uno studio di simulazione per confrontare le prestazioni tra diversi approcci in presenza di dati di sopravvivenza con rischi competitivi: modelli per i rischi causa-specifici (CSH), modelli per i rischi della sotto-distribuzione (SDH), modelli basati sui pseudovalori e modelli di regressione binomiale. Si è trovato che la distorsione empirica è maggiore in alcuni degli approcci considerati. Tuttavia, non è stata rilevata alcuna differenza sostanziale tra gli errori standard stimati e quelli empirici, e ciò è essenziale negli studi clinici che hanno lo scopo di stabilire con precisione l'effetto di un intervento. Il solo approccio basato sui pseudovalori ha mostrato una lieve sottostima. È stato trovato che l'uso di coefficienti di regressione tempo-dipendenti nell'approccio binomiale, migliora le probabilità di copertura. Inoltre, si è constatato che l’approccio binomiale e quello basato sui pseudovalori conducono ad una maggiore efficienza statistica degli stimatori, rispetto al metodo CSH. Infine, è stata riportata un'applicazione su dati reali con lo scopo di stimare la CIF per la mortalità dovuta al Covid-19 come anche la mortalità dovuta ad altre cause. È stato trovato che diversi fattori di rischio e caratteristiche dei pazienti, quali sesso, età e razza, aumentano significativamente il rischio cumulato di morte per il Covid. Gli approcci SDH e CSH hanno mostrato risultati molto simili per quanto riguarda le previsioni della CIF basate sul modello di regressione. Un secondo obiettivo della tesi è stato quello di fornire linee guida per stimare la dimensione campionaria sotto un disegno fisso e sotto un disegno sequenziale a gruppi (Gs) seguendo gli approcci CSH e SDH. Per questo scopo, sono stati condotti diversi studi di simulazione. Abbiamo studiato le distribuzioni esponenziale, Weibull e Gompertz per il tempo all'evento, sotto un disegno fisso. Sotto l'ipotesi che si sia verificato un effetto positivo del trattamento sull'evento competitivo, l'approccio CSH ha fornito una dimensione campionaria richiesta inferiore rispetto all'approccio SDH, data una certa potenza fissata per tutte le distribuzioni. Nell'ambito dei disegni Gs, abbiamo studiato il contributo di un nuovo trattamento analizzando i dati clinici nei successivi stadi intermedii (interim), sotto diversi scenari di rischi competitivi. In questo ambito, sono stati calcolati i limiti di efficacia e futilità, e la decisione di continuare o interrompere lo studio è stata presa sulla base della funzione di potenza condizionata, calcolata ai vari stadi sequenziali. Abbiamo concluso che l'approccio SDH potrebbe essere preferito quando l'attenzione principale è rivolta all'aumento della potenza condizionata e, allo stesso tempo, si ha preferenza per il metodo CSH quando si mira principalmente a ridurre il numero richiesto di eventi.

Modelli di predizione per funzioni d'incidenza cumulata e calcolo della dimensione campionaria per dati di sopravvivenza con rischi competitivi / Haque, MOHAMMAD ANAMUL. - (2022 Jun 28).

Modelli di predizione per funzioni d'incidenza cumulata e calcolo della dimensione campionaria per dati di sopravvivenza con rischi competitivi

HAQUE, MOHAMMAD ANAMUL
2022

Abstract

The primary objective was to estimate the cumulative incidence function (CIF), defined as the probability of occurrence of the main event of interest over time, allowing patients to be censored or to fail from competing events. The CIF is often of great interest in medical research and can be estimated by different regression models and inferential approaches. The performance among cause-specific hazard (CSH), sub-distribution hazard (SDH), pseudo-value, and binomial regression approaches were compared using a simulation study in the presence of competing risks survival data. The empirical bias was found higher under some of these approaches. However, no substantial differences between the estimated and empirical standard errors of the estimators, were reported among the regression approaches, and this is essential in clinical studies to establish a treatment effect with precision. Meanwhile, a slight under-estimation was observed only for the pseudovalue approach. It was found that time-varying regression coefficients improve the coverage probability under the binomial approach. Furthermore, the binomial and pseudo-value approaches showed a gain in efficiency compared to the CSH approach. Additionally, a real data application was illustrated for estimating the CIF of dying from Covid-19 as well as for other causes. Several risk factors and patient characteristics such as sex, age, and race, were found to increase significantly the cumulative risk of death due to Covid. SDH and CSH approaches showed very similar model-based predictions of CIF. Another objective of the thesis was to give guidelines to a new user for estimating the sample size under a fixed design and a group sequential (Gs) design, following the CSH and SDH approaches. For this scope, several simulation studies were performed. The Weibull, exponential, and Gompertz time-to-event distributions were studied under fixed design. When there was a positive treatment effect on the competing event, CSH provided a smaller required sample size than the SDH approach, given a fixed power for all these distributions. Under Gs design, the contribution of a new treatment was studied by analyzing interim stage clinical data under various competing risks scenarios. Within this scope, efficacy and futility boundaries were computed, and the decision to continue or stop a trial was taken by calculating the conditional power. It was concluded that the SDH approach could be preferred when the main attention is devoted to increasing conditional power, and on the other hand, CSH is the best choice when the main focus is to reduce the required number of events.
Model-based prediction on cumulative incidence functions and sample size calculation for competing risks survival data
28-giu-2022
L'obiettivo principale della tesi è stato quello di stimare la funzione d'incidenza cumulata (CIF), definita come la probabilità cumulata che accada l'evento di interesse nel tempo, sotto la condizione che i soggetti possano essere censurati a destra o sperimentare altri eventi competitivi. La CIF è spesso di grande interesse nella ricerca medica e può essere stimata con diversi modelli di regressione ed approcci inferenziali. È stato condotto uno studio di simulazione per confrontare le prestazioni tra diversi approcci in presenza di dati di sopravvivenza con rischi competitivi: modelli per i rischi causa-specifici (CSH), modelli per i rischi della sotto-distribuzione (SDH), modelli basati sui pseudovalori e modelli di regressione binomiale. Si è trovato che la distorsione empirica è maggiore in alcuni degli approcci considerati. Tuttavia, non è stata rilevata alcuna differenza sostanziale tra gli errori standard stimati e quelli empirici, e ciò è essenziale negli studi clinici che hanno lo scopo di stabilire con precisione l'effetto di un intervento. Il solo approccio basato sui pseudovalori ha mostrato una lieve sottostima. È stato trovato che l'uso di coefficienti di regressione tempo-dipendenti nell'approccio binomiale, migliora le probabilità di copertura. Inoltre, si è constatato che l’approccio binomiale e quello basato sui pseudovalori conducono ad una maggiore efficienza statistica degli stimatori, rispetto al metodo CSH. Infine, è stata riportata un'applicazione su dati reali con lo scopo di stimare la CIF per la mortalità dovuta al Covid-19 come anche la mortalità dovuta ad altre cause. È stato trovato che diversi fattori di rischio e caratteristiche dei pazienti, quali sesso, età e razza, aumentano significativamente il rischio cumulato di morte per il Covid. Gli approcci SDH e CSH hanno mostrato risultati molto simili per quanto riguarda le previsioni della CIF basate sul modello di regressione. Un secondo obiettivo della tesi è stato quello di fornire linee guida per stimare la dimensione campionaria sotto un disegno fisso e sotto un disegno sequenziale a gruppi (Gs) seguendo gli approcci CSH e SDH. Per questo scopo, sono stati condotti diversi studi di simulazione. Abbiamo studiato le distribuzioni esponenziale, Weibull e Gompertz per il tempo all'evento, sotto un disegno fisso. Sotto l'ipotesi che si sia verificato un effetto positivo del trattamento sull'evento competitivo, l'approccio CSH ha fornito una dimensione campionaria richiesta inferiore rispetto all'approccio SDH, data una certa potenza fissata per tutte le distribuzioni. Nell'ambito dei disegni Gs, abbiamo studiato il contributo di un nuovo trattamento analizzando i dati clinici nei successivi stadi intermedii (interim), sotto diversi scenari di rischi competitivi. In questo ambito, sono stati calcolati i limiti di efficacia e futilità, e la decisione di continuare o interrompere lo studio è stata presa sulla base della funzione di potenza condizionata, calcolata ai vari stadi sequenziali. Abbiamo concluso che l'approccio SDH potrebbe essere preferito quando l'attenzione principale è rivolta all'aumento della potenza condizionata e, allo stesso tempo, si ha preferenza per il metodo CSH quando si mira principalmente a ridurre il numero richiesto di eventi.
Modelli di predizione per funzioni d'incidenza cumulata e calcolo della dimensione campionaria per dati di sopravvivenza con rischi competitivi / Haque, MOHAMMAD ANAMUL. - (2022 Jun 28).
File in questo prodotto:
File Dimensione Formato  
tesi_definitiva_Mohammad_Anamul_Haque.pdf

Open Access dal 29/12/2023

Descrizione: tesi_definitiva_Mohammad_Anamul_Haque
Tipologia: Tesi di dottorato
Dimensione 1.64 MB
Formato Adobe PDF
1.64 MB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11577/3459381
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact