Background and Aims: The development of next-generation sequencing (NGS) technologies enabled the rapid identification of rare variants with large effect size and huge progress in understanding the basis of many genetic rare diseases. The need of organizing a great amount of new genetic informations determined the importance of using correct disease definitions and descriptions. Rare diseases are, in fact, low prevalence conditions with heterogeneous ways of presentation leading to risk of wrong or delayed diagnosis. Databases with accurate descriptions of phenotypes are strategic instruments to create data sharing, easier and faster diagnoses, correct treatments, improvement of social outcomes and quality of life. However, the fragmentation and the heterogeneity of registries (about 600 in Europe) limit the purpose. So our idea of creating a generalized clinical database for all rare diseases in order to: facilitate data sharing, exchange and compare informations, create standard operating procedures and support congruent policies and resources. We also focused attention to the great problem of undiagnosed patients. Methods: The first part of the project saw the creation of the generalized clinical database that was based on an existing model (the Veneto Regional Register of Rare Disorders) using the ICD or Orphanet RD Classification. It have a hierarchical logic using informations of main and secondary importance with potentially countless connections. In a second moment, we collected medical data of patients with diagnosed rare diseases (real cases) and without a diagnosis (undiagnosed patients). The last step of the project used the acquired data of real patients, integrated with informations coming from Literature’s records, in order to create expert mathematical systems (SAS System 9.4) able to diagnose diseases starting from phonotypical informations imputed in the database. The expert system was tested first in a closed group of diseases (three) and then to a group of eight conditions. Results: The database was created in 2014, clinicians stared imputing data in the same year. In the first two year of the project, we collected data about 1427 patients: 89% real cases and 11% undiagnosed patients. The clinical characteristics of the two populations were described and analyzed. Using data of the real cases, the expert system was created. It was validated using a simulated population of patients, with clinical features reported in modern Literature. The validation on the first group of diseases (three) showed a high learning ability (100%) and a low error in finding diagnoses (1.13%). The validation on the second group (eight diseases) had a high learning ability (98-99%) and well recognized 5/8 conditions. The system error in identifying correct diagnoses was high (32.9%): a great part of wrong cases (43.3%) were due to poor or nonspecific clinical descriptions, the remaining presented clinical features different from that reported in Literature. Removing the group of “nonspecific patients”, the error decreased to a 23%. Conclusions: The clinical database resulted a good instrument (“open system”): with its hierarchical logic it was adaptable to all centers, flexible, sustainable in costs and human resources, easy to manage and secure granting privacy. Data analysis, through the elaborations of filter systems, allowed to create profile of probability of diagnoses in 77% of patients enrolled in the database. The analysis of wrong diagnoses underlined the importance of a correct and complete description of phenotype using shared terms and definitions.

Presupposti e scopi: Nel campo delle malattie rare, e delle malattie genetiche in particolare, l’introduzione della tecnologia di Next-Generation Sequencing (NGS) ha rappresentato una rivoluzione senza precedenti, dando impulso all’acquisizione di nuove conoscenze: il numero di geni associati a malattie rare è in continua crescita. E’ crescituta al contempo la necessità di disporre di descrizioni chiare e standardizzate dei tratti fenotipici dei pazienti sia in ambito clinico-diagnostico che in ambito di ricerca. Nelle malattie rare esiste spesso una oggettiva maggiore difficoltà a porre diagnosi. Sono poche le malattie rare che si presentano con segni clinici patognomonici. Ne deriva il rischio di mancata o ritardata diagnosi di malattia. Il problema dei pazienti non diagnosticati è divenuto sempre più emergente. Partendo da queste considerazioni, abbiamo sviluppato l’idea di creare un registro generalizzato, valido cioè per tutte le patologie rare, adattabile alle singole realtà locali, sostenibile in termini di costi e di risorse umane, utile anche per lo studio della popolazione di pazienti rari senza diagnosi. Materiali e metodi: La realizzazione dello strumento analitico si è avvalsa del modello di registro già in uso nella nostra regione, il Registro per le Malattie Rare del Veneto. La cartella clinica informatizzata è stata creata utilizzando sistemi di classificazione basati su ICD o Orphanet RD Classification, utilizzando una logica gerarchica, caratterizzata da informazioni principali e secondarie in grado di relazionarsi le une con le altre in numero potenzialmente infinito. I dati dei pazienti con diagnosi e senza diagnosi, sono stati inseriti nel Registro da parte di specialisti afferenti a Centri Accreditati partecipanti allo studio. La numerosità del campione dei pazienti rari è stata arricchita utilizzando pazienti già arruolati nel Registro delle Malattie Rare del Veneto. Analisi più approfondite sono state effettuate mediante package statistico SAS System 9.4. Per la popolazione di pazienti affetti da malattia rara e arruolati nel progetto è stata effettuata un’analisi descrittiva. I dati relativi alla popolazione di pazienti rari, associati ai dati di frequenza di presentazione fenotipica estratti dalla Letteratura, sono stati successivamente utilizzati per la creazione di sistemi esperti capaci di porre diagnosi di malattia partendo dalle caratteristiche fenotipiche. Il sistema è stato applicato dapprima su un gruppo ristretto di patologie (tre), quindi su un gruppo di otto patologie rare. Risultati: Il database è stato creato nel 2014; nello stesso anno è stata avviata la raccolta dati. La popolazione di pazienti arruolati, nel primo biennio, è risultata essere pari a 1427 soggetti (518 afferenti ai centri Accreditati partecipanti, i restanti appartenenti al Registro delle Malattie Rare del Veneto); l’89% di questi pazienti è affetto da patologia rara nota, il restante da patologia non nota. Attraverso l’utilizzo di software statistici, è stata contemporaneamente generata una popolazione di pazienti simulati, per i due gruppi di patologie rare, da utilizzare per istruire e validare il sistema. I dati preliminari della validazione nel gruppo a tre patologie sono stati molto incoraggianti: il sistema ha infatti dimostrato di avere un alto grado di apprendimento (100%) e una bassa percentuale di errore nel riconoscimento della patolgia (1.13%). Nel gruppo a otto patologie, la validazione ha confermato un ottimo tasso di apprendimento (98-99%) e un soddisfacente tasso di riconoscimento per 5/8 patologie. L’errore nelle restanti tre patologie è tuttavia risultato elevato (32.9%). L’analisi delle errate diagnosi ha permesso di capire come il 43.3% (23/53) dei pazienti erano descritti da informazioni cliniche troppo scarse o generiche. Si è quindi proceduto ad eliminare tale sottogruppo. Nei restanti (30), il sistema ha attribuito una maggiore importanza a quei segni clinici presenti nella popolazione reale in percentuale diversa rispetto ai dati di Letteratura (discrepanza tra la nostra popolazione e i valori di prevalenza della Letteratura scientifica). L’ultima analisi (quella effettuata senza il sottogruppo di “pazienti poco descritti”), ha mostrato ottima capacità di apprendimento del sistema (99.8%) e tasso di errore globale più contenuto (23%). Conclusioni: La cartella clinica informatizzata è risultata essere uno strumento semplice, flessibile e adattabile alle singole realtà coinvolte, capace, allo stesso tempo, di garantire la sicurezza del dato e la sua tracciabilità. Presentando una struttura gerarchica, dotata di entità principali e secondarie, è stato in grado di delineare condizioni molto differenti tra loro (“sistema aperto”) pur mantenendo un alto grado di dettaglio descrittivo. Per quanto riguarda la messa a punto di un sistema esperto, capace di indirizzare il clinico verso una diagnosi corretta di malattia rara, le prime validazioni del sistema esperto hanno dato risultati promettenti individuando una diagnosi corretta nel 77% dei pazienti con malattia rara presenti nel sistema. L’analisi dei pazienti erroneamente identificati come affetti da una patologia diversa da quella di cui sono portatori ha delineato l’importanza di un’accurata descrizione delle informazioni cliniche inserite, riportando l’attenzione sullo sviluppo di termini e definizioni condivise, avvalendosi anche delle nuove ontologie sviluppate nell’ambito delle malattie rare.

PROGETTAZIONE DI UNA CARTELLA GENERALIZZATA UTILE A COSTRUIRE REGISTRI DI PATOLOGIE RARE / Rizzardi, Elena. - (2017 Jan 31).

PROGETTAZIONE DI UNA CARTELLA GENERALIZZATA UTILE A COSTRUIRE REGISTRI DI PATOLOGIE RARE

Rizzardi, Elena
2017

Abstract

Presupposti e scopi: Nel campo delle malattie rare, e delle malattie genetiche in particolare, l’introduzione della tecnologia di Next-Generation Sequencing (NGS) ha rappresentato una rivoluzione senza precedenti, dando impulso all’acquisizione di nuove conoscenze: il numero di geni associati a malattie rare è in continua crescita. E’ crescituta al contempo la necessità di disporre di descrizioni chiare e standardizzate dei tratti fenotipici dei pazienti sia in ambito clinico-diagnostico che in ambito di ricerca. Nelle malattie rare esiste spesso una oggettiva maggiore difficoltà a porre diagnosi. Sono poche le malattie rare che si presentano con segni clinici patognomonici. Ne deriva il rischio di mancata o ritardata diagnosi di malattia. Il problema dei pazienti non diagnosticati è divenuto sempre più emergente. Partendo da queste considerazioni, abbiamo sviluppato l’idea di creare un registro generalizzato, valido cioè per tutte le patologie rare, adattabile alle singole realtà locali, sostenibile in termini di costi e di risorse umane, utile anche per lo studio della popolazione di pazienti rari senza diagnosi. Materiali e metodi: La realizzazione dello strumento analitico si è avvalsa del modello di registro già in uso nella nostra regione, il Registro per le Malattie Rare del Veneto. La cartella clinica informatizzata è stata creata utilizzando sistemi di classificazione basati su ICD o Orphanet RD Classification, utilizzando una logica gerarchica, caratterizzata da informazioni principali e secondarie in grado di relazionarsi le une con le altre in numero potenzialmente infinito. I dati dei pazienti con diagnosi e senza diagnosi, sono stati inseriti nel Registro da parte di specialisti afferenti a Centri Accreditati partecipanti allo studio. La numerosità del campione dei pazienti rari è stata arricchita utilizzando pazienti già arruolati nel Registro delle Malattie Rare del Veneto. Analisi più approfondite sono state effettuate mediante package statistico SAS System 9.4. Per la popolazione di pazienti affetti da malattia rara e arruolati nel progetto è stata effettuata un’analisi descrittiva. I dati relativi alla popolazione di pazienti rari, associati ai dati di frequenza di presentazione fenotipica estratti dalla Letteratura, sono stati successivamente utilizzati per la creazione di sistemi esperti capaci di porre diagnosi di malattia partendo dalle caratteristiche fenotipiche. Il sistema è stato applicato dapprima su un gruppo ristretto di patologie (tre), quindi su un gruppo di otto patologie rare. Risultati: Il database è stato creato nel 2014; nello stesso anno è stata avviata la raccolta dati. La popolazione di pazienti arruolati, nel primo biennio, è risultata essere pari a 1427 soggetti (518 afferenti ai centri Accreditati partecipanti, i restanti appartenenti al Registro delle Malattie Rare del Veneto); l’89% di questi pazienti è affetto da patologia rara nota, il restante da patologia non nota. Attraverso l’utilizzo di software statistici, è stata contemporaneamente generata una popolazione di pazienti simulati, per i due gruppi di patologie rare, da utilizzare per istruire e validare il sistema. I dati preliminari della validazione nel gruppo a tre patologie sono stati molto incoraggianti: il sistema ha infatti dimostrato di avere un alto grado di apprendimento (100%) e una bassa percentuale di errore nel riconoscimento della patolgia (1.13%). Nel gruppo a otto patologie, la validazione ha confermato un ottimo tasso di apprendimento (98-99%) e un soddisfacente tasso di riconoscimento per 5/8 patologie. L’errore nelle restanti tre patologie è tuttavia risultato elevato (32.9%). L’analisi delle errate diagnosi ha permesso di capire come il 43.3% (23/53) dei pazienti erano descritti da informazioni cliniche troppo scarse o generiche. Si è quindi proceduto ad eliminare tale sottogruppo. Nei restanti (30), il sistema ha attribuito una maggiore importanza a quei segni clinici presenti nella popolazione reale in percentuale diversa rispetto ai dati di Letteratura (discrepanza tra la nostra popolazione e i valori di prevalenza della Letteratura scientifica). L’ultima analisi (quella effettuata senza il sottogruppo di “pazienti poco descritti”), ha mostrato ottima capacità di apprendimento del sistema (99.8%) e tasso di errore globale più contenuto (23%). Conclusioni: La cartella clinica informatizzata è risultata essere uno strumento semplice, flessibile e adattabile alle singole realtà coinvolte, capace, allo stesso tempo, di garantire la sicurezza del dato e la sua tracciabilità. Presentando una struttura gerarchica, dotata di entità principali e secondarie, è stato in grado di delineare condizioni molto differenti tra loro (“sistema aperto”) pur mantenendo un alto grado di dettaglio descrittivo. Per quanto riguarda la messa a punto di un sistema esperto, capace di indirizzare il clinico verso una diagnosi corretta di malattia rara, le prime validazioni del sistema esperto hanno dato risultati promettenti individuando una diagnosi corretta nel 77% dei pazienti con malattia rara presenti nel sistema. L’analisi dei pazienti erroneamente identificati come affetti da una patologia diversa da quella di cui sono portatori ha delineato l’importanza di un’accurata descrizione delle informazioni cliniche inserite, riportando l’attenzione sullo sviluppo di termini e definizioni condivise, avvalendosi anche delle nuove ontologie sviluppate nell’ambito delle malattie rare.
31-gen-2017
Background and Aims: The development of next-generation sequencing (NGS) technologies enabled the rapid identification of rare variants with large effect size and huge progress in understanding the basis of many genetic rare diseases. The need of organizing a great amount of new genetic informations determined the importance of using correct disease definitions and descriptions. Rare diseases are, in fact, low prevalence conditions with heterogeneous ways of presentation leading to risk of wrong or delayed diagnosis. Databases with accurate descriptions of phenotypes are strategic instruments to create data sharing, easier and faster diagnoses, correct treatments, improvement of social outcomes and quality of life. However, the fragmentation and the heterogeneity of registries (about 600 in Europe) limit the purpose. So our idea of creating a generalized clinical database for all rare diseases in order to: facilitate data sharing, exchange and compare informations, create standard operating procedures and support congruent policies and resources. We also focused attention to the great problem of undiagnosed patients. Methods: The first part of the project saw the creation of the generalized clinical database that was based on an existing model (the Veneto Regional Register of Rare Disorders) using the ICD or Orphanet RD Classification. It have a hierarchical logic using informations of main and secondary importance with potentially countless connections. In a second moment, we collected medical data of patients with diagnosed rare diseases (real cases) and without a diagnosis (undiagnosed patients). The last step of the project used the acquired data of real patients, integrated with informations coming from Literature’s records, in order to create expert mathematical systems (SAS System 9.4) able to diagnose diseases starting from phonotypical informations imputed in the database. The expert system was tested first in a closed group of diseases (three) and then to a group of eight conditions. Results: The database was created in 2014, clinicians stared imputing data in the same year. In the first two year of the project, we collected data about 1427 patients: 89% real cases and 11% undiagnosed patients. The clinical characteristics of the two populations were described and analyzed. Using data of the real cases, the expert system was created. It was validated using a simulated population of patients, with clinical features reported in modern Literature. The validation on the first group of diseases (three) showed a high learning ability (100%) and a low error in finding diagnoses (1.13%). The validation on the second group (eight diseases) had a high learning ability (98-99%) and well recognized 5/8 conditions. The system error in identifying correct diagnoses was high (32.9%): a great part of wrong cases (43.3%) were due to poor or nonspecific clinical descriptions, the remaining presented clinical features different from that reported in Literature. Removing the group of “nonspecific patients”, the error decreased to a 23%. Conclusions: The clinical database resulted a good instrument (“open system”): with its hierarchical logic it was adaptable to all centers, flexible, sustainable in costs and human resources, easy to manage and secure granting privacy. Data analysis, through the elaborations of filter systems, allowed to create profile of probability of diagnoses in 77% of patients enrolled in the database. The analysis of wrong diagnoses underlined the importance of a correct and complete description of phenotype using shared terms and definitions.
database, rare diseases, expert systems
PROGETTAZIONE DI UNA CARTELLA GENERALIZZATA UTILE A COSTRUIRE REGISTRI DI PATOLOGIE RARE / Rizzardi, Elena. - (2017 Jan 31).
File in questo prodotto:
File Dimensione Formato  
elena_rizzardi_tesi.pdf

accesso aperto

Tipologia: Tesi di dottorato
Licenza: Non specificato
Dimensione 2.22 MB
Formato Adobe PDF
2.22 MB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11577/3425373
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact