ITACARE-3 Le differenze sociali della sopravvivenza dei tumori: i primi risultati del linkage tra dati di registro e dati di censimento Arduino Verdecchia 1, Riccardo Capocaccia 1, Viviana Egidi 2, Alessandra Reale 3, Michele Antonio Salvatore 2, Daniele Spizzichino 2 1 Istituto Superiore di Sanità, Viale Regina Elena 299, Roma 2 Università di Roma la Sapienza, Dipartimento di Scienze Demografiche, Via Nomentana 41, Roma 3 Istat, DCCG, Via A. Ravà 150, Roma
associazione tra i dati individuali dei casi diagnosticati, nel periodo , da 9 Registri Tumori provinciali (Firenze, Genova, Latina, Macerata, Modena, Parma, Ragusa, Sassari, Varese) e i dati individuali del Censimento della Popolazione 1991 (individui residenti in famiglia o in convivenza), al fine di studiare la sopravvivenza per tumore per classe sociale nelle diverse aree dei Registri Tumori. Obiettivi
Informazioni comuni ai due archivi Provincia e comune di residenza Indirizzo del luogo di residenza Sesso Data di nascita L indirizzo del luogo di residenza non è presente nei dati di censimento, ma consente, attraverso un sistema automatico per la codifica degli indirizzi (denominato SISTER), di individuare la sezione di censimento.
Fasi principali della procedura di linkage Normalizzazione e controllo dei dati dei Registri Tumori; Associazione tra i dati individuali dei Registri Tumori e quelli del censimento 1991; Riponderazione dei dati.
Schema della fase di analisi, normalizzazione e controllo dei dati
Risultati della fase di analisi, normalizzazione e controllo dei dati Registro Record disponibili Record con indirizzo Record normalizzati Record con codice di Sezione di censimento Firenze Genova Latina Macerata Modena Parma Ragusa Sassari Varese TOTALE
Chiave di linkage= {Parte fissa}U{Parte variabile} Parte fissa= {Comune di residenza, Anno di nascita } Parte variabile= {Sezione di censimento, Giorno di nascita, Mese di nascita, Sesso} Condizioni necessarie per poter associare due record r RT e c CP91 : 1. massimizzare il numero di modalità uguali; 2. la parte fissa della chiave deve coincidere; 3. possono non coincidere al più le modalità di una sola delle quattro variabili della parte variabile; 4. Lassociazione tra r e c deve essere biunivoca (uno ad uno); 5. I record implicati in associazioni non biunivoche (uno a molti) devono essere eliminati; Associazione tra i dati individuali dei Registri Tumori e quelli del censimento 1991
Passi sequenziali del linkage Associazione rispetto a: 1. tutte le variabili; 2. tutte le variabili esclusa la variabile SESSO; 3. tutte le variabili esclusa la variabile MESE DI NASCITA; 4. tutte le variabili esclusa la variabile GIORNO DI NASCITA; 5. tutte le variabili esclusa la SEZIONE DI CENSIMENTO. Associazione tra i dati individuali dei Registri Tumori e quelli del censimento 1991
Risultati della fase di associazione tra i dati individuali dei Registri Tumori e quelli del censimento 1991 Registro Record disponibili Record potenziali doppioni Record esatti non associati Record Errati (non as.) Record associati % Record associati (*) Firenze ,64 Genova ,68 Latina ,79 Macerata ,78 Modena ,99 Parma ,76 Ragusa ,44 Sassari ,01 Varese ,31 TOTALE ,06 * Al netto di doppioni ed errati
Risultati della fase di associazione tra i dati individuali dei Registri Tumori e quelli del censimento 1991 Pur con qualche differenza territoriale, la procedura di linkage ha dato risultati soddisfacenti, consentendo di accoppiare in media il 77% dei record. I record associati sono stati resi rappresentativi anche dei non associati, effettuando una riponderazione per mezzo di opportuni pesi, calcolati in funzione di due variabili ausiliarie: il sesso e la classe di età. Per ogni archivio, i record sono stati stratificati in funzione di queste due variabili. I pesi, calcolati per ogni singolo strato, sono pari al reciproco della probabilità di accoppiamento. La base informativa costruita consente di disporre simultaneamente delle informazioni dei registri e di tutte le informazioni di natura demografica, sociale ed economica rilevate al censimento.
Applicazione - analisi di sopravvivenza per: mammella, colon-retto e melanoma Analisi della sopravvivenza relativa, stratificata per le variabili di interesse (metodo di Hakulinen), casi incidenti , seguiti fino al Regressione multipla sulla sopravvivenza relativa (P. Dickman): Variabili indipendenti: 1.Registro 2.Intervalli (annuali) di follow-up 3.classe di età (15-44, 45-64, 65-99) 4.sesso 5.livello di istruzione (alto, basso) 6.tipologia familiare (singola/o, in famiglia)
Tumore della mammella, VARIABILELIVELLORER (Mod 1) F-u, cl_età, area RER (Mod 2) Mod 1+ istr, fam AreaFirenze (riferimento)11 Genova Latina Macerata Modena Parma0.86 Ragusa 6.99 * 6.75* Sassari Varese Scolaritàalta (riferimento)1.00 bassa 1.33* Tipologia familiarefamiglia (riferimento)1.00 singola/o1.16
Tumore del colon-retto, VARIABILELIVELLORER (Mod 1) F-u, cl_età, sex, area RER (Mod 2) Mod 1+ istr, fam AreaFirenze (riferimento)11 Genova Latina 1.36 * Macerata 1.27 * 1.26 * Modena1.11 Parma1.17 Ragusa 2.77 * 2.76 * Sassari 1.52 * Varese Scolaritàalta (riferimento)1 bassa1.10 Tipologia familiarefamiglia (riferimento)1 singola/o 0.86 *
Melanoma della pelle, VARIABILELIVELLORER (Mod 1) F-u, cl_età, sex, area RER (Mod 2) Mod 1+ istr, fam AreaFirenze (riferimento)11 Genova0.42*0.43* Latina Macerata Modena Parma0.66 Ragusa2.72*2.54 Sassari Varese0.51 Scolaritàalta (riferimento)1 bassa1.22 Tipologia familiarefamiglia (riferimento)1 singola/o1.32
Conclusioni Prima esplorazione sulla base del linkage definitivo; Conferma dellutilità di questa integrazione di dati; Qualità dei dati come limitazione del risultato; Si è sperimentata una procedura che si basa sullindirizzo per il linkage, promettente (>80%); Miglioramento della completezza e della qualità dellinformazione sulla residenza e delle basi di dati di cartografia fanno presagire un futuro migliore; Sarebbe auspicabile ripetere loperazione sui dati dei primi anni 2000 con il censimento 2001;