1 LAnagrafe Comunale Soggetti/Oggetti/Relazioni Progetto ELI-CAT Gestione digitale integrata dei servizi locali in materia fiscale e catastale mediante modelli di cooperazione applicativa
2 Il duplice ruolo dellAnagrafe Comunale SOR
3 Anagrafe popolazione Anagrafe tributaria Edilizia PrivataTributi Atti unici NotaiUtenze ACI RDBMS INTERFACCIA ACSOR – Modulo BaseACSOR – Modulo Esteso ORCHESTRATORE LOCALE ACSACO RUP Il Modulo Base e di Estensione di ACSOR CHIAVE ESTERNA
4 Criteri di modellazione della componente ACS DATI ANAGRAFICI DIDENTIFICAZIONE INDIRIZZO DI RESIDENZA CODICE FISCALE RECAPITO PARTITA IVA RAPPRESENTANTE LEGALE SOGGETTO DA ANAG. POPOLAZIONE SOGGETTO DA CATASTO SOGGETTO DA ANAG. TRIBUTARIA SOGGETTO DA TRIBUTI Fonti Operazionali Riconciliate Blocco informativo e provenienza Soggetto ACS Codice Soggetto Codice Fiscale Nome Cognome Via Data ultimo agg. Civico Scala Interno …. Tipo soggetto RSSMRA70A01L103Q Mario Rossi Giuseppe Verdi 02/02/ …. Fisico Grado di certificazione Anagrafe popolazioneCatastoAnagrafe TributariaTributi
5 Criteri di modellazione della componente ACO Ogni singolo oggetto viene costruito a partire dallintegrazione delle singole fonti informative che ne detengono la conoscenza, ad es.: Sfruttare i processi di data cleaning & integration per migliorare il grado complessivo di qualità dei dati offerti, come nel caso della bonifica dei dati relativi allubicazione degli immobili gli identificativi catastali vengono desunti dallAgenzia del Territorio lubicazione dellimmobile (fino allinterno) viene recepito dallAnagrafe la superficie è ricavata dai dati metrici catastali e/o dallultima denuncia presentata a fini Tarsu (a seconda di quale sia il dato più attendibile) Uno degli obiettivi primari di ACO è quello di massimizzare la capacità di correlare la chiave toponomastica (via, civico, interno) con quella catastale (foglio, numero, subalterno) della definizione di un tipo oggetto generalizzato, che consente di raffrontare le destinazioni duso distintamente dichiarate nei singoli sistemi satellite della normalizzazione degli stadi spuri presenti nellarchivio dellAgenzia del Territorio
6 Le tecniche di data cleaning dellAnagrafe SOR Necessità di strumenti che consentano di raffrontare le informazioni non solo per identità di valori ma anche per similitudine Il Modulo Base di ACSOR integra un motore di riscontro incrociato, JMatcher, che consente lindividuazione di record anagrafici corrispondenti (record matching) anche solo per mera approssimazione Le diverse tecniche di data cleaning previste dal sistema: algoritmi di analisi della frase fondati sulla cosiddetta logica fuzzy correzioni di campi errati o assenti attraverso lutilizzo di tabelle di look-up o decodifica bonifica delle informazioni errate o assenti desumendole da altri campi correttamente valorizzati classificazione e normalizzazione delle informazioni, anche utilizzando algoritmi di analisi lessicale/sintattica delle stringhe
7 Esempio di utilizzo dellanalisi sintattica
8 Le tecniche di fusione approssimata di ACSOR lincrocio produce una serie di legami con gradi di similitudine diversi. I dati dei due oggetti sono relativamente simili (a meno della categoria e degli identificativi catastali) e quindi i pesi non si differenziano molto (80 per i legami A2-A2 e A10-A10, 60 per quelli A2-A10) analizzando tutti i modi possibili di attivare (mantenere validi) i legami generati otteniamo: 1) A2 – A2 e A10 – A10 produce = 160 su 200 2) A2 – A10 e A10 – A2 produce = 120 su 200 la soluzione scelta è dunque la prima (160 >> 120) ed è quella corretta 60 80