UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA FACOLTÀ DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA INFORMATICA Relatore: Chiar.mo Prof. Paolo Tiberio Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Agostino Cardella Tesi di Laurea Correlatore: Dott. Federica Mandreoli Ing. Riccardo Martoglia Controrelatore: Chiar.mo Prof. Sonia Bergamaschi Anno Accademico 2003/2004
Tecniche di Semantic Web per la gestione dellidentità digitale e laccesso alle norme (nellambito del progetto MIUR-PRIN denominato e-gov) Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Ambito di ricerca Obiettivo Agevolare la partecipazione del cittadino alleGovernance Servizio scelto: Accesso ai testi normativi Personalizzazione: Reperimento e ricostruzione delle norme valide ed applicabili al cittadino in base alla sua identità digitale
Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Obiettivi della tesi Ontologia Definizione di unontologia di riferimento che include lontologia civica Sviluppo di un primo prototipo software per la classificazione del cittadino nellontologia civica Studio di un procedimento iterativo per leventuale richiesta di maggiori informazioni riguardanti il cittadino
Semantic Web... è unestensione dellattuale Web in cui le informazioni sono strutturate con un senso compiuto, migliorando il lavoro tra le persone ed il computer. Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Termini base Tim Berners-Lee Direttore W3C Ontologia Uno schema gerarchicamente strutturato di termini che descrivono un certo dominio e delle relazioni esistenti fra gli stessi.
Ontologia Civica Una classificazione dei cittadini basata sulle distinzioni via via introdotte dalle norme che prevedono limitazioni della loro applicabilità. Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Termini base dellattività di ricerca Identità digitale del cittadino La totalità delle informazioni che riguardano il cittadino necessarie ad una sua classificazione allinterno di unopportuna ontologia civica
Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Architettura multilivello del Semantic Web Lo strato delle ontologie OWL
Vantaggi di OWL Restrizioni locali sul tipo e sul numero di valori delle proprietà Possibilità di definire caratteristiche delle proprietà: transitiva, inversa, simmetrica, funzionale e inversa funzionale Equivalenza tra classi, proprietà e individui Definizione di classi complesse (mediante combinazioni booleane) Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment OWL – Web Ontology Language Carenze di OWL Mancanza di elementi per gestire domini concreti e intervalli di valore, eventi e processi.
OWL è disegnato per essere interpretato dagli elaboratori ed ha tre sottolinguaggi di crescente espressività: Lite (gerarchie di classificazione e vincoli semplici) DL (maggiore espressività mantenendo la completezza computazionale e la decidibilità) Full (massima espressività senza garanzie di completezza computazionale e di decidibilità) Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Sottolinguaggi di OWL
Non validità dellUnique Name Assumption È possibile che URI diverse modellino in realtà lo stesso concetto Dal fatto che due individui abbiamo nomi diversi non necessariamente segue che siano individui differenti Validità dellOpen World Assumption Ciò che non può essere provato come vero, non deve necessariamente essere ritenuto falso Mancanza dinformazione = Incompletezza = Affermazione falsa (nei DB) Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Assunzioni nel Semantic Web
Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Obiettivi della tesi Ontologia Definizione di unontologia di riferimento che include lontologia civica
Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Lontologia Scelte progettuali: Per la definizione dellontologia ci si è limitati allutilizzo di tutti e soli gli elementi dellOWL Lite. Le classi sono state individuate estraendole dal D.P.R. n.382 dell11 Luglio 1980 e relative modifiche Individui appartenenti alle sole classi foglia della gerarchia. Questa scelta ha portato alla costruzione di una gerarchia di entità che avesse condizioni necessarie e sufficienti solo per gli ultimi nodi dellalbero
1 0 } } Si definisce Personale Tecnico/Amministrativo un individuo che ha come CNS laver stipulato un contratto con luniversità, che deve anche essere lunico contratto firmato. Gli individui appartenenti a questa classe non devono tenere corsi. Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Costruzione di una classe
Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Obiettivi della tesi Ontologia Sviluppo di un primo prototipo software per la classificazione del cittadino nellontologia civica
Particolare attenzione deve essere posta in questo passaggio, in quanto le restrizioni sulle proprietà del tipo owl:allValuesFrom o owl:maxCardinality richiedono (per loro stessa natura) di realizzare una sorta di Mondo Chiuso LOCALE, aggiungendo automaticamente le chiusure alle proprietà. Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Esempio di classificazione (I) Raccogliere le informazioni sullindividuo Tradurle in sintassi Racer (conforme alle krss) Sottoporle al ragionatore Racer che tenterà di dedurre la classe di appartenenza dellindividuo nellontologia precaricata Informazioni caratterizzanti il cittadino sono: avere un titolo universitario lessere iscritto ad un corso di studi tenere dei corsi o delle esercitazioni avere un contratto con luniversità usufruire di una borsa di studio
1 - ha titolo universitario 2 - ha un contratto con luniversità 3 - è lunico contratto firmato Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Esempio di classificazione (II) 1 - ha titolo universitario 2 - ha un contratto con luniversità 3 - è lunico contratto firmato Cittadino Studente Personale universitario Cittadino con titolo universitario Cittadino senza titolo universitario Dottorando Studente senza laurea Studente laureato Personale docente Personale Tecnico/amministrativo Ricercatore Professore universitario Inseriamo le informazioni: Ontologia
Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Obiettivi della tesi Ontologia Studio di un procedimento iterativo per leventuale richiesta di maggiori informazioni riguardanti il cittadino
Risultato classificazione: Personale_docente Classe foglia non raggiunta. Le sottoclassi disponibili sono: Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Procedimento iterativo Se la classe risultante non è un nodo terminale della gerarchia (ad esempio Personale Docente), il software chiama nuovamente RACER, che restituisce, per ogni sottoclasse, le CNS per lappartenenza alle stesse. Cittadino Personale universitario Personale docente Ricercatore Professore universitario Risultato classificazione: Personale_docente Classe foglia non raggiunta. Le sottoclassi disponibili sono: |#Ricercatore| (classe foglia): L'individuo deve avere valori per la proprietà |#ha_esercitazioni| Almeno uno degli eventuali valori della proprietà |#ha_contratto| deve appartenere alla classe |#Universita| Tutti gli eventuali valori della proprietà |#usufruisce| devono appartenere alla classe |#Borsa_di_studio_attivita_post_dottorato| 3 CNS su 8 condizioni caratterizzanti la classe. |#Prof_universitario| (classe foglia): Deve avere per lo meno "1" valore per la proprietà |#ha_corsi| Almeno uno degli eventuali valori della proprietà |#ha_contratto| deve appartenere alla classe |#Universita| 2 CNS su 5 condizioni caratterizzanti la classe.
Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Conclusioni È stato realizzato un primo prototipo software in grado di interfacciarsi con il ragionatore Racer e di classificare il cittadino nellontologia di riferimento in base ad informazioni lette da appositi file.
Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Sviluppi futuri Reperire le informazioni sul cittadino tramite servizi standard di accesso alle basi di dati on-line della Pubblica Amministrazione. Tradurre automaticamente le stesse in sintassi Racer, operando le necessarie chiusure delle proprietà utilizzate. Inserire la gestione dellelemento Categoria del Cittadino estendendo lo strumento Temporal XML Query Processor, sviluppato dallUnità di Modena allinterno del progetto Nazionale MIUR 2001 La Dinamica delle Norme nel Tempo: aspetti Giuridici ed Informatici.
Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment Grazie per lattenzione Agostino Cardella