Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Semantic Web: valutazione sistema NetWatcher Candidato : Chir.mo Prof. Sonia Bergamaschi Luca Tassi Anno Accademico Ing. Mirko Orsini Correlatore: Relatore:
Attività di tirocinio Svolto alla CNA Servizi di Modena Obiettivo… Testare ed analizzare il sistema NetWatcher per il reperimento intelligente delle informazioni Configurazione del sistema Monitoraggio notizie per la creazione di una newsletter Identificazione e creazione di query di confronto Valutazione del sistema Confronto col sistema SEWASIE
Aumento esponenziale dei dati (circa 8 mld di pagine…) Dati interpretati dallutente Motori di ricerca tradizionali Polisemia Web semantico Ideato da Tim Berners Lee Dati strutturati machine-understandable Crea un ambiente in cui agenti software eseguono interrogazioni per gli utenti Problemi della ricerca nel web albero vegetale informatico motoristico
E la piattaforma linguistica, sulla quale si basano la maggior parte dei software distribuiti da Expert System s.p.a. La piattaforma COGITO ® : Componenti: Sensigrafo ® Parser Motore linguistico Disambiguatore Elabora il testo Estrae i significati Crea una mappa cognitiva
NetWatcher ® : Architettura: Back-end Front-end Searchbox Dispatcher Server GSL Pannello di controllo Searchbox Applicazione web Buste SOAP Monitoraggio di sorgenti web Multi-utente Aggiornamento tempestivo Criteri di interesse
Funzionamento Creazione profilo Parametri Sorgenti Filtri Tipo Contenuto Indirizzo
Funzionamento (2) Keywords/ lemmi Categorie Concetti Ricerca in archivio Ambito Criteri
Creazione fonte di dati comune Portali dei settori meccanico/plastico Profili NetWatcher Database MySql Sistema da utilizzare come confronto Query SQL Valori di confronto Risultati database Risultati attesi Risultati totali NetWatcher Risultati pertinenti NetWatcher Test di valutazione PrecisionRecall Risultati pertinenti NW / Risultati totali NW Risultati pertinenti NW / Risultati attesi Parametri di confronto
Risultati ottenuti: Numero QueryRisultati Database Risultati attesiRisultati NW totali/corretti Precision % Recall % /588,39, /787, /5875,331, / , /410014, /141006, / ,1 Query
Ottima Precision Overload dei risultati limitato Recall scarsa Integrazione rete semantica con terminologia di settore Limite di risultati visualizzabili Capacità di interpretazione (pagine aggiornate) Pagine con javascript non indicizzabili Conclusioni: