Università degli Studi di Modena e Reggio Emilia

Slides:



Advertisements
Presentazioni simili
1 Ricerca & Sviluppo per lInnovazione Conferenza TALeP Relatore: Ing. Vincenzo Cartelli Pisa, 27-nov-06.
Advertisements

una interfaccia internet per il sistema Momis
di Architetture Peer to Peer per la Gestione di Database Distribuiti
ESTRAZIONE DI ENTITÀ NON NOTE NON STRUTTURATI UTILIZZANDO LA
Query OQL e XQUERY a confronto
Progetto e realizzazione di un wrapper XML Schema per il sistema MOMIS
Facoltà di Ingegneria di Modena ANALISI E SVILUPPO DI TECNICHE PER
Confronto di sistemi per
WebProfessional Web Content Management System
Università degli studi di Modena e Reggio Emilia
1 Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Protocolli.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi.
Integrazione di standard di classificazione per le-commerce: una nuova metodologia basata sul sistema MOMIS UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA.
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Progetto e sviluppo di.
Re-engineering del wrapper XML Schema per il sistema MOMIS
1 Integrazione di Sorgenti HTML in MOMIS: Analisi Comparativa degli Strumenti Esistenti Integrazione di Sorgenti HTML in MOMIS: Analisi Comparativa degli.
U NIVERISTÀ DEGLI S TUDI DI M ODENA E R EGGIO E MILIA Facoltà di Ingegneria - Sede di Modena Corso di Laurea in Ingegneria Informatica Dinamica delle Ontologie:
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Semantic.
Presentazione del Progetto
Il mio nome è Alain Fergnani e nel corso della tesi mi sono occupato della dinamica delle ontologie per il Web Semantico, e in particolare dell’approccio.
Università degli Studi di Modena e Reggio Emilia
Università degli Studi di Modena e Reggio Emilia
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica MOMIS: servizi di wrapping.
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Progetto e realizzazione.
Progetto e realizzazione del software "Solar Data Manager"
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea in Ingegneria Informatica Integrazione di WordNet Domains.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Ontologie Lessicali Multilingua:
UNIVERSITA’ DEGLI STUDI DI MODENA E REGGIO EMILIA
Università degli studi di Modena e Reggio Emilia Progetto e realizzazione di un tool di sincronizzazione database server – palmare per il controllo del.
COMPARAZIONE DI STRUMENTI SOFTWARE PER LA CREAZIONE, LA GESTIONE E LINTEGRAZIONE DI ONTOLOGIE Università degli Studi Modena e Reggio Emilia Facoltà di.
Università degli Studi di Milano - Bicocca Corso di Laurea Magistrale in Teoria e tecnologia della comunicazione Nuovo regolamento didattico per lA.A.
Computer, Lingue ed Applicazioni Perché comprendere tramite gli elaboratori i contenuti testuali? I testi sono i veicoli principali di significato per.
ANNO ACCADEMICO CORSO LAUREA MAGISTRALE IN SCIENZE DELLA PRODUZIONE ANIMALE Riconoscimento elettronico, management informatizzato e tracciabilità.
Lezione introduttiva Sistemi tecnologici e informazione on line Proff. Carlo Medaglia, Elena Valentini, Domenico Ventriglia Roma, 4 marzo 2010.
Silvio e il Presidente del Consiglio: Il discorso di Berlusconi tra Parlamento e Piazza UNIVERSITÀ DEGLI STUDI DI PAVIA FACOLTÀ DI ECONOMIA, GIURISPRUDENZA,
UNIVERSITA DEGLI STUDI DI MILANO Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea Trienmale in Informatica Relatore:Prof.ssa FIORELLA.
Appunti informatica- prof. Orlando De Pietro
Chi è Expert System Da oltre 15 anni Expert System è leader nella realizzazione di soluzioni avanzate di Semantic Intelligence per la gestione "intelligente"
MINISTERO DELL'ISTRUZIONE, DELL'UNIVERSITÀ E DELLA RICERCA MIUR-PRIN Progetto di ricerca Conoscenze scientifiche, sperimentali e tacite.
Informatica giuridica Informatica e lingua del diritto Nicola Palazzolo Anno Accademico 2006/2007.
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea in Scienze dellInformazione Applicazione.
Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea in Informatica Progetto e sviluppo.
Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria Enzo Ferrari Modena Corso di Laurea in Ingegneria Informatica PROGETTO E SVILUPPO.
Università degli Studi di Milano – Bicocca Facoltà di Psicologia Facoltà di Scienze Matematiche, Fisiche e Naturali LAUREA MAGISTRALE IN TEORIA E.
ASSE IV - CAPITALE UMANO- Categoria di intervento 72 – Linea A
UNIVERSITA’ DEGLI STUDI DI MILANO Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea in Scienze dell’Informazione La formazione informatica.
Un Electric Car Club per la Regione Friuli Venezia Giulia
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA FACOLTÀ DI INGEGNERIA DI MODENA Corso di Laurea Specialistica in Ingegneria Informatica PROGETTO E REALIZZAZIONE.
DIDATTICA PER COMPETENZE
Applicazioni di modelli matematici alla ricerca semantica
UNIVERSITÀ DEGLI STUDI DI BARI
La gestione delle informazioni non strutturate Roma, 15 novembre 2007.
LA QUALITA’ NELLA PROGRAMMAZIONE DELL’ESERCIZIO
UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA Facoltà di Ingegneria Corso di Laurea In Ingegneria Informatica Anno Accademico Candidato: Paolo Alfonsi.
Maria Piscitelli Firenze, 3 dicembre 2010
Orientamento Universitario Liceo Classico Garibaldi
Orientamento Universitario Liceo Classico Garibaldi.
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA DIPARTIMENTO DI INGEGNERIA “Enzo Ferrari” Corso di Laurea in Ingegneria Informatica Anno Accademico 2013/2014.
Un Sistema per la Redazione Assistita di Testi Giuridici Tesi di Laurea Specialistica in Informatica di Emiliano Giovannetti Un Sistema per la Redazione.
L’analisi del contenuto Doppia funzione dell’analisi del contenuto: -Può essere un tipo di ricerca specifico -Può essere una tecnica di ricerca Come TECNICA.
L'analisi dei testi per la realizzazione del Web Semantico: quali gli strumenti e le applicazioni Paolo Poto Expert System Spa.
Per un nuovo orientamento nella progettazione dei linguaggi di programmazione Tesi di Laurea di: RICCARDO SOLMI Università degli Studi di Bologna Facoltà.
Come costruire sistemi di elaborazione del linguaggio naturale (NLP) Due paradigmi di riferimento –Basato sulla conoscenza (Knowledge Engineering, KE)
Tecnologie della lingua Human Language Technology (HLT)
Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Fisiche, Informatiche e Matematiche Corso di Laurea in Informatica Progettazione e.
Progetto AMBIT: Ottimizzazione e Valutazione Sperimentale del Motore di Ricerca Semantico Basato sul Contesto Università degli studi di Modena e Reggio.
ICT e Sistemi informativi Aziendali Materiale di supporto alla didattica.
1 Lixto tools evaluations for HTML data Integration in Momis Lixto tools evaluations for HTML data Integration in Momis Università degli Studi di Modena.
1 DB unimo CROSS LAB Integrazione framework MOMIS - BCI Parma, 18/09/2007 Sonia Bergamaschi, Maurizio Vincini, Mirko Orsini
Transcript della presentazione:

Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea in Ingegneria Informatica Estrazione di concetti ed analisi di documenti testuali: progetto e sviluppo dell’applicazione OKKAM-POP Relatore: Prof.ssa Sonia Bergamaschi Tesi di Laurea di: Michele Vitali Correlatore: Dott. Daniele Cordioli Anno Accademico 2008/2009

OBBIETTIVI Studio del progetto OKKAM, a cui Expert System partecipa attivamente. FP7 Impiego della tecnologia linguistica COGITO®. Studio di metodi per Information Extraction. Sviluppo dell’applicazione OKKAM-POP.

WEB SEMANTICO Inizio: 01/01/2008 Fine: 30/06/2010 PJ_REF: 215032 RDF OWL Inizio: 01/01/2008 Fine: 30/06/2010 PJ_REF: 215032 Costo: 7.359.931 €

L’AZIENDA EXPERT SYSTEM Fondata nel 1989. Sedi a Modena, Rovereto, Roma, Napoli e negli USA. Opera nei settori Knowledge Management e Natural Language Processing. Proprietaria della tecnologia linguistica COGITO®. Global Mobile Award 2009 con il prodotto COGITO® Answer (Best billing or custumer care solution). Clienti: Pirelli, BNL,Vodafone, Eni, Poste Italiane, RCS Mediagroup, Telecom Italia.

LA TECNOLOGIA COGITO® Piattaforma software per analisi linguistica che si basa sulla rete semantica lessicale SENSIGRAFO® Interpreta il linguaggio naturale catturando gli aspetti morfologici grammaticali logici semantici La DISAMBIGUAZIONE linguistica attribuisce ad ogni termine il giusto significato in base al contesto: “Il rapinatore mi ha colpito con il calcio della pistola.” “Il simbolo del calcio è Ca.”

COGITO® SCHEMA FUNZIONALE COGITO® Informazioni non strutturate Analisi linguistica e semantica Informazioni strutturate DOCUMENTI MOBILE CONTENT E-MAIL INTRANET FLUSSI INFORMATIVI WEB COGITO® analisi morfologica analisi grammaticale analisi logica analisi semantica SENSIGRAFO® Mappa concettuale e cognitiva del linguaggio naturale Ricerca semantica Categorizzazione Estrazione delle informazioni Intelligence

INFORMATION EXTRACTION Selezione di concetti significativi in un testo per la generazione automatica di metadati: “Carlo Ancelotti, il nuovo allenatore del Chelsea, ha tenuto la prima conferenza stampa in lingua inglese.” Algoritmo di estrazione Grado di automazione Codifica manuale Apprendimento automatico Statistico Basato su regole OKKAM-POP

REGOLE DI ESTRAZIONE PATTERN SINTATTICO CONTESTO SEMANTICO Carlo Ancelotti , il nuovo allenatore del Chelsea … SOS PNT ART AGG PRE CONTESTO SEMANTICO Carlo Ancelotti , il nuovo allenatore del Chelsea … Nome di persona Professione Club calcistico

Colosso – “Azienda di notevole importanza” APPLICAZIONE DELLE REGOLE Organizzazione Tempo … … … … Giorno – “Durata media del periodo di rotazione della Terra attorno al proprio asse.” Colosso – “Azienda di notevole importanza” SOS AGG “Nei giorni scorsi Intel ha presentato un nuovo prodotto.” “Il colosso mondiale Intel ha presentato un nuovo prodotto.”

(Extract, transform, load) L’APPLICAZIONE OKKAM-POP CORPUS XML APPLICAZIONE ETL (Extract, transform, load) CORPUS TXT CORPUSXML arricchito COGITO® APPLICAZIONE ETL INFORMATION EXTRACTION Analisi dei dati con OKKAM QUERY GUI e feedback DB

DATI ESPORTATI NEL DB DOCUMENTI ENTITÀ APPOSIZIONI SAO (Soggetto, Azione, Oggetto) PROPRIETÀ COGITO® CONTESTI DELLE ENTITÀ LEMMI PRINCIPALI DEI DOCUMENTI DOMINI ATTRIBUITI AI DOCUMENTI

OKKAM QUERY GUI

ALCUNI RISULTATI PERSONA DESCRIZIONE Maurizio Mattei il designatore unico degli arbitri di serie A John Griffin uno scienziato esperto nei sistemi di difesa Angelo Bottini Il nuovo soprintendente archeologico di Roma ORG. DESCRIZIONE Ucimu L' associazione dei costruttori di macchine utensili Sea la società di gestione degli aeroporti milanesi Smat ( Società Metropolitana Acque Torino ) LUOGO DESCRIZIONE Taipei capitale dell' isola di Taiwan Porto Seguro una nota località balneare nello stato di Bahia Genoni un piccolo paesino in provincia di Nuoro

ALCUNE STATISTICHE TORINO, 18 GIU - I consigli di fabbrica di Mirafiori hanno deliberato per mercoledì due ore di sciopero ''contro lo scalone e gli scalini e la revisione al ribasso dei coefficienti'' per il calcolo delle pensioni e hanno promosso una raccolta di firme per invitare i segretari generali nello stabilimento Fiat (Fabbrica Italiana Automobili Torino) prima della conclusione della trattativa e per sottoporre l'eventuale intesa al voto dei lavoratori. Lo ha reso noto il sindacato Fiom-Cgil. Le Rsu aziendali hanno deliberato unitariamente due ore di sciopero, per ogni turno, dalle 10 alle 12 e dalle 14 alle 16, con iniziative fuori dai cancelli. Intanto domani, scioperera' l'Avio Group, ex Fiat Avio, di Rivalta, con corteo fuori dallo stabilimento. ''Il governo e i sindacati ascoltino i buoni consigli dei delegati di Mirafiori e usino la forza che a loro viene data. Saremo tutti giudicati dall'esito di questo negoziato'', afferma il segretario generale della Fiom torinese, Giorgio Airaudo. Sono stati analizzati 1.158.841 articoli giornalistici risalenti agli anni 2005, 2006 e 2007 Documenti elaborati 1.158.841 Numero di persone distinte estratte 465.107 Frequenza media di ciascuna persona 8,921 Concetti estratti per le persone 1.672.655 Numero di organizzazioni distinte estratte 117.113 Frequenza media di ciascuna organizzazione 28,623 Concetti estratti per le organizzazioni 39.754 Numero di luoghi distinti estratti 71.546 Frequenza media di ciascuno luogo 41,488 Concetti estratti per i luoghi 31.847

SVILUPPI FUTURI Clustering dei dati per individuare il rumore all’interno delle estrazioni effettuate. Integrazione dei risultati all’interno del progetto europeo OKKAM.

Grazie per la cortese attenzione…