Modeling, managing and accessing e-content Linguistic Computing Laboratory Prof. Paola Velardi.

Slides:



Advertisements
Presentazioni simili
Intelligenza Artificiale 1
Advertisements

MAPPE CONCETTUALI Sergio Capone ITP
Analisi e progettazione
International Society for Knowledge Organization Università Ca Foscari di Venezia Dipartimento di Informatica Matteo Ballarin SKOS Un sistema per lorganizzazione.
1 Quale spazio per uneducazione plurilingue nella scuola di oggi? Firenze, 30 settembre 2011 Silvia Minardi.
Inizio… Linguaggi Linguaggi di programmazione Linguaggi di programmazione Linguaggi di programmazione Linguaggi di programmazione Linguaggi Formali Linguaggi.
Web semantico e logiche descrittive M. Simi, Cap 2 del "Description Logic Handbook" Lezioni di U.Straccia.
Facoltà di Ingegneria di Modena ANALISI E SVILUPPO DI TECNICHE PER
1 Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento.
Il Sistema MOMIS Il progetto MOMIS (Mediator EnvirOnment for Multiple Information Sources) consiste nella realizzazione di un sistema intelligente d integrazione.
METODI DI DISAMBIGUAZIONE DEL TESTO ED ESTENSIONI DI WORDNET
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea in Ingegneria Informatica Integrazione di WordNet Domains.
Mondo della computazione Mondo della Vita
THE SHAMANS TOOLBOX SW PLATFORM SW APPLICATIONS AD-HOC SW DEVELOPMENT MANAGEMENTCONSOLE SPIDERING / INDEXINGENGINE ( Full Text, Pattern ) WDC TOPIC / TAXONOMYPROFILING.
Intelligenza Artificiale Linguaggio naturale
Ontologie: dalle scienze cognitive al Semantic Web
Intelligenza Artificiale 2 Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Computer, Lingue ed Applicazioni Perché comprendere tramite gli elaboratori i contenuti testuali? I testi sono i veicoli principali di significato per.
Sistemi basati su conoscenza Basi di conoscenza: rappresentazione e ragionamento (2 - Reti semantiche, Frames) Prof. M.T. PAZIENZA a.a
Apprendimento Automatico: Elaborazione del Linguaggio Naturale
Introduzione Estrazione di Informazioni dal Web Prof. Paola Velardi.
Approcci avanzati alla ricerca in rete. La capacità dellutente Information literacy: imparare a cercare su Internet La situazione: –problemi di Internet.
Università della Svizzera italiana Il web semantico: mito o realtà? Marco Colombetti Politecnico di Milano e Università della Svizzera italiana Roma, 24.
INFORMATICA UMANISTICA B STRUTTURE DATI BASI DI DATI RAPPRESENTAZIONE DELLA CONOSCENZA ONTOLOGIE.
Introduzione Estrazione di Informazioni dal Web Prof. Paola Velardi.
Metodologie di Annotazione Semantica per la Rappresentazione della Conoscenza nellambito dei Beni Culturali Paola Velardi Dipartimento di Informatica Università
Il futuro delle tecnologie nelleParticipation. Il punto di vista di DEMO-net Claudia Soria Istituto di Linguistica Computazionale del CNR.
Chi è Expert System Da oltre 15 anni Expert System è leader nella realizzazione di soluzioni avanzate di Semantic Intelligence per la gestione "intelligente"
RAPPRESENTAZIONE DELLA CONOSCENZA Prof
INGEGNERIA DELLA CONOSCENZA E SISTEMI ESPERTI Prof
KAPPAELLE 2008 Roberto Pirrone Università degli Studi Palermo
Corso SSIS 2003 – Modulo lingue straniere Software per linsegnamento della lingua straniera Jeffrey Earp – ITD/CNR 2003.
1 Internet e nuove tecnologie Anno Accademico Prof. Flavio De Paoli Dott. Marco Loregian.
Descrizione Semantica ad Alto Livello di Ambienti Virtuali in X3D
La Guida per la formulazione dei profili dei corsi di studio elaborata dalle Reti Tuning e ENIC-NARIC Prof. Ann Katherine Isaacs Università di Pisa Comitato.
Il Semantic Web applicato ai percorsi formativi nelle organizzazioni innovative By CSTAdvising CSTAdvising, professionisti della conoscenza,
Corso di Laurea Specialistica in Ingegneria Informatica Model Drive Applicazione per il pilotaggio di veicoli Esame di Linguaggi e Modelli computazionali.
Lo sviluppo del software e i linguaggi di programmazione
Peer-to-Peer Systems Content-Based Routing of Path Queries in Peer-to-Peer Systems Georgia Koloniari and Evaggelia Pitoura Ingargiola Salvatore Montauti.
Tesi di Laurea in Ingegneria Informatica
Il World Wide Web Lidea innovativa del WWW è che esso combina tre importanti e ben definite tecnologie informatiche: Documenti di tipo Ipertesto. Sono.
PORTALE CISCO PROJECT WORK: PORTALE CISCO A cura di: Bellifemine Davide DAlonzo Salvatore Trombino Angelo Zappacosta Luca.
Cos’è l’ECDL ? La European Computer Driving Licence (ECDL) è un certificato, riconosciuto a livello internazionale, attestante che chi lo possiede ha l'insieme.
Cinema e web: verso un ambiente formativo integrato Fondazione Ismu Milano, sabato 20 settembre 2008 ore Riccardo Triolo Laboratorio Itals Dipartimento.
La “Gene Ontology” Ontologia: studio dell’essere in quanto tale, e delle sue categorie fondamentali Le categorie sono le “classi supreme di ogni predicato.
1 Ontology languages. Strato dei modelli LA SCELTA DEL LINGUAGGIO Una volta selezionati i componenti dell’ontologia occorre esprimerli in maniera esplicita,
DAL WEB AL SEMANTIC WEB Aspetti teorici e tecnologici Carmagnola Francesca Dipartimento Informatica C.so Svizzera 185, Torino
Ontologie e World Wide Web: la diffusione della conoscenza.
Ontologie dei Sistemi Informativi – una prospettiva innovativa per il progetto “Governance Prefettura” M.Missikoff IASI-CNR Workshop – Governance Prefettura.
DIPARTIMENTO DI INFORMATICA Una delle condizioni di cui hanno bisogno i nuovi strumenti per la didattica (slides, esercizi on-line, forum, etc) per essere.
PART 3: DATA ANALYSIS THROUGH OMNIFIND. Il cliente: una sorgente importante di informazioni Mercato iper-competitivo, altamente caotico. Cliente al centro.
Prog. applicazioni Web- 1 - Processo di sviluppo: Visione d’insieme.
Computer Assisted Translation (CAT) Cristina Bosco Informatica applicata alla comunicazione multimediale
Linguistica computazionale: task sul linguaggio naturale Cristina Bosco 2015 Informatica applicata alla comunicazione multimediale.
L'analisi dei testi per la realizzazione del Web Semantico: quali gli strumenti e le applicazioni Paolo Poto Expert System Spa.
Giannicola Spezzigu Accordo: sovrapposizione di 3 o più suoni Ogni sigla denota un accordo, ossia i suoni da cui esso è formato Accordi e.
KAPPAELLE Problemi Aperti Carlo Tasso LIA - UNiUD Gruppo infoFACTORY.
Servizi Internet Claudia Raibulet
Intelligenza Artificiale 2 Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Come costruire sistemi di elaborazione del linguaggio naturale (NLP) Due paradigmi di riferimento –Basato sulla conoscenza (Knowledge Engineering, KE)
Tecnologie della lingua Human Language Technology (HLT)
Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Fisiche, Informatiche e Matematiche Corso di Laurea in Informatica Progettazione e.
UNITÀ DIDATTICA Argomento: Acquisizione ed espansione del lessico ricettivo e produttivo: creazione di un cruciverba multidisciplinare Docente: Colantonio.
Corso di “Teorie e pratiche della traduzione” “La scrittura accademica attraverso le lingue e le culture: studio su corpus della voce autoriale” Dott.ssa.
Web semantico e logiche descrittive M. Simi, Cap 2 del "Description Logic Handbook" Lezioni di U.Straccia.
Cercare In Internet. Cercare in Rete La scuola ha un ruolo preciso in relazione a quella che nei paesi anglosassoni viene denominata: Information Literacy.
Costruzione semi-automatica di una tassonomia nel dominio “caso Aldo Moro” SAPIENZA (UNIMED)
TECO Teacher Education Competency Ontology
Transcript della presentazione:

Modeling, managing and accessing e-content Linguistic Computing Laboratory Prof. Paola Velardi

Aree di ricerca Metodologie –Elaborazione del Linguaggio naturale –Apprendimento automatico Applicazioni –Modellazione ontologica –E-learning –Information Retrieval

Modellazione Ontologica Ontologia: una rappresentazione formale e condivisa di un certo dominio di conoscenza Vantaggi: –Interoperabilità –Riusabilità –Accesso facilitato ad informazioni (strutturate e non)

INTEROPERABILITA (es.) ACCOMODATION DATA COMPONENT ADDRESSFACILITY Street City Country Bed&BreackResort Sport facility Room facility IS_A HAS_PART Hotel: Hilton Resort Address: Hill Street, 6 Los Angeles Description: bla bla..swimming pool..bla bla Hotel_name: Pippos Type: B&B Street: Canale, City:NY Details:.. private baths….. NAME

Interoperabilità Lontologia consente di identificare i vari elementi informativi, anche se questi sono rappresentati mediante strutture dati eterogenee (es: Indirizzo(via, numero,città,paese) oppure Indirizzo(campo unico) ) o inclusi in stringhe di testo.

Accesso facilitato alle informazioni:esempio CURRICULA name title skills ABILITY computing_skills linguistic skills Curriculum Vitae Paolo Rossi ……mi sono laureato in In- gegneria elettronica nel....ottima conoscenza inglese..linguaggi di programmazione: Java, C++, OWL.. Cerco un ingegnere con esperienza di programmatore

Accesso facilitato a Informazioni Lontologia consente di annotare parti salienti del testo, favorendo la classificazione e il recupero di documenti non basato sul semplice uso di parole chiave.

Stato dellarte nellarea modellazione ontologica Linguaggi e formalismi (OWL, DAML+OIL..) Principi di modellazione concettuale (DOLCE) Tools per lo sviluppo di ontologie (OntoEdit..)) Popolazione large-scale di ontologie Killer applications

Il sistema Ontolearn per la popolazione automatica di ontologie di dominio RISORSE DISPONIBILI: Esistono in rete alcune grandi ontologie general purpose (CYC, WordNet,..). Esistono glossari di dominio (glossari: termini + definizione in LN). IPOTESI: E possibile costruire automaticamente ontologie di dominio estendendo e potando ontologie general-purpose, ed integrando le informazioni nei glossari. Metodo 1: interpretazione composizionale. Es: linterpretazione semantica del termine information technology si può ricavare componendo opportunamente i concetti information e technology, nelle accezioni corrette. Metodo 2: ontologizzazione dei glossari. Effettuando un parsing delle definizioni e utilizzando misure di similarità (es. LSI) si può passare da una struttura piatta ed informale (glossario) ad una strutturazione tassonomica con (qualche grado di) formalità.

Il sistema Ontolearn per la poplazione automatica di ontologie di dominio (metodo 1) Domain Ontology Extraction of candidate terminology Semantic Interpretation Identification of taxonomic relations Filtering of domain terminology Domain Corpus Contrastive Corpora and glossaries Natural language processor WordNet+ lexical resources Domain Concept Forest Ontology updating Semantic relation Annotaton rules Gloss generation rules

Estrazione della terminologia Estrae da corpora di dominio stringhe terminologiche : Parsing in linguaggio naturale Identifica strutture sintattiche tipiche di terminologia (compounds, gruppi preposizionali) Filtraggio dei candidati terminologici, usando corpora e glossari in dominii diversi, per contrasto. Usa due misure basate sul concetto di entropia: Domain Relevance Domain Consensus D 1... D i... D n Market analysis RD d 1... d i... d n Project partner CD

Interpretazione semantica delle stringhe terminologiche: lidea generale 1. Determina i sensi corretti memory access memory,remembering memory,retention access, the right to obtain memory,storage memory, cognitive psychology access,approach access, stored information

Interpretazione semantica delle stringhe terminologiche: lidea generale (2) 2. Determina le relazioni semantiche sussitenti memory,storageaccess, stored information TOPIC

Interpretazione semantica delle stringhe terminologiche: lidea generale (3) Identifica le relazioni tassonomiche fra concetti data access operation access, stored information memory access multiport memory access ONTOLOGIA GENERICA (WordNet) ONTOLEARN

Interpretazione semantica: Rappresentazione dei concetti mediante grafi Lessici computazionale e risorse lessicali on-line, analizzati con opportune tecniche, consentono di generare, per ogni possibile senso di ogni termine elementare un GRAFO SEMANTICO

Interpretazione Semantica: (1b) Intersezione fra grafi semantici Linterpretazione corretta per una certa stringa terminologica viene determinata identificando la migliore combinazione di sensi associati a ciascun componente. Lalgoritmo di interpretazione semantica si basa sulla ricerca di specifici pattern di interconnesione, che vengono descritti mediante una grammatica context free. I pattern rossi in figura sono esempi di rule matches.

Ulteriori passi dellalgoritmo determina le relazioni concettuali fra concetti componenti un concetto complesso (memory based learning) ES: struttura i concetti in ordine tassonomico Genera definizioni in linguaggio naturale per i nuovi concetti (context free grammars), es: Mailing list : a kind of list, a database containing an ordered array of items, for the transmission of a letter. technology modelling technology knowledge modelling technology representation technology

Applicazioni ed esperimenti Applicazioni nellambito di progetti nazionali ed europei, nei dominii: computer networks (Web-learning), tourism (Harmonise), enterprise interoperability (INTEROP) Studio di killer applications: web information retrieval, e-learning