Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoAmerigo Giuliani Modificato 8 anni fa
1
Costruzione semi-automatica di una tassonomia nel dominio “caso Aldo Moro” SAPIENZA (UNIMED)
2
Collocazione del task nel progetto LC3
3
Metodologia di ontology learning Estrazione di terminologia Estrazione di glossari Estrazione di relazioni tassonomiche Estrazione di relazioni tassonomiche Validazione web Documenti del dominio Brigate Rosse Via Mario Fani terrorismo.. Brigate Rosse: partito armato comunista fondato da Alberto Francschini e Renato Curcio nel 1970..
4
Applicazioni web (http://lcl.uniroma1.it) Estrazione di terminologia Estrazione di glossari Estrazione di relazioni tassonomiche Estrazione di relazioni tassonomiche Validazione
5
Dominio “caso Moro” Alcune centinaia di documenti forniti da UNICITY e STURZO (articoli di giornale, trascrizioni..) 14.000 parole estratte, circa 4000 rilevanti per il dominio EuroWordNet come ontologia di partenza da arricchire
6
Per ogni concetto: la posizione gerarchica,la definizione (glossa), le varianti lessicali
7
La finestra di ricerca consente di cercare per sottostringa I concetti di interesse. Cliccando sul risultato cercato, l’albero a sinistra si espande mostrando il concetto di interesse
8
Queste opzioni servono per esplorare l’ontologia, ma soprattutto per la validazione (move/add concept, move subtree)
9
Ontologia “il caso Aldo Moro” L’ontologia è in formato machine readable (OWL)
10
Sommario Parole di dominio ~4000 Istanze (nomi) ~330 Palazzo Chigi Brigate Rosse Largo della Duchessa polirematiche~600 Ragion di stato Scudo crociato Agente di custodia Stella a cinque punte Perizia balistica Nuovi sensi aggiunti a euroWordNet ~1200 corpo CADAVER, CONSISTENCY MILITARY UNIT (corpo senza vita, prendere corpo, corpo di polizia)
11
Dettagli sugli algoritmi/metodologie
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.