Costruzione semi-automatica di una tassonomia nel dominio “caso Aldo Moro” SAPIENZA (UNIMED)
Collocazione del task nel progetto LC3
Metodologia di ontology learning Estrazione di terminologia Estrazione di glossari Estrazione di relazioni tassonomiche Estrazione di relazioni tassonomiche Validazione web Documenti del dominio Brigate Rosse Via Mario Fani terrorismo.. Brigate Rosse: partito armato comunista fondato da Alberto Francschini e Renato Curcio nel
Applicazioni web ( Estrazione di terminologia Estrazione di glossari Estrazione di relazioni tassonomiche Estrazione di relazioni tassonomiche Validazione
Dominio “caso Moro” Alcune centinaia di documenti forniti da UNICITY e STURZO (articoli di giornale, trascrizioni..) parole estratte, circa 4000 rilevanti per il dominio EuroWordNet come ontologia di partenza da arricchire
Per ogni concetto: la posizione gerarchica,la definizione (glossa), le varianti lessicali
La finestra di ricerca consente di cercare per sottostringa I concetti di interesse. Cliccando sul risultato cercato, l’albero a sinistra si espande mostrando il concetto di interesse
Queste opzioni servono per esplorare l’ontologia, ma soprattutto per la validazione (move/add concept, move subtree)
Ontologia “il caso Aldo Moro” L’ontologia è in formato machine readable (OWL)
Sommario Parole di dominio ~4000 Istanze (nomi) ~330 Palazzo Chigi Brigate Rosse Largo della Duchessa polirematiche~600 Ragion di stato Scudo crociato Agente di custodia Stella a cinque punte Perizia balistica Nuovi sensi aggiunti a euroWordNet ~1200 corpo CADAVER, CONSISTENCY MILITARY UNIT (corpo senza vita, prendere corpo, corpo di polizia)
Dettagli sugli algoritmi/metodologie