Un Lessico Elettronico Multilivello dellItaliano per applicazioni di Tecnologie del Linguaggio Umano Nilda Ruimy Istituto di Linguistica Computazionale del CNR Pisa, Italy Istituto di Linguistica Computazionale Antonio Zampolli C.N.R.
PAROLE-SIMPLE-CLIPS: il più ampio lessico computazionale multi-livello della lingua italiana Dati annotati in un linguaggio descrittivo esplicito Un lessico elettronico : PAROLE-SIMPLE-CLIPS Ogni livello descrittivo è indipendente dagli altri ma le informazioni sono interconnesse tramite i legami che uniscono le entrate di una stessa unità lessicale attraverso i livelli Modello lessicale: standard de facto e ispiratore dello standard ISO LMF per lessici per il TAL Lessico costruito in una prospettiva multilingue e per un utilizzo nel TAL Informazione coerentemente strutturata e molto granulare Quattro livelli di descrizione linguistica: entrate: fonologia : ; morfologia : ; sintassi : ; semantica : (di cui complete) Un lessico computazionale fornisce informazione lessicale comprensibile alla macchina Lessici Computazionali : infrastruttura indispensabile per lo sviluppo delle applicazioni nellambito delle Tecnologie del Linguaggio Umano Nilda Ruimy
Architettura del lessico I primi tre livelli di rappresentazione : Contenuto informativo Unità fonologica Unità fonologica Posizione accento Apertura vocali Pronuncia consonanti Cat. gram. Sottocategoria gram. Paradigma flessivo Unità morfologica Correspondenza Ufon-Umorf Correspondenza Umorf-Usin Unità sintattica Unità sintattica proprietà elem. sottocategorizzati a. proprietà testa b. frame sottocat. struttura sintattica proprietà elem. sottocategorizzati proprietà elem. sottocategorizzati a. proprietà testa b. frame sottocat. a. proprietà testa b. frame sottocat. struttura sintattica 1 Collegamento struttura sintattica 2 Nilda Ruimy
Rappresentazione della conoscenza lessicale copre un largo ventaglio di aspetti cruciali della semantica lessicale: Il Livello Semantico : SIMPLE-CLIPS Lessico strutturato in base ad unontologia lessicale aspetto composizionale del significato tipo di evento denotato contesto sintattico e semantico relazioni con le altre unità semantiche del lessico Livello semantico basato sulla teoria del Lessico Generativo (Pustejovsky, 1995) Nilda Ruimy
Rappresentare il significato implica : Distinguere i diversi sensi di un lemma es. capo = testa, superiore gerarchico, estremità di q.csa, indumento, ecc. Fornire uninformazione che consenta di fare delle inferenze : es.: strumento implica artefatto Rappresentare le similitudini di significato con altre parole Nilda Ruimy
I significati lessicali hanno vari livelli di complessità Il Lessico Generativo Significati più semplici : definibili attraverso una relazione tassonomica Per i più complessi, la relazione di iperonimia non basta a definirli : sono coinvolte altre dimensioni di significato La multidimensionalità e i diversi livelli di complessità del significato sono rappresentati nel Lessico Generativo attraverso la Struttura Qualia bambino: UMANO, età (infanzia), sesso (maschile) dottore : UMANO, età (adulta), sesso (maschile), giornale : 1. carta stampata / informazione 2. luogo 3. istituzione 4. gruppo di persone + funzione polisemia Le unità semantiche sono entità multidimensionali Nilda Ruimy
La Struttura Qualia modellare coerentemente la multidimensionalità del significato rappresentare uniformemente la semantica di unità lessicali di diversa complessità rendere conto delle relazioni esistenti tra le unità semantiche La Struttura Qualia consiste di 4 ruoli : Qualia La Struttura Qualia consente di : E uno dei quattro livelli di rappresentazione semantica nella teoria del Lessico Generativo Formale = che cosè X? Costitutivo = di che cosa è fatto / composto X? Agentivo = come nasce X? Telico = qualè la funzione di X? Nilda Ruimy
Ruolo formale Ruolo agentivo Ruolo telico Ruolo costitutivo Entità X Multidimensionalità del significato che cosè X? di che cosa è fatto X? come nasce X? qual è la funzione di X? Nilda Ruimy
isa antonym_comp antonym_grad mult_opposition result_of agentive_prog agentive_cause agentive_experience caused_by source AGENTIVEAGENTIVE ARTIFACTUAL AGENTIVE created_by derived_from made_of is_a_follower_of has_as_member is_a_member_of has_as_part instrument kinship is_a_part_of resulting_state relates uses CONSTITUTIVECONSTITUTIVE causes concerns affects constitutive_activity contains has_as_colour has_as_effect has_as_property measured_by measures produces produced_by property_of quantifies related_to successor_of precedes typical_of contains feeling PROPERTYPROPERTY is_in lives_in typical_location LOCATION Formale CostitutivoAgentivoTelico used_for used_as used_by used_against TELIC INSTRUMENTAL DIRECT TELIC indirect_telic purpose object_of_activity is_the_activity_of is_the_ability_of is_the_habit_of ACTIVITY proiettile, colpire bisturi, chirurgo medico, curare disgusto, provare casa, costruire mohair, capra pane, farina senatore, senato manubrio, bicicletta EXTENDEDQUALIASTRUCTUREEXTENDEDQUALIASTRUCTURE
Ruolo formale Ruolo agentivo Ruolo telico Ruolo costitutivo STRUMENTO Multidimensionalità del significato is_a made_of has_as_part created_by used_for used_by Nilda Ruimy
is_made_of legno used_for suonare used_by violinista Ruolo formale Ruolo agentivo Ruolo telico Ruolo costitutivo violino is_a strumento_musicale created_by fabbricare has_as_part corde Multidimensionalità del significato Nilda Ruimy
recipiente di legno fatto di che serve per la conservazione e il trasporto doghe arcuate tenute unite da cerchi di ferro di liquidi, specialmente vino botte Definizione di dizionario tradizionale Telico: used_for conservare Costitutivo: contains vino Costitutivo: has_as_part doghe Costitutivo: made_of legno Formale: is_a recipiente Agentivo: created_by fabbricare Relazioni Qualia e dimensioni di significato Nilda Ruimy
Ontologia I use the term ontology to mean a specification of a conceptualization. That is, an ontology is a description (..) of the concepts and relationships that can exist for an agent or a community of agents. …. The term is borrowed from philosophy, where an Ontology is a systematic account of Existence. (T. R. Gruber, 1993) An ontology defines the terms used to describe and represent an area of knowledge. World Wide Web Consortium (W3C) Recommendation …sembra consolidata l'idea che in informatica, il termine ontologia debba riferirsi specificamenteinformatica ad un tentativo di formulare una concettualizzazione esaustiva e rigorosa nell'ambito di un datoconcettualizzazione dominio. Si tratta generalmente di una struttura dati gerarchica che contiene tutte le entità rilevanti,dominiostruttura dati le relazioni esistenti fra di esse, le regole, gli assiomi ed i vincoli specifici del dominio. Wikipedia In parole povere: unontologia specifica le entità esistenti in una determinata porzione dello spazio semantico e le relazioni che intercorrono fra di loro Nel Web Semantico, è lelemento chiave che permette il ragionamento automatico sul contenuto dei testi …a set of knowledge terms, including the vocabulary, the semantic interconnections and some simple rules of inference and logic, for some particular topic. (J. Hendler, 2001) Nilda Ruimy
Le unità semantiche sono entità multidimensionali Sistema di tipi multidimensionali che consiste di: tipi semplici o monodimensionali (caratterizzati in termini di relazioni di iperonimia) L Ontologia Lessicale SIMPLE SIMPLE Core Ontology Composta da 157 tipi semantici indipendenti da lingue, domini specifici e applicazioni, creati per la classificazione e descrizione del contenuto semantico delle unità lessicali Adottata per la costruzione di lessici per 12 lingue europee tipi unificati o multidimensionali (definibili solo attraverso la relazione di iperonimia + il riferimento a dimensioni ortogonali di significato) Disegnata in modo consensuale combinando le strategie top-down e bottom-up Nilda Ruimy
CONCRETE_ENTITYABSTRACT_ENTITYPROPERTYREPRESENTATIONEVENT CAUSE TELIC AGENTIVE CONSTITUTIVEENTITY TOP Location Material Artifact Food Physical Object Organic Object Living Entity Substance PART GROUP AMOUNT Quality Psych Property Physi Property Social Property Domain Time Moral Standards Cognitive Fact Mvmt of Thought Institution Convention Abstract Location Language Sign Information Number Unit of measure Metalanguage Artifact Material Furniture Clothing Container Artwork Instrument Money Vehicle Semiotic Artifact Aspectual Cause Aspect. Phenomenon Weather verbs Disease Stimuli State Exist Rel. State Act Non Rel. Act Relational Act Move Cause Act Speech Act Psychological_event Cognitive Event Experience Event Change Rel. Change Change Possession Change Location Natural Transition Acquire Knowledge Cause_change Cause Rel. Change Cause Change Location Cause Natural Transition Creation Give Knowledge Ontologia SIMPLE-CLIPS tipo semplice tipo unificato bisturi INSTRUMENT … is_a … created_by … used_for … used_by … … Human Animal Vegetal Entity Nilda Ruimy
Unità semantica argomenti ruolo sem.; restr. sem. Predicato lessicale Proprietà semantiche Tipo ontologico Dominio duso Tipo di evento Extended Qualia Structure Sinonimia Polisemia regolare Derivazione Rappresentaz. predicativa Collegam. con U. Sint. TRATTISEMTRATTISEM RELAZIONIRELAZIONI TRAUSEMTRAUSEM Livello semantico: tipi dinformazioni Nilda Ruimy
tipo ontologicodefiniz. & esempio Informazione semantica semantic type: Instrument inif. path: [Concrete_entity | Artifact Agentive | Telic] semantic type: Instrument inif. path: [Concrete_entity | Artifact Agentive | Telic] eventype: ===== domain: cleaning, gardening, cosmetics synonymy: nebulizzatore morpho. derivation: eventverb vaporizzare synonymy: nebulizzatore morpho. derivation: eventverb vaporizzare formal: vaporizzatore isa apparecchio constitutive: vaporizzatore has_as_part pulsante agentive: vaporizzatore created_by fabbricare telic: vaporizzatore used_for atomizzare formal: vaporizzatore isa apparecchio constitutive: vaporizzatore has_as_part pulsante agentive: vaporizzatore created_by fabbricare telic: vaporizzatore used_for atomizzare semantic predicate: PRED_vaporizzare type of link: instrument nominalization arguments description: range semantic role select. restrictions semantic predicate: PRED_vaporizzare type of link: instrument nominalization arguments description: range semantic role select. restrictions arg0 Protoagent Human/Instrument arg0 Protoagent Human/Instrument arg1 Protopatient +liquid arg1 Protopatient +liquid arg2 Location Concrete_entity arg2 Location Concrete_entity regular polysemy: ===== tipo di eventotratti semanticirelazioni semantiche Extended Qualia Structure polisemia regolarerappresentaz. predicativa vaporizzatore gloss: apparecchio usato per ridurre in minuscole particelle un liquido example: un vaporizzatore per piante gloss: apparecchio usato per ridurre in minuscole particelle un liquido example: un vaporizzatore per piante Nilda Ruimy
Informazione semantica semantic type: Cause_Experience_Event unif_path: Psychological_event-Cause agentive semantic type: Cause_Experience_Event unif_path: Psychological_event-Cause agentive eventype: process / state synonymy: impaurire synonymy: intimorire synonymy: impaurire synonymy: intimorire formal: spaventare isa suscitare constitutive: spaventare has_as_effect spavento formal: spaventare isa suscitare constitutive: spaventare has_as_effect spavento regular polysemy: Experience_Event -Cause_Experience_Event spaventare gloss: incutere spavento, atterrire example: la tua partenza mi spaventa gloss: incutere spavento, atterrire example: la tua partenza mi spaventa agentive_cause: yes connotation: negative agentive_cause: yes connotation: negative semantic predicate: PRED_spaventare type of link: master arguments description: range semantic role select. restrictions correspondence semantic-syntactic frame: iso bivalent semantic predicate: PRED_spaventare type of link: master arguments description: range semantic role select. restrictions correspondence semantic-syntactic frame: iso bivalent arg0 Protoagent Entity arg0 Protoagent Entity arg1 Protopatient Animate arg1 Protopatient Animate tipo ontologicodefiniz. & esempiotipo di eventotratti semanticirelazioni semantiche Extended Qualia Structure polisemia regolarerappresentaz. predicativa Nilda Ruimy
Informazione semantica semantic type: Experience_Event unif_path: Psychological_event-Agentive semantic type: Experience_Event unif_path: Psychological_event-Agentive eventype: process / state synonymy: impaurirsi formal: spaventarsi isa emozione agentive: spaventarsi agentive_experience provare constitutive: spaventarsi feeling spavento formal: spaventarsi isa emozione agentive: spaventarsi agentive_experience provare constitutive: spaventarsi feeling spavento regular polysemy: Experience_Event -Cause_Experience_Event spaventarsi gloss: essere preso da spavento, impaurirsi example: Leo si è spaventato per l'accaduto gloss: essere preso da spavento, impaurirsi example: Leo si è spaventato per l'accaduto connotation: negative semantic predicate: PRED_spaventare type of link: master arguments description: range semantic role select. restrictions correspondence semantic-syntactic frame: crossed bivalent semantic predicate: PRED_spaventare type of link: master arguments description: range semantic role select. restrictions correspondence semantic-syntactic frame: crossed bivalent arg0 Protoagent Entity arg0 Protoagent Entity arg1 Protopatient Animate arg1 Protopatient Animate tipo ontologicodefiniz. & esempiotipo di eventotratti semanticirelazioni semantiche Extended Qualia Structure polisemia regolarerappresentaz. predicativa Nilda Ruimy
Informazione semantica semantic type: Physical_Property supertype: Extensional semantic type: Physical_Property supertype: Extensional adjective_type: subsective syntactic_type: attributive_predicative synonymy: enorme synonymy: sconfinato synonymy: enorme synonymy: sconfinato formal: immenso antonym_grad minuscolo semantic predicate: PRED_immenso type of link: master arguments description: range semantic role select. restrictions correspondence semantic-syntactic frame: iso_monovalent semantic predicate: PRED_immenso type of link: master arguments description: range semantic role select. restrictions correspondence semantic-syntactic frame: iso_monovalent arg0 underspecified Concrete_Entity arg0 underspecified Concrete_Entity immenso duration: persistent scalar: no meaning component: Dimension_Positive duration: persistent scalar: no meaning component: Dimension_Positive gloss: senza limiti, così esteso da non poter essere misurato example: casa immensa, spazio immenso gloss: senza limiti, così esteso da non poter essere misurato example: casa immensa, spazio immenso tipo ontologicodefiniz. & esempiotratti semanticitratti constitutive Extended Qualia Structure rappresentaz. predicativarelazioni semantiche Nilda Ruimy
Informazione semantica semantic type: Temporal supertype: Intensional semantic type: Temporal supertype: Intensional syntactic_type: attributive synonymy: anteriore synonymy: antecedente synonymy: anteriore synonymy: antecedente formal: precedente antonym_comp successivo semantic predicate: PRED_precedere type of link: VerbPresentParticiple arguments description: range semantic role select. restrictions correspondence semantic-syntactic frame: iso_bivalent semantic predicate: PRED_precedere type of link: VerbPresentParticiple arguments description: range semantic role select. restrictions correspondence semantic-syntactic frame: iso_bivalent precedente temporality_type: durative aspect: past scalar: no meaning component: Past_Neutral temporality_type: durative aspect: past scalar: no meaning component: Past_Neutral gloss: che precede, che viene prima example: il precedente governo gloss: che precede, che viene prima example: il precedente governo arg0 Protoagent Entity arg0 Protoagent Entity arg1 Protopatient Entity arg1 Protopatient Entity tipo ontologicodefiniz. & esempiotratti semanticitratti constitutive Extended Qualia Structure rappresentaz. predicativarelazioni semantiche Nilda Ruimy
barile contenere used_for Soggetti Tipici used_for tanica vetrina cassettone recipiente scatola ….. Nilda Ruimy
CLOTHING pullover pantalone impermeabile gonna … stivale mocassino pantofola sandalo … cintura cravatta guanto borsa … anello collana braccialetto spilla … calzaturaaccessorio gioiello portare Oggetti Tipici indumento is-a indossare object_of_the_activity calzare Nilda Ruimy
duna di sabbia bombola di gas fetta di pane made_of is_a_part_of contains ? ? ? Disambiguazione di Sintagmi Preposizionali Nilda Ruimy
canna da pesca Unità Semantica : canna Tipo semantico : INSTRUMENT ruolo telico ……… canna isa attrezzo canna used_for pescare ……… Disambiguazione di Sintagmi Preposizionali Nilda Ruimy
canna da pesca canna used_for pescare ruolo telico marcatore di funzione Tipo semantico: INSTRUMENT spazzolino da denti ferro da stiromazza da golf Nilda Ruimy Disambiguazione di Sintagmi Preposizionali Nilda Ruimy
macedonia di frutta USemmacedonia …… macedonia isa cibo macedonia made_of frutta …… ruolo costitutivo succo di frutta USemsucco …… succo isa bevanda succo derived_from frutta …… ruolo agentivo Disambiguazione di Sintagmi Preposizionali Nilda Ruimy
macedonia di frutta macedonia made_of frutta composizione succo di frutta succo derived_from frutta origine ruolo costitutivoruolo agentivo Disambiguazione di Sintagmi Preposizionali
bicchiere made_of materiale materiale bicchiere di birra bicchiere contains liquido contenuto ONTOLOGIA …….. SUBSTANCE ARTIFACTUAL_DRINK ………. bicchiere di plastica ruolo costitutivo di Disambiguazione di Sintagmi Preposizionali
becco capretta capretto capro caprone EARTH_ANIMAL ovile LOCATION NATURAL SUBSTANCE lana mohair cachemire angora ARTIFACTUAL MATERIAL capra marocchino caprino vello NON_ RELATIONAL ACT belare belato mungere mungitura tosare tosatura SUBSTANCE FOOD capra kinshipis_part_of typical_of concerns derived_from typical_location capra …. Rete Semantica RELATIONAL ACT BODY_PART ARTIFACT FOOD Agentive qualia relation Constitutive qualia relation Semantic type Nilda Ruimy
mangiare Used_for Object_of_th e_ activity mangiare tavola FURNITURE forchetta INSTRUMENT ristorante BUILDING cucinare cuocere mestolo pentola CONTAINER mangiare friggere friggitrice bollitore bollire pesce pesciera Is_the_activity_of cuoco PROFESSION cucinare mangiare coniglio carne mela carota arrosto mangiare ARTIFACT _FOOD VEGETABLE FRUIT FOOD SUBSTANCE_FOOD +edible zucchero alloro tartufo VEGETAL_ENTITY FLAVOURING NATURAL_SUBSTANCE AGENTIVETELIC Created_by cucinare cuocere arrostire bollire lessare stufare friggere rosolare grigliare …… Lessico di Dominio qualia semantic relation qualia role semantic feature semantic type Nilda Ruimy
PAROLE-SIMPLE-CLIPS Basato su un modello lessicale ricco che coniuga complessità e rigore con aspetti innovativi Membro di una rete di 12 lessici monolingui => utilizzabilità in applicazioni multilingue nelle Technologie del Linguaggio Umano Soddisfa i requisiti per la portabilità, condivisione & riutilizzabilità: vasta copertura, genericità, strutturazione coerente dellinformazione, descrizione ricca ed esplicita, variabilità di granularità di descrizione, facile estensione e adattamento Utilizzabile nellanalisi di testi, nellestrazione di informazione, nella disambiguazione del significato, nel Question Answering Ha i requisiti per contribuire allimplementazione del Web Semantico poiché è una risorsa basata su unontologia ed è in grado di fornire informazione comprensibile alla macchina per consentire la gestione del contenuto dei documenti sul Web Nilda Ruimy
Un Lessico Elettronico Multilivello dellItaliano per applicazioni di Tecnologie del Linguaggio Umano Nilda Ruimy Istituto di Linguistica Computazionale del CNR Pisa, Italy Istituto di Linguistica Computazionale Antonio Zampolli C.N.R.
arguments: sem. role; sem. restr. Proprietà semantiche Ontological Information Tipo di evento Extended Qualia Structure Sinonimia Derivazione Polisemia regolare Rappresent. Predicativa Risoluzione dellambiguità lessicale in ambito multilingue Collegamento con U. sint. Dominio Info. Ontologica argomenti: ruolo sem., restr. sem. predicato lessicale Semantic Unit ala = fr. aile, ailier… ala : tipo sem.: PART / BODY_PART aile ala : tipo sem.: ROLE ailier E. Gola, N. Ruimy
Proprietà semantiche Info. ontologica Tipo di evento borsa = fr. sac (gen.); bourse (econ.) calcolo = en. calculation (gen.); gallstone (med.) mouse = it. topo (gen.), mouse (inf.) Domain Dominio Extended Qualia Structure Sinonimia Derivazione Polisemia regolare Rappresent. Predicativa Collegamento con U. sint. argomenti: ruolo sem., restr. sem. predicato lessicale Risoluzione dellambiguità lessicale in ambito multilingue E. Gola, N. Ruimy
Info. ontologica Extended Qualia Structure Ext. Qualia Struct. ferri (pl) = fr. aiguilles à tricoter, instruments du chirurgien ferri : tipo sem.: INSTR. used_for sferruzzare aiguilles à tricoter ferri : tipo sem.: INSTR. used_for operare instruments du chirurgien used_by chirurgo Rappresent. Predicativa Collegamento con U. sint. argomenti: ruolo sem., restr. sem. predicato lessicale Sinonimia Derivazione Polisemia regolare Proprietà semantiche Tipo di evento Dominio Risoluzione dellambiguità lessicale in ambito multilingue E. Gola, N. Ruimy
Semantic properties Ontological Information Event Type Extended Qualia Structure Synonymy Regular Polysemy alt. Derivation Predicative Representation Link to syntactic unit Domain arguments: sem. role; sem. restr. lexical predicatearguments: sem. role; sem. restr. Pred. Represent. lexical predicate fr. louer = it. lodare, affittare louer: arg0, arg1 lodare louer: arg0, arg1, arg2 affittare mangiare = ger. essen, fressen mangiare: arg0 +human essen mangiare: arg0 +animal fressen E. Gola, N. Ruimy Risoluzione dellambiguità lessicale in ambito multilingue