TEORIE E TECNICHE DEL RICONOSCIMENTO

Slides:



Advertisements
Presentazioni simili
Corso di Fondamenti di Programmazione canale E-O
Advertisements

ITL112 ELEMENTARY ITALIAN II
Lezione 18 MIDI e XML Programmazione MIDI (Prof. Luca A. Ludovico)
Ingegneria della conoscenza Emanuele Della Valle Scienze e Tecniche Della Comunicazione 1. Enunciati, mondi del discorso e verità Credits: Prof.
Inizio… Linguaggi Linguaggi di programmazione Linguaggi di programmazione Linguaggi di programmazione Linguaggi di programmazione Linguaggi Formali Linguaggi.
Sistemi computazionali per il linguaggio naturale
Didattica della Matematica Matematica Anno Accademico Filippo Spagnolo Facoltà Scienze della Formazione
Intelligenza Artificiale Linguaggio naturale
Elaborazione del linguaggio naturale part of speech
Elaborazione del linguaggio naturale automi & morfologia Maria Teresa PAZIENZA a.a
Elaborazione del linguaggio naturale Analisi sintattica: parsing CHAOS Maria Teresa PAZIENZA a.a
Elaborazione del linguaggio naturale Analisi sintattica: parsing CHAOS
Maria Teresa PAZIENZA a.a
Maria Teresa PAZIENZA a.a
Computer, Lingue ed Applicazioni Perché comprendere tramite gli elaboratori i contenuti testuali? I testi sono i veicoli principali di significato per.
Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale Prof. M.T. PAZIENZA a.a
Modeling, managing and accessing e-content Linguistic Computing Laboratory Prof. Paola Velardi.
Lo sviluppo del linguaggio nel bambino
La stella della sera = La stella del mattino. Il nome non è l'oggetto. Il referto non è l'immagine. L'immagine dell'oggetto non predetermina a priori.
Digressione: il linguaggio di query CQP
Mentre lerrore grammaticale è generalmente attribuito a ignoranza della lingua e facilmente scusato, lerrore pragmatico non viene percepito.
Metodologie di Annotazione Semantica per la Rappresentazione della Conoscenza nellambito dei Beni Culturali Paola Velardi Dipartimento di Informatica Università
INSIEMI NUMERABILI L’analisi matematica introduce il concetto di insieme numerabile come insieme i cui elementi possono essere “contati” ossia che possiede.
LINGUAGGI DI PROGRAMMAZIONE
AN FI Concetti. Linguaggi di alto livello u Hanno capacita' espressive superiori a quelle del linguaggio macchina u Suggeriscono concetti e modi.
Che cos’è l’annotazione di un corpus?
Elaborare il linguaggio naturale Cristina Bosco Corso di Informatica applicata alla comunicazione multimediale Facoltà di Lingue 23/2/2010.
Strumenti per comunicare (S23) Corso di grammatica italiana 1
Che cosa è un sintagma?.
Il Si Passivante a)In Italia si leggono molti giornali.
Il Si Impersonale A caval donato Non si guarda in bocca.
Elaborazione del linguaggio naturale
Fabio Massimo Zanzotto (slides di Andrea Turbati con aggiunte)
Grammatiche, Linguaggio e Automi R. Basili TAL - a.a
LINGUISTICA GENERALE E COMPUTAZIONALE, PARTE 2
LINGUISTICA GENERALE E COMPUTAZIONALE, PARTE 2
LINGUISTICA GENERALE E COMPUTAZIONALE, PARTE 2
Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a
IL VERBO.
Sistemi basati su conoscenza Linguaggio naturale: grammatiche Prof. M.T. PAZIENZA a.a
Il Parallel Turin University Treebank Cristina Bosco – Manuela Informatica applicata alla comunicazione multimediale
Elaborazione del linguaggio naturale CFG: esercizi Maria Teresa PAZIENZA a.a
PROGETTO: IMPARO UNA TERZA LINGUA: LINGUA SPAGNOLA in classe ANNO SCOLASTICO Destinatari: ALUNNI CLASSI I E II ITES Referente: Prof.ssa PALMIERI.
Elaborazione del linguaggio naturale part of speech Maria Teresa PAZIENZA a.a
IL CONGIUNTIVO.
Intelligenza Artificiale 1 Gestione della conoscenza lezione 19 Prof. M.T. PAZIENZA a.a
TEORIE E TECNICHE DEL RICONOSCIMENTO
TEORIE E TECNICHE DEL RICONOSCIMENTO
Elaborazione del linguaggio naturale automi & morfologia Maria Teresa PAZIENZA a.a
Corpora e linguistica computazionale Cristina Bosco Corso di Informatica applicata alla comunicazione multimediale
1 Università degli Studi di Pisa Facoltà di Scienze Matematiche Fisiche e Naturali Corso di Laurea in Informaticaa Corso di Intelligenza Artificiale: Trattamento.
Linguistica computazionale e approcci corpus-based
Linguistica computazionale: task sul linguaggio naturale Cristina Bosco 2015 Informatica applicata alla comunicazione multimediale.
Semantica approcci computazionali Maria Teresa PAZIENZA a.a
Informatica applicata alla comunicazione multimediale
Sistemi avanzati di Web Information retrieval e Elaborazione del linguaggio Naturale.
Linguaggi di programmazione: panoramica Linguaggi di programmazione ad alto livello: – –Programmazione procedurale – –Programmazione object oriented –
Sistemi basati su conoscenza Linguaggio naturale: semantica Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a
TEORIE E TECNICHE DEL RICONOSCIMENTO
TEORIE E TECNICHE DEL RICONOSCIMENTO Python: Dizionari.
Come costruire sistemi di elaborazione del linguaggio naturale (NLP) Due paradigmi di riferimento –Basato sulla conoscenza (Knowledge Engineering, KE)
Linguaggio come processo cognitivo
Tecnologie della lingua Human Language Technology (HLT)
TEORIE E TECNICHE DEL RICONOSCIMENTO Python: Debugging, 2: Understanding Python better.
Linguistica computazionale: come accedere all’informazione codificata nel linguaggio naturale (seconda parte) Cristina Bosco 2014 Informatica applicata.
TEORIE E TECNICHE DEL RICONOSCIMENTO
THE PASSIVE Verbs with DOUBLE OBJECTS.
Corso di “Teorie e pratiche della traduzione” “La scrittura accademica attraverso le lingue e le culture: studio su corpus della voce autoriale” Dott.ssa.
Il segreto per impararlo è
Transcript della presentazione:

TEORIE E TECNICHE DEL RICONOSCIMENTO Linguistica computazionale in Python: Dalle parole singole alle frasi Estrazione di informazioni

ALTRE APPLICAZIONI DELLA LINGUISTICA COMPUTAZIONALE Finora abbiamo discusso applicazioni della linguistica computazionale che richiedono la classificazione di interi documenti (spam, authorship identification, sentiment) o di singole parole Nelle prossime lezioni discuteremo applicazioni che richiedono classificazione di

ESTRAZIONE DI INFORMAZIONI DA TESTI: ENTITA’ SITE CULTURE LOC

an eventual 30% stake in the British company RELAZIONI (PROPBANK) a GM-Jaguar pact that would give the U.S. car maker an eventual 30% stake in the British company. a GM-Jaguar pact Arg0 that would give Arg1 Here the same annotation is still in the gray box, with the argument labels added. The tree represents the dependency structure, which gives rise to the predicates in the light blue box. Notice that the trace links back to the GM-Jaguar Pact. Notice also that it could just as easily have said, “a GM-Jaguar pact that would give an eventual…stake to the US car maker.” where it would be “ ARG0: a GM-Jaguar pact that would give an ARG1: eventual…stake to ARG2: the US car maker.” This works in exactly the same way for Chinese and Korean as it works for English (and presumably will for Arabic as well.) *T*-1 an eventual 30% stake in the British company Arg2 the US car maker give(GM-J pact, US car maker, 30% stake)

ESTRAZIONE DI INFORMAZIONI

OLTRE LA PAROLA Tanto le entita’ quanto le relazioni sono espresse tramite FRASI : Epigravettiano finale Valle del Serchia

ANALISI SINTATTICA E CHUNKING L’estrazione di frasi, in particolare di frasi nominali, e’ generalmente detta CHUNKING Il chunking e’ una parte della cosidetta ANALISI SINTATTICA di un enunciato, o PARSING In questa lezione parliamo di chunking in Python, nella prossima di parsing

CHUNKS E PAROLE

NP CHUNKING [ The/DT market/NN ] for/IN [ system-management/NN software/NN ] for/IN [ Digital/NNP ] [ 's/POS hardware/NN ] is/VBZ fragmented/JJ enough/RB that/IN [ a/DT giant/NN ] such/JJ as/IN [ Computer/NNP Associates/NNPS ] should/MD do/VB well/RB there/RB ./.

CHUNKING CON LE ESPRESSIONI REGOLARI Le espressioni regolari discusse in precedenza possono essere usate per trovare chunks usando informazioni su POS tags: \w+/DT\s+\w+/NN Una serie di espressioni regolari del genere costituisce una GRAMMATICA NLTK fornisce strumenti per facilitare lo sviluppo di tali grammatiche NLTK, ch. 7.2, p. 265 Chunk grammar Tag patterns

CHUNK GRAMMARS IN NLTK >>> sentence = [("the", "DT"), ("little", "JJ"), ("yellow", "JJ"), ("dog", "NN"), ("barked", "VBD"), ("at", "IN"), ("the", "DT"), ("cat", "NN")] >>> grammar = "NP: {<DT>?<JJ>*<NN>}” >>> cp = nltk.RegexpParser(grammar) >>> result = cp.parse(sentence) >>> print result (S (NP the/DT little/JJ yellow/JJ dog/NN) barked/VBD at/IN (NP the/DT cat/NN))

CHUNK GRAMMARS IN NLTK >>> result.draw()

GRAMMATICHE PIU’ COMPLESSE another/DT sharp/JJ dive/NN trade/NN figures/NNS any/DT new/JJ policy/NN measures/NNS earlier/JJR stages/NNS Panamanian/JJ dictator/NN Manuel/NNP Noriega/NNP his/PRP$ Mansion/NNP House/NNP speech/NN the/DT price/NN cutting/VBG 3/CD %/NN to/TO 4/CD %/NN more/JJR than/IN 10/CD %/NN the/DT fastest/JJS developing/VBG trends/NNS 's/POS skill/NN

USO DI CHUNKERS PER CORPUS ANALYSIS >>> cp = nltk.RegexpParser('CHUNK: {<V.*> <TO> <V.*>}') >>> brown = nltk.corpus.brown >>> for sent in brown.tagged_sents(): ... tree = cp.parse(sent) ... for subtree in tree.subtrees(): ... if subtree.node == 'CHUNK': print subtree ... (CHUNK combined/VBN to/TO achieve/VB) (CHUNK continue/VB to/TO place/VB) (CHUNK serve/VB to/TO protect/VB) (CHUNK wanted/VBD to/TO wait/VB) (CHUNK allowed/VBN to/TO place/VB) (CHUNK expected/VBN to/TO become/VB) (CHUNK seems/VBZ to/TO overtake/VB) (CHUNK want/VB to/TO buy/VB)

FORMATO IOB DI CONLL NLTK, 7.3

ANNOTAZIONE DI CHUNKS: IOB

SVILUPPO E VALUTAZIONE DI CHUNKERS NLTK, 7.3

USO DI CLASSIFICATORI PER CHUNKING NLTK, p.274

STRUTTURA ANNIDATA NLTK, 7.4

NAMED ENTITY RECOGNITION NLTK, 7.5