Digressione: il linguaggio di query CQP

Slides:



Advertisements
Presentazioni simili
Automi temporizzati.
Advertisements

Strutture di controllo
Linee guida per la programmazione
Informatica Modulo 4 – Ricerca di informazioni nel web.
ITL112 ELEMENTARY ITALIAN II
Università degli studi di Modena e Reggio Emilia
Istituzioni di linguistica
Each student will be able to ask an adult or stranger: What do you like to do? and What dont you like to …?
AND, OR, AND NOT Operatori logici Gli operatori booleani sono:
"In Internet non siamo in grado di selezionare, almeno a colpo docchio, fra una fonte credibile e una folle. Abbiamo bisogno di una.
1 Università della Tuscia - Facoltà di Scienze Politiche.Informatica 2 - a.a Prof. Francesco Donini Condizioni ed istruzioni condizionali.
Fondamenti di Informatica II Ingegneria Informatica / Automatica (A-I) Meccanica Prof. M.T. PAZIENZA a.a – 3° ciclo.
Apprendimento Automatico: Elaborazione del Linguaggio Naturale
Istituzioni di linguistica
LA RICERCA BIBLIOGRAFICA NEL SETTORE BIOMEDICO: il linguaggio della ricerca CENTRO DI BIOTECNOLOGIE SETTORE DOCUMENTAZIONE BIOMEDICA A.O.R.N. A.CARDARELLI-
1 Corso di Laurea in Biotecnologie Informatica (Programmazione) Introduzione a JAVA Anno Accademico 2009/2010.
Gestione strategica Soggetto dellesercitazione: ________________________ LAUREA SPECIALISTICA IN SCIENZE E TECNICHE DELLO SPORT Corso integrato"Comunicazione.
Algoritmi e Strutture Dati
CORSO DI RICERCA BIBLIOGRAFICA 3. giornata (26 ottobre 2007) Inspec Web of Science.
Elementi di morfologia nominale
Lautore e il ricercatore nellambiente digitale Lautore e il ricercatore nellambiente digitale 2. Edizione 12 aprile 2007 Il catalogo del sistema bibliotecario.
Equivalenza di espressioni
SQL SQL (pronunciato anche come l’inglese sequel) è l’acronimo di Structured Query Language (linguaggio di interrogazione strutturato) E’ un linguaggio.
Il soggetto Paolo legge Nevica. Ieri Paolo e Laura sono partiti
LINGUAGGI DI PROGRAMMAZIONE
Che cos’è l’annotazione di un corpus?
Istituzioni di linguistica a.a Federica Da Milano
Essere o Avere? a) Al passato prossimo, l’ausiliare avere si usa con verbi transitivi (verbi che possono avere un complemento oggetto diretto). Il Maria.
Espressione polirematica
Grammatiche, Linguaggio e Automi R. Basili TAL - a.a
BIOINFO3 - Lezione 51 INSERIMENTO DEI DATI Visto come si creano le tabelle (sinora tristemente vuote), cominciamo ad occuparci di come riempirle con dei.
Chi trova un amico.
entra. Ricerca semplice inserire la parola click! Non occorre indicare la lingua !
Gli operatori booleani
Interrogare il database
ELETTRONICA GEORGE BOOLE FUNZIONI LOGICHE Lezione N° 1
Monza | 10 aprile 2014 Insegnamento dell’italiano per il bambino sordo Sara Trovato – Università degli Studi di Milano Bicocca.
JavaScript Generalità Cos'è JavaScript?
Lezione 3 Struttura lessicale del linguaggio
Sistemi basati su conoscenza Linguaggio naturale: grammatiche Prof. M.T. PAZIENZA a.a
Elaborazione del linguaggio naturale CFG: esercizi Maria Teresa PAZIENZA a.a
Frase grammaticale?logica?
Ambiguità Le lingue sono, per loro natura ambigue e sfumate:
I giorni della settimana
Intelligenza Artificiale 1 Gestione della conoscenza lezione 19 Prof. M.T. PAZIENZA a.a
Il Linguaggio SQL. Le interrogazioni in SQL (continua…) La parte di SQL dedicata alla formulazione di interrogazioni fa parte del DML. SQL esprime le.
UNIVERSITA’ DEGLI STUDI DI PAVIA Facoltà di Economia, Giurisprudenza, Ingegneria, Lettere e Filosofia, Scienze Politiche Corso di Laurea Specialistica.
CHI SONO I NOSTRI CONCORRENTI
Sett Le parole simili Cognates Unit 1. Sett Le parole simili (cognates) What is a cognate? A word that has similar spelling and meaning in.
Tecnologie Informatiche ed Elettroniche per le Produzioni Animali
Author(s) (Name and affiliation) contact(s) / website 28 pts.
Pronomi Personali Soggetto
Se fossi un supereroe, cosa faresti?
Sintassi della frase semplice
2 maggio 2005Master in economia e politica sanitaria - Simulazione per la sanità 1 _jES _______________________________________ jES, java Enterprise Simulator.
PHRASAL VERBS.
What are relative pronouns? Pronouns that stand in for an aunt or uncle?
Funzionalità del DBMS relazionale l Funzioni per –definizione della base di dati –inserimento / rimozione /aggiornamento di informazioni deve soddisfare.
Gli articoli italiani determinativi e indeterminativi La formazione del plurale e.
Approfondimenti SQL.
LA FRASE SEMPLICE M. Dardano – P. Trifone, Grammatica italiana con nozioni di linguistica, Zanichelli, Bologna, III ed.
THE PASSIVE Verbs with DOUBLE OBJECTS.
Per costruire una (buona) mappa concettuale
Lezione 2 : Basi del linguaggio Variabili. Come visto nella lezione 1 le classi registrano il proprio stato nelle variabili  int cadenza = 0;  int velocita.
Le parti del discorso A cura della Prof.ssa Maria Isaura Piredda.
It’s easy to know when we have to put emphasis on the last syllable of words with two or more syllables! These words have an accent on the last letter!
Il linguaggio SQL (Structured Query Language) è il linguaggio standard per creare, manipolare e interrogare database relazionali. SQL non è case-sensitive:
LA GRAMMATICA Grammatica è una parola che, nella sua etimologia, si riferisce alle lettere ovvero le unità minime che ci permettono di comunicare attraverso.
COME SI SCRIVE? Errori ortografici più comuni in italiano!
Accesso al corpus it. / ing. parola cercata sintagmi preposizioni.
Transcript della presentazione:

Digressione: il linguaggio di query CQP Laboratorio di analisi di risorse linguistiche Laurea Specialistica in Linguistica Digressione: il linguaggio di query CQP

CQP Operatori booleani: & (and) | (or) ! (not) Variabili numeriche: ? (0 or 1) * (0 or more) + (1 or more) {n} (exactly n) {n,m} (n…m interval)

CQP Ricerca semplice: "parola"; Ricerca di una stringa: "parola1" "parola2" … "parolan"; Due stringhe con due ordini di parole diversi: "parola1" "parola2" … "parolan" | "parolan" … "parola2" "parola1"; Ricerche case-insensitive: "baffo" %c; Per ignorare accenti e diacritici: "elite" %d;

CQP Ricerca combinata parola + categoria: "parola" [pos="label"]; Ricerca di un lemma: [lem="parola"]; Wildcards: "parol.*"; ".*arola"; ".*arol.*"; Per specificare un insieme chiuso di alternative: "parol(a|e|aio|iere)"; Per ignorare una lettera o un segno: "pic-?nic"; Per ampliare il contesto: "baffo"; set Context 30 oppure "baffo"; set Context 5 words oppure "baffo"; set Context 2 s

CQP Per cercare segmenti di qualsiasi lunghezza contenuti tra una parola e un’altra: "parola1" []* "parola2"; Per cercare segmenti di lunghezza pari a una parola contenuti fra una parola e un'altra: "parola1" [] "parola2"; Per cercare tutte le occorrenze di un lemma in una data forma all'interno della stessa frase: [lemma = "volere"][]+ [pos = ".*inf.*"] within s; Attenzione alle etichette diverse in ciascun corpus (es. il Corpus Taurinense usa lemma mentre il corpus della Repubblica utilizza lem)!

CQP Per cercare segmenti di lunghezza prestabilita contenuti tra una parola e un’altra: "parola1" []* "parola2" within 10; Per cercare segmenti di lunghezza variabile contenuti fra una parola e un’altra all'interno della stessa frase: "parola1" [] "parola2" within s; Per cercare tutte le occorrenze di una parola seguita da una preposizione o da un pronome personale: "parola" [pos="IN" | pos="PP"];

CQP Per cercare una sequenza aggettivo + nome + congiunzione + nome: [pos="JJ.*"] [pos="N.*"] "and|or" [pos="N.*"]; Per cercare una sequenza nome + is/was + verbo che termina in -ed: [pos="N.*"] "is|was" [pos="V.*" & word=".*ed"]; Per cercare una sequenza catch/caught + un determinatore + un numero qualsiasi di aggettivi + un nome oppure una sequenza nome + was/were + caught: "catch|caught" [pos="DT"] [pos="JJ"]* [pos="N.*"] | [pos="N.*"] "was|were" "caught";

CQP Per cercare una sequenza look/bring + una sequenza di max 10 parole che non siano verbi + up/down: "look|bring" [pos != "VB.*"]{0,10} "up|down"; Per cercare le parole che cominciano con sott- e non siano né verbi né aggettivi: [word="sott.*" & !(pos="V.*" | pos="ADJ")];

CQP: un esempio concreto Corpus La Repubblica: Attributi strutturali – permettono di restringere il campo della ricerca per generi: article_id: a single id assigned to each article (not very interesting). - article_author: the author of the article. - article_gen: the genre of the article (two values: news and commento). - article_top: the topic of an article (chiesa, cronaca, cultura, economia, meteo, politica, scienze, scuola, società, sport, NOCAT). - article_year: the year of an article (1985-2000). Esempio: a:"opportunista" :: a.article_top="politica"