LINGUISTICA GENERALE E COMPUTAZIONALE, PARTE 2

Slides:



Advertisements
Presentazioni simili
Per cercare un libro su un determinato argomento (keywords) e che appartiene ad una precisa classe CDD scegli la ricerca combinata.
Advertisements

Progettazione dei Sistemi Interattivi (A.A. 2004/05) - Lezione 2 1 Progettazione e Sviluppo di Software ad Oggetti 4 OBJECT-ORIENTED ANALYSIS Processo.
Informatica Generale Marzia Buscemi
Shell: variabili di sistema PATH HOME USER PWD SHELL HOSTNAME HOSTTYPE Per visualizzare il valore di tutte le variabili dambiente si usa il comando set.
JavaScript 3. Le basi di JavaScript.
Recupero debito quarto anno Primo incontro
PHP.
Linguaggi di programmazione
1 Strutture dati nel supporto a run time. 2 Entità presenti quando un programma va in esecuzione §programmi dutente (compilati) §routines del supporto.
Liste Ordinate 3 Maggio Ultima Lezione Abbiamo visto i tipi di dato astratti IntList e StringList Realizzano liste di interi e di stringhe Realizzati.
Caratteri e stringhe di caratteri
Calcolatori Elettronici III
Laboratorio di Linguaggi lezione VI: puntatori 2/3 Marco Tarini Università dellInsubria Facoltà di Scienze Matematiche, Fisiche e Naturali di Varese Corso.
Laboratorio di Linguaggi lezione VI Marco Tarini Università dellInsubria Facoltà di Scienze Matematiche, Fisiche e Naturali di Varese Corso di Laurea in.
Laboratorio di Linguaggi lezione XI: I/O Marco Tarini Università dellInsubria Facoltà di Scienze Matematiche, Fisiche e Naturali di Varese Corso di Laurea.
1 Corso di Informatica (Programmazione) Lezione 12 (19 novembre 2008) Programmazione in Java: i metodi statici.
1 Corso di Laurea in Biotecnologie Informatica (Programmazione) Array Anno Accademico 2009/2010.
1 Corso di Laurea in Biotecnologie Informatica (Programmazione) Assegnamento di valore a una variabile Anno Accademico 2009/2010.
1 Corso di Informatica (Programmazione) Lezione 13 (21 novembre 2008) Programmazione in Java: stringhe e array.
1 Corso di Laurea in Biotecnologie Informatica (Programmazione) JAVA: funzione di output a video Anno Accademico 2009/2010.
1 Corso di Laurea in Biotecnologie Informatica (Programmazione) Problemi e algoritmi Anno Accademico 2009/2010.
1 Lezione XIII Lu 17-Nov-2005 Programmare le classi.
Array Struttura numerate di dati. Memorizzare molti dati In informatica cè spesso bisogno di memorizzare ed elaborare un insieme costituito da molti dati.
PHP – Un’introduzione Linguaggi e Traduttori 2003 Facoltà di Economia
La Riflessione computazione Elisa Ferrando. Cos è la Riflessione La Riflessione Sistema riflessivo Sistema computazionale.
Approfondimento delle classi
Organizzazione della Memoria (Unix) Text contiene le istruzioni in linguaggio macchina del codice eseguibile, può essere condiviso in caso di processi.
IL CONCETTO DI PACKAGE Una applicazione è spesso composta di molte classi (eventualmente correlate) Un package è un gruppo di classi che costi- tuiscono.
Corso di PHP.
Importanza DTD La DTD (Document Type Definition) consente di dichiarare in maniera univoca la struttura di markup mediante la definizione dello schema.
Elementi di programmazione ad oggetti a. a. 2009/2010 Corso di Laurea Magistrale in Ingegneria Elettronica Docente: Mauro Mazzieri, Dipartimento di Ingegneria.
JavaScript 1. Origine E uno dei primi linguaggi di scripting per il web sviluppato da Netscape nel 1995 E interpretato Ha alcune similarità sintattiche.
Che cos’è l’annotazione di un corpus?
Linguaggi di programmazione: funzioni Le funzioni richiedono un numero fisso o variabile di argomenti, ovvero valori che devono essere passati alla funzione.
Elementi di Informatica di base
Espressione polirematica
BIOINFO3 - Lezione 331 SUBROUTINE IN PERL Una subroutine (funzione, metodo, procedura o sottoprogramma), e` una prozione di codice all`interno di un programma.
Fopndamenti di programmazione. 2 La classe String Una stringa è una sequenza di caratteri La classe String è utilizzata per memorizzare caratteri La classe.
LINGUISTICA GENERALE E COMPUTAZIONALE, PARTE 2
LINGUISTICA GENERALE E COMPUTAZIONALE, PARTE 2
Linguaggi e modelli computazionali LS Manni Tiziano
Le variabili in Java Nella programmazione tradizionale, una variabile è una porzione di memoria in cui è immagazzinato un certo tipo di dato. Per esempio.
LdL - LP1 - lez 11 - ver 6 - aa Linguaggi di programmazione I Stringhe (II) Prof. Luigi Di Lascio Lezione 11.
1 Fabio Scotti ( ) Laboratorio di programmazione per la sicurezza Valentina Ciriani ( ) Laboratorio di programmazione Lezione 11 e 12 -
Linguaggi e Modelli di Programmazione Fabio Massimo Zanzotto.
JAVA Per iniziare. Verificare installazione javac –version java –version Cercare i files e sistemare eventualmente il path.
JavaScript Generalità Cos'è JavaScript?
Programmazione ad oggetti
Il linguaggio C Puntatori e dintorni.
Vettori, indirizzi e puntatori Finora abbiamo usato gli indirizzi nel chiamare  la funzione scanf()  le altre funzioni per riferimento Tuttavia la vera.
TEORIE E TECNICHE DEL RICONOSCIMENTO
1 Corso di Informatica (Programmazione) Lezione 8 (7 novembre 2008) Programmazione in Java: operatori aritmetici, operatori di assegnamento e cast.
TEORIE E TECNICHE DEL RICONOSCIMENTO
Vettori (a una dimensione)
Variabili Numeriche –Interi (byte, short, int, long): complemento a 2 –A virgola mobile (float, double): IEEE 745 Alfanumeriche –Carattere (char): Unicode.
TW Asp - Active Server Pages Nicola Gessa. TW Nicola Gessa Introduzione n Con l’acronimo ASP (Active Server Pages) si identifica NON un linguaggio di.
Lez.6 (13/14)Elementi di Programmazione1 Lezione 6 Funzioni Passaggio di parametri.
1 Processi e Thread Meccanismi di IPC (2) Problemi classici di IPC.
TEORIE E TECNICHE DEL RICONOSCIMENTO
ALLOCAZIONE STATICA: LIMITI Per quanto sappiamo finora, in C le variabili sono sempre dichiarate staticamente –la loro esistenza deve essere prevista e.
Ingegneria del software Modulo 1 -Introduzione al processo software Unità didattica 3 – Modelli di fase d’analisi Ernesto Damiani Università degli Studi.
Concetti Fondamentali sulla Programmazione
TEORIE E TECNICHE DEL RICONOSCIMENTO
TEORIE E TECNICHE DEL RICONOSCIMENTO Python: Dizionari.
Intelligenza Artificiale Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Tecnologie della lingua Human Language Technology (HLT)
TEORIE E TECNICHE DEL RICONOSCIMENTO Python: Debugging, 2: Understanding Python better.
Scratch.
TEORIE E TECNICHE DEL RICONOSCIMENTO
Il C `e un linguaggio di programmazione di uso generale, originariamente sviluppato per la scrittura del sistema operativo Unix, ed oggi disponibile su.
Transcript della presentazione:

LINGUISTICA GENERALE E COMPUTAZIONALE, PARTE 2 Lezione 3: cap. 2 Ancora Python NLTK: operazioni su corpora

Per rinfrescarsi la memoria … Lezione passata: Python: variabili, assegnamento, liste import nltk from nltk.book import * operazioni su testi: text1.concordance(‘whale’) operazioni su stringhe: s1.endswith(‘s’) controllo in Python

Python come un linguaggio ad oggetti Anche se non si direbbe, in Python ogni dato ha un TIPO, come in Java o C++ Per esempio, l’istruzione x = [1,2,3] automaticamente assegna a x il tipo LISTA La notazione text1.concordance(‘whale’) significa: ‘applica il metodo concordance del tipo di oggetti a cui text1 appartiene (il tipo text in questo caso) a text1, passando la stringa ‘whale’ come argomenti Vantaggi: e’ possibile usare la stessa notazione per operazioni simili su oggetti diversi Per esempio, x[0] si puo’ applicare sia quando x e’ una lista che quando x e’ una stringa

Due tipi di dati importanti in linguistica computazionale Testi (lezione passata) Corpora (questa lezione)

Cos’e’ un corpus? Una raccolta di documenti ANNOTATI o meno

Operazioni su corpora in NLTK x.fileids() (ritorna la lista di tutti i files nel corpus) x.raw(fileids=[‘austen-sense.txt’]) x.words(fileids=[‘austen-emma.txt’])

Esempi: Gutenberg nltk.corpus.gutenberg.fileids() emma=nltk.corpus.gutenberg.words(fileids=[‘austen-emma.txt’]) (p. 40)

Corpora in NLTK Non annotati: Annotati: Etc (vedi p. 46-47) Gutenberg Brown (POS tags) Reuters (genere di documenti) Movie reviews (sentiment) Etc (vedi p. 46-47)

Crearsi nuovi oggetti di tipo corpus Usando le librerie nltk e’ possibile trasformare qualsiasi raccolta di testi in un oggetto ‘corpus’ dentro Python

Creare nuovi oggetti di tipo corpus from nltk.corpus import PlaintextCorpusReader corpus_root=‘/Corpora/LiberLiber’ ll=PlaintextCorpusReader(corpus_root,’.*txt’) ll.fileids() ll.words(‘i_promes.txt’)

Ancora Python: riuso di codice Caricare moduli da testi Funzioni