Lezione 6 informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università

Slides:



Advertisements
Presentazioni simili
Distribuzione Normale o Curva di Gauss
Advertisements

Intervalli di confidenza
LA DERIVATA DI UNA FUNZIONE
Fondamenti della Misurazione
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.

Matematica e statistica Versione didascalica: parte 1
Studio funzioni by Mario Varalta Studio funzioni by Mario Varalta.
Esperienza n. 9 Uso dell’oscilloscopio per misure di ampiezza e frequenza di una tensione alternata e misura dello sfasamento tra tensioni. Circuito RLC.
G.M. - Informatica B-Automazione 2002/03 Funzione Indica una relazione o corrispondenza tra due o più insiemi che soddisfa ad alcune proprietà. Il dominio.
Corso di biomatematica lezione 4: La funzione di Gauss
Corso di biomatematica Lezione 2: Probabilità e distribuzioni di probabilità Davide Grandi.
La quantità di moto La quantità di moto di un sistema di punti materiali si ottiene sommando le quantità di moto di ciascun punto materiale Ricordando.
STATISTICA a.a DISTRIBUZIONE BINOMIALE (cenni)
G.M. - Informatica B-Automazione 2002/03 Estensione della conservazione dellenergia ai sistemi di punti materiali Se tutte le forze interne ed esterne.
Cenni di teoria degli errori
Laboratorio di El&Tel Elaborazione numerica dei segnali: analisi delle caratteristiche dei segnali ed operazioni su di essi Mauro Biagi.
1 Esempio : Utile per considerare limportanza delle ALTE FREQUENZE nella ricostruzione del segnale, in particolare dei FRONTI di SALITA e di DISCESA (trailing.
Lezione 2 informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università
Lezione 3 informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università
Lezione 6 informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università
informatica di base per le discipline umanistiche
informatica di base per le discipline umanistiche
Lezione 8 informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università
Lezione 4 informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università
Lezione 3 informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università
MASSIMI E MINIMI DI UNA FUNZIONE
Studio funzioni Premesse Campo esistenza Derivate Limiti Definizione di funzione Considerazioni preliminari Funzioni crescenti, decrescenti Massimi,
PROBABILITÀ La probabilità è un giudizio che si assegna ad un evento e che si esprime mediante un numero compreso tra 0 e 1 1 Evento con molta probabilità.
GRAFICO DI UNA FUNZIONE
METODI E CONTROLLI STATISTICI DI PROCESSO
Il Movimento Cinematica.
LA DERIVATA DI UNA FUNZIONE
Statistica economica (6 CFU) Corso di Laurea in Economia e Commercio a.a Docente: Lucia Buzzigoli Lezione 5 1.
Matematica Generale A cura di Beatrice Venturi Derivate
DERIVATA DI UNA FUNZIONE
Corso di Formazione per docenti di Scuola Superiore: Il calcolo infinitesimale nei licei non scientifici Febbraio-Marzo 2013 LaboratorioDidattico effediesse.
TRATTAMENTO DEI DATI ANALITICI
PREMESSE DELL’ANALISI INFINETISIMALE
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
DERIVATA DI UNA FUNZIONE
Regressione e correlazione
Il pricing dei derivati: Metodo di Montecarlo, Path Integrals
Corso di Formazione per docenti di Scuola Superiore: Il calcolo infinitesimale nei licei non scientifici Marzo-Aprile 2014 LaboratorioDidattico effediesse.
Matematica I: Calcolo differenziale, Algebra lineare, Probabilità e statistica Giovanni Naldi, Lorenzo Pareschi, Giacomo Aletti Copyright © The.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Prof Riccardi Agostino - ITC "Da Vinci"
Intelligenza Artificiale 1 Gestione della conoscenza lezione 19 Prof. M.T. PAZIENZA a.a
Strumenti statistici in Excell
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
Eventi aleatori Un evento è aleatorio (casuale) quando non si può prevedere con certezza se avverrà o meno I fenomeni (eventi) aleatori sono studiati.
La distribuzione campionaria della media
Elaborazione statistica di dati
Jean Baptiste Fourier iniziò a chiedersi se, con un’adeguata scelta delle ampiezze, delle frequenze e delle fasi, fosse stato possibile scomporre.
(II) Schema generale studio di funzioni
F U N Z I O N I Definizioni Tipi Esponenziale Logaritmica
TRATTAMENTO STATISTICO DEI DATI ANALITICI
I costi di produzione Nelle lezioni precedenti abbiamo considerato il funzionamento di un sistema di mercato. In questa lezione considereremo i costi di.
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Elementi di statistica e probabilità Misure Meccaniche e Termiche - Università di Cassino 2 Eventi aleatori e deterministici Un evento aleatorio può.
La derivata Docente Grazia Cotroni classi V A e V B.
FILTRI NUMERICI. Introduzione Nel campo nei segnali (analogici o digitali), un sistema lineare tempo-invariante è in grado di effettuare una discriminazione.
Teoremi sulle funzioni derivabili 1. Definizione di massimo globale x0x0 f(x 0 ) Si dice massimo assoluto o globale di una funzione il più grande dei.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
Esponenziali e Logaritmi
Distribuzioni limite La distribuzione normale Si consideri una variabile casuale rappresentata mediante una combinazione lineare di altre variabili casuali.
Gli Indici di VARIABILITA’
Transcript della presentazione:

lezione 6 informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia

lezione 6 sesta lezione: la dinamica del testo vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia

lezione 6 il lessico di un testo cresce quando introduciamo nel testo una parola mai usata prima intuitivamente la crescita di un lessico è rapida allinizio, in quanto ogni parola che usiamo ha la tendenza ad essere nuova (raramente ci sono ripetizioni nella stessa frase)rapida allinizio aumentando il numero di frasi, tuttavia, aumenta la probabilità di riusare parole già usate il ritmo di crescita del lessico di un testo tende quindi a diminuire allaumentare del numero di frasi...tende quindi a diminuire come cresce il lessico di un testo? (per saperne di più clicca sulle parole evidenziate!)

lezione 6 come cresce il lessico di un testo (prime 1000 parole) (torna indietro…) coefficiente angolare intercetta coefficiente angolare (continua…)

lezione 6 (torna indietro…) (fine excursus) come cresce il lessico di un testo (prime 1000 parole, interpolazione a potenza) (fine excursus)

lezione 6 esistono classi di parole che è praticamente impossibile non ripetere allinterno di un testo anche molto breve queste classi sono formate dalle cosiddette parole grammaticali (articoli, preposizioni, ausiliari ecc.), che costituiscono limpalcatura morfosintattica di una frase queste classi sono, tipicamente, relativamente ristrette (contengono pochi elementi) e chiuse, cioè non sono soggette ad espandersi attraverso processi produttivi del lessico come la derivazione o la composizionederivazione composizione come cresce il lessico di un testo? (II) (per saperne di più clicca sulle parole evidenziate!)

lezione 6 un altro fattore evidente che ritarda la crescita esponenziale del lessico allinterno dello stesso testo è la coerenza lessicale: la necessità, cioè,di ripetere concetti che sono legati al dominio o alla situazione specifica di cui parla il testo come cresce il lessico di un testo? (III)

lezione 6 la frequenza media di una parola nel testo è data dal rapporto tra la lunghezza del testo e la grandezza del suo lessico: C / | V | allinizio ogni parola è usata in media poco più di una sola volta (freq media 1) non appena ripetiamo una stessa parola, tuttavia, la freq media cresce (freq media > 1) in generale freq media tende a crescere per due ragioni:freq media tende a crescere le parole grammaticali si ripetono, andando ad aggiungersi a C ma lasciando |V | invariato; il vocabolario a sua volta, come abbiamo visto, rallenta il suo ritmo di crescita col passare del testo la frequenza media (per saperne di più clicca sulle parole sottolineate!)

lezione 6 il ritmo di crescita di freq media tende a rallentare col passare del testotende a rallentare perché? la frequenza cresce linearmente al crescere del testo se il peso del lessico fosse costante, la crescita di freq media resterebbe lineare, ma avrebbe un ritmo inferiore (la retta che descrive questo andamento sarebbe più inclinata verso lasse delle x)freq media resterebbe lineare se il peso del lessico aumentasse in modo lineare, freq media sarebbe costante dal momento che il lessico cresce in modo non lineare (con una potenza di poco inferiore allunità) solo una crescita di frequenza non lineare (con esponente di poco inferiore a 2) potrebbe consentire a freq media di crescere linearmente come cresce freq media? (per saperne di più clicca sulle parole sottolineate!)

lezione 6 crescita di freq media in un testo di parole (fine excursus)

lezione 6 curve di crescita del lessico (torna indietro…) (continua…)

lezione 6 crescita di freq media (torna indietro…) (fine excursus)

lezione 6 no! la lunghezza media di una parola tende a stabilizzarsi col passare del testo, cioè tende ad assumere un valore costante dopo una serie di oscillazioni casuali (legge dei grandi numeri) cresce tutto in questo modo?

lezione 6 campionamento casuale … analogamente se invece di monitorare lo stesso testo nel tempo, se ne estraggono tanti campioni casuali, e se ne calcola per ciascuno lun media, il valore più volte attestato tenderà a riprodurre lun media di tutto il testo...

lezione 6 campionamento casuale (II)... tanto meglio, quanto maggiore è la lunghezza dei campioni:

lezione 6 campionamento casuale (III) per il teorema del limite centrale, i valori campionari di lunghezza media tenderanno a distribuirsi intorno al valore più attestato (valor medio) secondo una caratteristica forma a campana (curva gaussiana) e cioè con valori progressivamente decrescenti, disposti simmetricamente rispetto allasse della campana...(curva gaussiana) (per saperne di più clicca sulle parole evidenziate!)

lezione 6 la legge di Zipf allinterno di una porzione di testo, esiste una correlazione inversa tra le frequenza di una parola e la sua posizione relativa (rango) in una lista di parole che va dalla più frequente alla meno frequente

lezione 6 Zipf (II)

lezione 6 logaritmo e funzione esponenziale (torna indietro…)

lezione 6 conseguenze della scala logaritmica le potenze di 10 vengono compresse in un intervallo unitario il livello di compressione cresce al crescere della potenza (torna indietro…) (fine excursus)

lezione 6 Zipf (III) su doppia scala logaritmica la legge di Zipf dà origine a una retta inclinata verso il basso....doppia scala logaritmica

lezione 6 la struttura del lessico (classi di frequenza) chiamiamo V i la classe di parole che appaiono con frequenza i volte ciascuna nel testo allora |V |= |V 1 | + |V 2 | |V max |, dove max è la frequenza massima con cui una parola appare nel nostro testo

lezione 6 fine sesta lezione sesta lezione la dinamica del testo (lezione 7)

lezione 6 la derivazione è uno di quei processi morfologici produttivi attraverso i quali il nostro vocabolario si arricchisce la derivazione consiste nel generare una parola nuova a partire da unaltra già esistente attraverso luso di un suffisso derivazionale ad esempio, dal sostantivo industria possiamo derivare laggettivo industriale, da questultimo il verbo industrializzare e da questultimo il sostantivo industrializzazione una parola derivata è una parola nuova, con una sua categoria grammaticale autonoma e un suo paradigma flessionale, non una forma flessa di una parola esistente derivazione (fine excursus)

lezione 6 la composizione è uno di quei processi morfologici produttivi attraverso i quali il nostro vocabolario si arricchisce la composizione, a differenza della derivazione, consiste nel generare una parola nuova giustapponendo due (o più) parole esistenti ad esempio, oggetto ricordo, conferenza stampa, nave scuola, sala riunioni ecc. composizione (fine excursus)

lezione 6 la distribuzione gaussiana 68.27% (fine excursus)