Laboratorio di Processi Stocastici Alberto Sorrentino www.fisica.unige.it/~sorrentino/Teaching.

Slides:



Advertisements
Presentazioni simili
Dr. Marta Giorgetti Esercizi Calcolo combinatorio, spazio degli eventi, probabilità, indipendenza, teorema di Bayes.
Advertisements

Elementi di calcolo delle probabilità
Laboratorio Processi Stocastici
2. Introduzione alla probabilità
Definizione di probabilità, calcolo combinatorio,
Variabili aleatorie discrete e continue
La probabilità.
Numeri casuali Cos’e’ un numero casuale? 3 e’ un numero casuale?
Matematica I: Calcolo differenziale, Algebra lineare, Probabilità e statistica Giovanni Naldi, Lorenzo Pareschi, Giacomo Aletti Copyright © The.
Matematica I: Calcolo differenziale, Algebra lineare, Probabilità e statistica Giovanni Naldi, Lorenzo Pareschi, Giacomo Aletti Copyright © The.
Matematica I: Calcolo differenziale, Algebra lineare, Probabilità e statistica Giovanni Naldi, Lorenzo Pareschi, Giacomo Aletti Copyright © The.
Laboratorio Processi Stocastici
1 2. Introduzione alla probabilità Definizioni preliminari: Prova: è un esperimento il cui esito è aleatorio Spazio degli eventi elementari : è linsieme.
Definizioni Chiamiamo esperimento aleatorio ogni fenomeno del mondo reale alle cui manifestazioni può essere associata una situazione di incertezza. Esempi:
Funzione di distribuzione (detta anche cumulativa o di ripartizione)
3. Processi Stocastici Un processo stocastico è una funzione del tempo i cui valori x(t) ad ogni istante di tempo t sono v.a. Notazione: X : insieme di.
Progetto Pilota 2 Lettura e interpretazione dei risultati
Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia l’analisi statistica.
VARIABILI ALEATORIE Sono presentate di seguito le nozioni di:
Le Variabili Casuali Corso di Teoria dell’Inferenza Statistica 1
UN ESEMPIO DI ESPERIMENTO CASUALE
Processi Aleatori : Introduzione – Parte I
Distribuzioni di probabilità
Fare scienza con il computer
Istituto Tecnico industriale “L. Galvani” v
Corso di biomatematica Lezione 2: Probabilità e distribuzioni di probabilità Davide Grandi.
STATISTICA a.a VARIABILITA’ BIOLOGICA E CASO
VERIFICA DEI RIFLESSI …Tutto ciò che avreste voluto sapere e non avete mai osato chiedere… M. & D.
Corso di Laboratorio di Informatica
Alla scoperta di una regolarità…
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
Elaborazione di Immagini II Parte Lezione N.2
ALCUNI STRUMENTI DELLA GEOGRAFIA
Statistica economica (6 CFU) Corso di Laurea in Economia e Commercio a.a Docente: Lucia Buzzigoli Lezione 5 1.
QUALCHE LUCIDO DI RIPASSO… 1. Esperimento casuale ( e. aleatorio) risultato Esperimento condotto sotto leffetto del caso: non è possibile prevederne il.
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
Le rappresentazioni grafiche
STATISTICA INFERENZIALE
Corso di Laboratorio di Informatica
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
è … lo studio delle caratteristiche di regolarità dei fenomeni casuali
Calcolo combinatorio e probabilità
Laurea Ing EO/IN/BIO;TLC D.U. Ing EO 10 PROBABILITA’ E VARIABILI ALEATORIE.
Le rappresentazioni grafiche
Calcolo delle probabilità a cura di Maurizio Brizzi
“Teoria e metodi della ricerca sociale e organizzativa”
Probabilità. Un percorso didattico esperimenti e simulazioni L. Cappello 9 Maggio Didattica probabilità e statistica PAS 2014.
Laboratorio di Processi Stocastici Alberto Sorrentino
Master in Neuropsicologia ClinicaElementi di Statistica I 17 maggio / 23 Analisi bivariata Per ogni unità statistica si considerano congiuntamente.
Automi temporizzati.
Distribuzioni di probabilità di uso frequente
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
La curva di Gauss Prof. Marco Lombardi.
Eventi aleatori Un evento è aleatorio (casuale) quando non si può prevedere con certezza se avverrà o meno I fenomeni (eventi) aleatori sono studiati.
La distribuzione campionaria della media
ELEMENTI DI CALCOLO DELLE PROBABILITA’
Studio fenomeni collettivi
TRATTAMENTO STATISTICO DEI DATI ANALITICI
In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Rosoluzione.
La probabilità matematica
Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.
1 VARIABILI CASUALI. 2 definizione Una variabile casuale è una variabile che assume determinati valori in modo casuale (non deterministico). Esempi l’esito.
ELEMENTI DI CALCOLO DELLE PROBABILITA’. Evento Aleatorio Un evento si dice aleatorio se può o non può verificarsi (Alea in greco vuol dire dado)
1 TEORIA DELLA PROBABILITÁ. 2 Cenni storici i primi approcci alla teoria della probabilità sono della metà del XVII secolo (Pascal, Fermat, Bernoulli)
Introduzione alle distribuzioni di probabilità di Gauss o normale di Bernoulli o binomiale di Poisson o dei casi rari.
Un evento è un fatto che può accadere o non accadere. Se esso avviene con certezza si dice evento certo, mentre se non può mai accadere si dice evento.
Teoria dei Sistemi di Trasporto Tematica 4: Elementi minimi di teoria della probabilità.
Transcript della presentazione:

Laboratorio di Processi Stocastici Alberto Sorrentino

Ancora (poco) sugli istogrammi Esiste un comando che fa esattamente quello che avete fatto ieri: l’istogramma delle frequenze dei valori di un vettore hist(data) hist(data,50)istogramma in 50 intervalli data = load(‘dato_per_istogramma.dat’) [counts bins] = hist(data,50)i conteggi in counts, i punti medi degli intervalli in bins

Generazione di numeri casuali In moltissime applicazioni può essere utile avere a disposizione sequenze di numeri “casuali”. La realtà abbonda di eventi casuali, lancio di monete, di dadi, estrazioni di carte da un mazzo... Ma come averne TANTI? Esistono ALGORITMI che generano (in modo deterministico) sequenze di numeri che soddisfano determinate proprietà statistiche  pseudorandom numbers “La generazione di numeri casuali è troppo importante per esser lasciata al caso”. Esistono generatori hardware di numeri casuali, che sfruttano fenomeni fisici (radioattività, fenomeni atmosferici,...)

Un algoritmo per generare numeri random Generatore congruenziale lineare a = 7^5 M = 2^(31)-1 c=0 L(1) = 1; for i = 2:100 L(i) = mod(a*L(i-1)+c, M) u(i) = L(i)/M end Generatore “periodico”: periodo massimo M, raggiungibile solo se 1.c e M sono primi tra loro 2.a-1 è divisibile per tutti i fattori primi di M 3.a-1 è multiplo di 4 se M è multiplo di 4 resto = mod(dividendo,divisore) Gli u(i) sono distribuiti in maniera uniforme tra 0 e 1. Provare per credere

Verifica (NON dimostrazione) funzionamento 1. Fare istogramma dei numeri random generati 2. Modificare la lunghezza del vettore di numeri casuali (ad es. 100, 1,000 e 10,000) e osservare la “omogeneità” della distribuzione E se la distribuzione uniforme ci stesse stretta???

Generare numeri casuali con distribuzione arbitraria Funzione dei quantili: Data la variabile aleatoria X, con funzione di ripartizione F, si chiama funzione dei quantili la funzione Q : (0,1)  R definita da Nota: Teorema: se la variabile X ha funzione dei quantili Q, e U è una variabile aleatoria uniforme in (0,1), X e Q ( U ) hanno la stessa legge

Metodo dei quantili densità funzione di ripartizione funzione dei quantili Il teorema ci fornisce una regola per generare numeri con distribuzione arbitraria: se conosciamo Q, prendiamo i numeri {u i } distribuiti secondo la legge uniforme e {Q(u i )} sono distribuiti secondo F.

Esempio: distribuzione esponenziale La funzione di ripartizione Prendiamo i numeri del “nostro” generatore, applichiamo Q e... exp_rand = -log(1.-u); data = exp_rand; istogramma Generare numeri distribuiti secondo la legge esponenziale: se i numeri {u i } sono distribuiti secondo la legge uniforme, {Q(u i )} hanno F come funzione di ripartizione. (Nota: per distribuzioni continue, Q è la funzione inversa di F) La funzione dei quantili

Tanto ormai lo immaginate... Ora provate... data = rand(1,1000) hist(data) data = exprand(1,1,1000) hist(data) poissrndPoisson randnGaussiana

Parte 1 Giocando con dati veri...

(folklore) Il CitoMegaloVirus Esempio tratto da Stat Labs – Mathematical Statistics Through Applications Anteprima su books.google.it Il citomegalovirus (CMV) appartiene alla famiglia degli Herpesvirus (tra cui varicella, Herpes Simplex e altri). E’ molto comune e in generale asintomatico. La maggior parte degli adulti ne è portatore sano. In persone con immunodeficienza (ad es. AIDS) la malattia ha invece un decorso grave, con possibili polmonite, encefalite, epatite, ulcere, et cetera...

(folklore) Patterns in DNA Il DNA contiene tutta l’informazione per la vita del virus. Il DNA può esser pensato come una lunga sequenza i cui elementi base sono 4 lettere (ACGT). Le lettere sono a due a due complementari (A-T e C-G). A causa del numero esiguo di “lettere”, il DNA contiene molti “patterns” (strutture).

In molti virus della stessa famiglia, il punto in cui ha origine la replicazione del virus è indicato dalla presenza di palindromi complementari. Un palindromo complementare è una sequenza di lettere tale che la sua complementare, letta al contrario, è uguale alla sequenza stessa; ad esempio ATGGTACCAT  TACCATGGTA  ATGGTACCAT Individuare il punto di origine della replicazione di un DNA può aiutare a realizzare farmaci e vaccini per combattere il virus. (folklore) Patterns in DNA

Problema Dati: le localizzazioni di tutte le sequenze di palindromi lunghe almeno 10 basi (l’intera sequenza del DNA del CMV pubblicata nel 1990 da Leung et al.) Individuare i siti di replicazione in laboratorio è una procedura molto laboriosa (si spezzetta il DNA in segmenti e si cerca di far replicare ciascun segmento). L’obiettivo è quello di individuare il sito di replicazione su base statistica, osservando la distribuzione dei palindromi e cercando eventuali anomalie nella distribuzione stessa.

Osserviamo il dato carichiamo il dato data = load( ‘ DATA_DNA.dat ‘ ); Un’occhiata ai datiplot(data) Un plot più significativo plot(data,ones(size(data)), ‘. ‘) Meglio ancorahist(data) Guardiamo come son distribuite le distanze tra uno e il successivo Il DNA del CMV contiene 229,354 “lettere”. Le posizioni dei 296 palindromi lunghi almeno 10 lettere sono contenute nel file DATA_DNA.dat hist(data(2:end)-data(1:end-1))

Istogrammi in quanti intervalli?? Pochi intervalli  buona statistica, poca informazione Tanti intervalli  poca statistica, molta informazione NUM = [ ] for i=1:size(NUM,2) figure hist(data,NUM(i)) end Domanda: possono questi dati essere frutto di una distribuzione casuale? 1.costruiamo dei dati distribuiti “a caso” e li confrontiamo coi nostri 2.confrontiamo i dati del DNA con i valori attesi tramite test statistici Facciamo istogrammi con diverso numero di intervalli

Parte 1.1 confronto con dati simulati

Quale modello per i dati? Abbiamo 296 valori distribuiti su un segmento (il DNA) di lunghezza 229,354 Quale modello matematico potrebbe descrivere i nostri dati? Abbiamo osservato un discreto livello di omogeneità. Abbiamo osservato la distribuzione delle differenze tra palindromi contigui. Gli indizi accumulati puntano verso il processo di Poisson!