5. Catene di Markov a tempo discreto (CMTD)

Slides:



Advertisements
Presentazioni simili
Training On Line - CONP. 2 Richiesta Da Menu: Conferimenti ad inizio anno termico > Agosto > Pluriennali > Nuova Richiesta Si accede alla pagina di Richiesta.
Advertisements

- le Medie la Moda la Mediana
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Caduta non guidata di un corpo rettangolare in un serbatoio Velocità e rotazione.
Le distribuzioni di probabilità continue
I numeri naturali ….. Definizione e caratteristiche
SCALA INTERVALLO / A RAPPORTO
2. Introduzione alla probabilità
1 MeDeC - Centro Demoscopico Metropolitano Provincia di Bologna - per Valutazione su alcuni servizi erogati nel.
Mat_Insieme Lavoro di Gruppo Prodotti Notevoli
TAV.1 Foto n.1 Foto n.2 SCALINATA DI ACCESSO ALL’EREMO DI SANTA CATERINA DEL SASSO DALLA CORTE DELLE CASCINE DEL QUIQUIO Foto n.3 Foto n.4.
1 Pregnana Milanese Assessorato alle Risorse Economiche Bilancio Preventivo P R O P O S T A.
COORDINATE POLARI Sia P ha coordinate cartesiane
LE MATRICI.
6. Catene di Markov a tempo continuo (CMTC)
1 2. Introduzione alla probabilità Definizioni preliminari: Prova: è un esperimento il cui esito è aleatorio Spazio degli eventi elementari : è linsieme.
Introduzione Cosa sono le reti di Petri?
Frontespizio Economia Monetaria Anno Accademico
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
1 Il punto di vista Un sistema è una parte del mondo che una persona o un gruppo di persone, durante un certo intervallo di tempo, sceglie di considerare.
I sistemi di riferimento
Lez. 3 - Gli Indici di VARIABILITA’
6. Catene di Markov a tempo continuo (CMTC)
3. Processi Stocastici Un processo stocastico è una funzione del tempo i cui valori x(t) ad ogni istante di tempo t sono v.a. Notazione: X : insieme di.
4. Automi temporizzati Il comportamento dei sistemi ad eventi temporizzati non è definito semplicemente da una sequenza di eventi o di valori dello stato,
Implementazione dell algortimo di Viterbi attraverso la soluzione del problema di cammino mi- nimo tramite software specifico. Università degli studi di.
Ordini Parziali - Reticoli
I MATEMATICI E IL MONDO DEL LAVORO
Algoritmi e Strutture Dati Capitolo 2 Modelli di calcolo e metodologie di analisi.
EIE 06/07 II / 1 Strumenti delle politiche agricole in economia aperta equilibrio di mercato in economia aperta politiche di un paese importatore politiche.
EIE 0607 III / 1 A B P a = 30 P b = 35 t = 2, tc = 1 Questo può essere un equilibrio? No! Politiche di un paese importatore: una tariffa allimportazione.
Algoritmo di Ford-Fulkerson
Processi Aleatori : Introduzione – Parte I
Programmazione 1 9CFU – TANTE ore
7. Teoria delle Code Una coda è costituita da 3 componenti fondamentali: i serventi i clienti uno spazio in cui i clienti attendono di essere serviti.
8. Reti di Code Nella maggior parte dei processi produttivi risulta troppo restrittivo considerare una sola risorsa. Esempio: linea tandem arrivi 1 v.
Canale A. Prof.Ciapetti AA2003/04
Ufficio Studi UNIONCAMERE TOSCANA 1 Presentazione di Riccardo Perugi Ufficio Studi UNIONCAMERE TOSCANA Firenze, 19 dicembre 2000.
Realizzazione e caratterizzazione di una semplice rete neurale per la separazione di due campioni di eventi Vincenzo Izzo.
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
Seminario su clustering dei dati – Parte II
1 A cura di Vittorio Villasmunta Metodi di analisi dei campi meteorologici Corso di base sulluso del software di analisi meteorologica DIGITAL ATMOSPHERE.
Master universitario di II livello in Ingegneria delle Infrastrutture e dei Sistemi Ferroviari Anno Accademico 2012/2013 Cultura dimpresa, valutazione.
La partita è molto combattuta perché le due squadre tentano di vincere fino all'ultimo minuto. Era l'ultima giornata del campionato e il risultato era.
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Scritte scritte scritte scritte scritte scritte scritte Scritte scritte Titolo.
Cos’è un problema?.
Lezione 4 Probabilità.
Contatore: esempio di circuito sequenziale
Velocità ed accelerazione
Esercitazione 1: Rispetto al test di ansia (Media=25; σ=5), calcolare:
Definizione di determinante
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
Bando Arti Sceniche. Per poter procedere è indispensabile aprire il testo del Bando 2ROL - Richieste On Line.
Lezioni di Ricerca Operativa Corso di Laurea in Informatica
TRASFORMAZIONI GEOMETRICHE
LE SAI LE TABELLINE? Mettiti alla prova!.
1 Questionario di soddisfazione del servizio scolastico Anno scolastico 2011/2012 Istogramma- risposte famiglie.
Un trucchetto di Moltiplicazione per il calcolo mentale
21 marzo 2002 (ri-)Avvisi: Giovedi 28 marzo la lezione e sospesa. Nuovo indirizzo di Spedire messaggi e esercizi solo.
DIPARTIMENTO DI ELETTRONICA E INFORMAZIONE Come affrontare un problema… Marco D. Santambrogio – Ver. aggiornata al 18 Ottobre.
Esempi risolti mediante immagini (e con excel)
Numeri Interi senza segno
Massimo comun divisore
Acceleratori e Reattori Nucleari
Il numero più grande Accademia dei Lincei
TRASFORMATA DI FOURIER
A.P. cat. B - 1 Per chi vuole: Libro di testo D.P. Curtis, K. Foley, K. Sen, C. Morin Informatica di base 2° edizione Mc Graw-Hill Companies.
DIPARTIMENTO DI ELETTRONICA E INFORMAZIONE Come affrontare un problema… Marco D. Santambrogio – Ver. aggiornata al 21 Agosto.
R. Soncini Sessa, MODSS, S27 Stima degli effetti (Wald) Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
Transcript della presentazione:

5. Catene di Markov a tempo discreto (CMTD) Definizione: CATENA Le catene sono p.s. in cui lo stato è discreto : X={x1,x2, … }. L’insieme X può essere sia finito sia infinito numerabile. Il tempo può essere discreto o continuo.

Catene di Markov a tempo discreto In una CMTD le transizioni di stato possono verificarsi solo in istanti di tempo discreti. Inoltre, k N, Pr{ x(k+1)=xk+1 | x(k)=xk, x(k-1)= xk-1, … , x(0)=x0 } = Pr{ x(k+1)=xk+1 | x(k)=xk } [Proprietà di Markov]

Una CMTD è una tripla C=(X,P(k),(0)) dove: X : insieme degli stati, P(k) : matrice delle probabilità di transizione dello stato all’istante k (kN) P(k) = [ pij(k) ] pij(k) = Pr{ x(k+1)=xj| x(k)=xi } xi,xjX,  kN (0): distribuzione di probabilità assoluta iniziale (vettore riga) (0)=[ i(0), iN ] dove i(0)=Pr{ x(0)=xi }, xi  X

La matrice P(k) soddisfa le seguenti condizioni k N : pij(k) [0,1], xi,xjX xj X pij(k) = 1 xiX la somma degli elementi lungo una riga è = 1 Ogni matrice che soddisfa tali condizioni viene detta matrice stocastica e gode della seguente proprietà: almeno un autovalore è = 1, tutti gli altri autovalori hanno modulo  1.

Se la matrice P(k) = cost Se la matrice P(k) = cost. allora la CMTD ad essa relativa viene detta omogenea. Esempio: modello meteorologico. x0 = pioggia, x1 = sole a = prob. che domani piova se oggi piove b = prob. che domani ci sia il sole se oggi c’è il sole

Ad una CMTD omogenea è possibile associare una rappresentazione grafica data da un grafo orientato e pesato G=(V,A) dove: V = X (ad ogni stato corrisponde un vertice) A  X  X (insieme degli archi dove il peso del generico arco a = (xi,xj) è pari a pij). Esempio: modello meteorologico. x0 = pioggia, x1 = sole x1 x0 b 1-b a 1-a N.B. La somma dei pesi degli archi uscenti da ciascun vertice deve essere pari a 1.

Equazioni di evoluzione Sia (k) = [ i(k), iN ] dove i(k) = Pr{ x(k)=xi }, xi  X, ossia (k) indica il vettore riga delle probabilità assolute all’istante k. Per ogni k > 0 vale la seguente relazione: (k) = (k-1) P(k-1) xj Segue dal fatto che per ogni j: j(k)= xi X Pij(k-1) i(k-1) Equazione di Chapman-Kolmogorov (k) = (0) P(0) P(1) … P(k-1)

Nel caso in cui la CMTD è omogenea: (1) = (0) P (2) = (1) P = (0) P 2 : (k) = (k-1) P = (0) P k Equazione di Chapman-Kolmogorov per CMTD omogenea

Esempio: si consideri un robot sempre alimentato che prende i pezzi e li mette in un deposito di capacità infinita. X={I,T,G} I = inattivo, T = in trasferimento, G = guasto. T I 1-r- q r 1-p p G 1-s q s p: p. che inizi a lavorare, r: p. che concluda la lavoraz.

(0) = [1 0 0] (1) = (0) P = [1-p p 0] (2) = (1) P = [(1-p)2 + rp p(1-p) + p(1-r-q) pq] In tal modo posso studiare il transitorio della CMTD.

Ricordiamo ora le seguenti definizioni: 3 componenti fortemente connesse T E T: componente transitoria o transiente E: componente ergodica o assorbente

N.B. Dato un grafo orientato, un sotto-insieme di nodi costituisce una componente fortemente connessa se e solo se ogni nodo è raggiungibile da un qualunque altro nodo seguendo un cammino orientato.

Definizione: probabilità di transizione ad n passi pij(k,k+ n) = Pr{ x(k+n)=xj | x(k)=xi }, Se la catena è omogenea, chiaramente tale probabilità non dipende da k, ma solo da n. Notazione: pij(n) = pij(k,k+ n)

Classificazione degli stati di una CMTD Uno stato xjX è detto raggiungibile o accessibile da un altro stato xiX, se è possibile che una sequenza di transizioni di stato porti la CMTD dallo stato xi allo stato xj, ossia se  n: pij(n) > 0. Due stati mutuamente raggiungibili sono detti comunicanti. Se ogni stato in X è comunicante con ciascuno degli altri stati, la CMTD è detta irriducibile. In caso contrario è detta riducibile.

Tali proprietà sono facilmente verificabili a partire dal grafo associato alla CMTD: uno stato è raggiungibile da un altro in n passi se esiste almeno un cammino orientato dal primo al secondo di lunghezza n; Due stati comunicanti appartengono alla stessa componente fortemente connessa; la CMTD è irriducibile se il grafo ad essa associato è fortemente connesso.

Per ogni stato xi X la probabilità di ritorno in n passi, ossia la probabilità che il primo ritorno nello stato xi lasciato all’istante k avvenga all’istante k+ n, è definita come i(n) = Pr{ x(k+1)  xi, … , x(k+n-1)  xi, x(k+n) = xi | x(k) = xi } La probabilità di ritorno allo stato xi è

Uno stato xi X è detto: transiente, se i < 1; ricorrente, se i = 1 (il ritorno a xi è certo); ricorrente con periodo d se esiste un d > 1 massimo comune divisore dell’insieme { n>0 | pii(n) > 0 }; ricorrente aperiodico, se d=1 è il massimo comune divisore dell’insieme { n>0 | pii(n) > 0 };

Dall’osservazione del grafo, possiamo invece dedurre quanto segue. In una CMTD uno stato è: transiente se e solo se appartiene ad una componente transiente; ricorrente se e solo se appartiene ad una componente ergodica.

Esempi: Date le seguenti CMTD, vogliamo capire se lo stato ricorrente x1 è periodico { n>0 | p11(n) > 0 } = {3, 6, 9, … } 1) x2 x1 1 x3 MCD=3 --> x1 è periodico di periodo 3 2) x2 x1 1 x3 0.5 x4 { n>0 | p11(n) > 0 } = {3, 6, 9, … , 4, 8, 12, … , 7, 11, … } MCD=1 --> x1 è aperiodico

x2 x1 0.3 x3 1 x4 0.7 3) { n>0 | p11(n) > 0 } = {3, 6, 9, … , 2, 4, 8, … , 5, 7, ... } MCD=1 --> x1 è aperiodico 4) x2 x1 0.3 x3 1 x4 0.7 x5 { n> 0 | p11(n) > 0 } = {2, 4, 6, 8, … } MCD=2 --> x1 è periodico di periodo 2 { n>0 | p44(n) > 0 } = {4, 6, 8, 10, … } MCD=2 --> x4 è periodico di periodo 2

Interpretazione fisica: Se uno stato ricorrente xi è periodico di periodo d, allora tutte le sequenze che hanno origine da xi e terminano in xi hanno lunghezza multipla del periodo d. Inoltre, qualunque sequenza che abbia origine in xi ma la cui lunghezza non è un multiplo del periodo, certamente non termina in xi. Se invece uno stato ricorrente xi è aperiodico, è possibile che le sequenze che hanno origine in xi e la cui lunghezza è pari ad multiplo intero di una certa costante terminino ancora in xi. Tuttavia tali sequenze non sono le sole che terminano in xi.

Osservazione: La periodicità di uno stato dipende solo dalla struttura del grafo non dal particolare valore che dei pesi associati agli archi.

Periodicità di una componente ergodica Sia P la matrice delle probabilità di transizione relativa alla sola componente ergodica. Sia  = { n | p(n)ii > 0  i }. Se D = MCD {  } > 1, la componente ergodica è periodica di periodo D. Se D=1 la componente ergodica è aperiodica.

Es. n3 x2 x1 1  = { n | p(n)ii > 0  i } = {2, 4, 6, … } D=2

Proposizione: Una componente ergodica è periodica se solo se tutti i suoi stati sono periodici. Ciò significa che gli stati di una componente ergodica possono essere o tutti periodici o tutti aperiodici Si può inoltre dimostrare che nel caso in cui tutti gli stati sono periodici, questi hanno lo stesso periodo e tale periodo coincide con il periodo D della componente ergodica.

x2 x1 1 0.4 x3 x4 0.6 Esempio Tutti gli stati sono periodici di periodo 2 per cui la componente ergodica è anch’essa periodica di periodo 2.

Come caso particolare di quanto sopra: Se una CMTD è irriducibile allora o tutti gli stati sono aperiodici, o tutti gli stati sono periodici con lo stesso periodo. Se in una CMTD lo spazio X è finito, allora almeno uno degli stati è ricorrente (il ritorno ad esso è certo).

Esempio x1 x0 0.3 0.7 0.4 0.6 x4 1 0.5 x3 x2 x5 0.1 La CMTD è riducibile: non tutti gli stati sono comunicanti ossia mutuamente raggiungibili.

Vi sono 4 componenti fortemente connesse: 3 egodiche ({x0, x1}, {x2, x3}, {x4}) e una transiente ({x5}). Tutti gli stati sono ricorrenti tranne x5 che è transiente. Gli stati x0, x1 e x4 sono aperiodici. Gli stati x2 e x3 sono periodici di periodo d=2.

Distribuzione stazionaria Consideriamo ora CMTD omogenee. Distribuzione stazionaria Una distribuzione di probabilità assoluta s viene detta stazionaria se e solo se sono verificate le seguenti condizioni: Se s è una distribuzione stazionaria, ciò significa che se tale distribuzione viene raggiunta in un dato istante, allora questa rimarrà inalterata in tutti gli istanti successivi.

Osservazione: Non e’ detto che una CMTD ammetta distribuzione stazionaria. Non e’ detto che se esiste una certa distruzione stazionaria questa sia unica.

Distribuzione limite Una CMTD ha una distribuzione limite se per k , la distribuzione di probabilità assoluta tende ad un vettore costante, ossia Proposizione: Se l è una distribuzione limite, allora essa è anche stazionaria. Dim. (k) = (k-1) P

Ergodicità Una CMTD è ergodica se e solo se: 1) esiste 2) tale limite è unico e non dipende dalla particolare distribuzione iniziale (0). Se tali condizioni sono verificate, è sufficiente studiare una qualunque realizzazione per capire il comportamento della catena a regime.

Osservazione: Se una CMTD è ergodica, il calcolo della distribuzione limite si riduce al calcolo di una componente stazionaria (ossia alla risoluzione di un sistema lineare di equazioni di primo grado).

Esempio n1 x2 x1 1 0.1 0.9

Sia La CMTD è pertanto ergodica. N.B. Se avessimo saputo a priori che il sistema è ergodico, avremmo potuto calcolare la distribuzione limite tenendo conto che in tal caso questa coincide con la distribuzione stazionaria (risolvendo quindi un semplice sistema lineare).

Osservazione: Il risultato ottenuto era del tutto prevedibile in base alla struttura del grafo. Se infatti lo stato iniziale è x1 (stato transiente), si potrà per un certo tempo rimanere in tale stato, ma prima o poi si effettuerà la transizione che porta ad x2. Una volta arrivati ad x2 (stato assorbente), lo stato non può più cambiare. Se lo stato iniziale è x2 lo stato x1 non verrà invece mai raggiunto.

Esempio n2 x2 x1 1 0.5 x3 se se Tale CMTD è quindi non ergodica.

Osservazioni: Anche in questo caso il risultato ottenuto era del tutto prevedibile in base alla struttura del grafo. È facile verificare che esistono infinite distribuzioni stazionarie

Esempio n3 x2 x1 1 Quindi, in generale non esiste a meno che non sia La CMTD non è ergodica.

N.B. In questo caso esiste una sola distribuzione stazionaria Possono pertanto presentarsi tre diverse situazioni: la CMTD è ergodica la CMTD non è ergodica in quanto la distribuzione limite esiste ma dipende dalla particolare distribuzione iniziale la CMTD non è ergodica in quanto la distribuzione limite non esiste (se non per qualche particolare distribuzione iniziale)

Criterio degli autovalori Esistono due diverse tecniche che permettono di studiare l’ergodicità di una CMTD omogenea. Criterio degli autovalori Teorema: Una CMTD omogenea finita è ergodica se e solo se gli autovalori della matrice P hanno tutti modulo < 1, tranne uno che ha chiaramente modulo unitario (essendo P una matrice stocastica). Es. n1 ergodica

Es. n2 non ergodica Es. n3 non ergodica

Criterio grafico Teorema: Condizione necessaria affinché una CMTD omogenea finita sia ergodica è che il grafo ad essa associato ammetta un’unica componente ergodica. Es. n1 x2 x1 1 0.1 0.9 La condizione necessaria è verificata essendo {x2} l’unica componente ergodica. Ciò tuttavia non basta per concludere che tale CMTD è ergodica.

Es. n2 La condizione necessaria non è verificata in quanto vi sono due componenti ergodiche ({x2} e {x3}). Possiamo subito concludere che tale CMTD non è ergodica. x2 x1 1 0.5 x3 x2 x1 1 Es. n3 La condizione necessaria è verificata essendo {x1, x2} una componente ergodica. Non posso però concludere che tale CMTD è ergodica.

Teorema: Condizione necessaria e sufficiente affinchè una CMTD omogenea finita sia ergodica è che il grafo ad essa associato ammetta un’unica componente ergodica e questa sia aperiodica. x2 x1 1 0.1 0.9 Es. n1 La CMTD è ergodica in quanto {x2} è l’unica componente ergodica e questa è chiaramente aperiodica.

x2 x1 1 Es. n3 La CMTD non è ergodica essendo la componente ergodica periodica di periodo 2.

Processi di nascita morte (CMTD-NM) I processi di nascita morte a tempo discreto sono delle CMTD che godono delle seguenti caratteristiche: gli stati possono solo assumere valori interi: X = {0, 1, 2, 3, … } sono ammesse solo le transizioni che consentono di passare da uno stato ad uno adiacente.

1 2 3 1 - b0 1 - b1- d1 1 - b2- d2 1 - b3- d3 b0 b1 b2 d1 d2 d3 b : birth (nascita) d : death (morte) Lo spazio degli stati rappresenta la popolazione del sistema modellato (ad es. i clienti in una coda, i veicoli in un sistema di trasporto, i messaggi in un sistema di comunicazione, … ).

In generale bi=bi(k) e di=di (k). Se bi e di sono costanti per ogni k allora il processo è omogeneo (P=cost.). Se bi e di sono > 0 per ogni i, la CMTD-NM è irriducibile (tutti gli stati sono mutuamente raggiungibili) Se bi=b e di=d per ogni i allora il processo è uniforme. In questo caso se b,d > 0, la catena oltre ad essere irriducibile è aperiodica (è costituita da un’unica componente ergodica e tale componente è aperiodica: esiste infatti sempre almeno il cappio relativo allo stato 0).

La matrice delle probabilità di transizione ha la seguente struttura: P ha chiaramente dimensione infinita se il numero degli stati è infinito.

Calcolo della distribuzione stazionaria (nel caso in cui il numero degli stati sia infinito): se il processo è uniforme,

se questa serie converge, allora la catena è ergodica. Ciò è vero purché sia Questo segue dal fatto che solo in questo caso il processo può “stabilizzarsi”. N.B.: Se invece il numero di stati è finito il processo uniforme è sempre ergodico a prescindere dal valore di .

Se la catena è ergodica, allora la distrubuzione limite coincide con quella stazionaria, che risulta definita come segue:

È interessante calcolare il numero medio di utenti a regime: Posso usare la funzione generatrice di probabilità:

numero medio di utenti a regime