L23 Politiche fuori linea senza apprendimento: progetto funzionale Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.

Slides:



Advertisements
Presentazioni simili
L10 Il passo temporale et al.
Advertisements

Premessa: si assume di aver risolto (correttamente
L13 Il processo di modellizzazione Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.
Algoritmi e Strutture Dati
Definizione e caratteristiche
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Sistemi di Supporto alle Decisioni I Dynamic Programming Chiara Mocenni Corso di.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Sistemi di Supporto alle Decisioni I Scelte di consumo Chiara Mocenni Corso di laurea.
Programmazione dinamica
Master Bioinformatica 2002: Progetto di Algoritmi1 Programmazione Dinamica (PD) Altra tecnica per risolvere problemi di ottimizzazione, piu generale degli.
Università degli Studi di Cagliari
Dalla PIP al MODSS Andrea Castelletti Politecnico di Milano MCSA 07/08 L03 Zambesi.
R. Soncini Sessa, MODSS, L 24b Analisi a molti obiettivi-esempi Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.
L 16 Progetto delle alternative Andrea Castelletti Modellistica e Controllo dei Sistemi Ambientali.
Modelli e indicatori Andrea Castelletti Politecnico di Milano MCSA 07/08 L12 Volga.
L 17 Il Problema di Progetto Andrea Castelletti Modellistica e Controllo dei Sistemi Ambientali.
1 L 19 Pianificare la gestione: la politica Andrea Castelletti.
Progetti 9 Progetto Nasello Rodolfo Soncini Sessa Pianificazione e gestione delle risorse idriche: progetto di DSS Copyright 2002 © Rodolfo Soncini Sessa.
Support Vector Machines
Il problema della ricerca Algoritmi e Strutture Dati.
Capitolo 4 Ordinamento Algoritmi e Strutture Dati.
Capitolo 10 Tecniche algoritmiche Algoritmi e Strutture Dati.
Algoritmi e Strutture Dati (Mod. A)
Alberi di Ricorrenza Gli alberi di ricorrenza rappresentano un modo conveniente per visualizzare i passi di sostitu- zione necessari per risolvere una.
Algoritmi e Strutture Dati (Mod. B)
Algoritmi e Strutture Dati (Mod. B)
CORSO DI MODELLI DI SISTEMI BIOLOGICI
Cenni di ottimizzazione dinamica
CONTROLLO DI SUPPLY CHAIN MEDIANTE TECNICHE H-INFINITO E NEGOZIAZIONE
Modelli simulativi per le Scienze Cognitive
Determinazione Orbitale di Satelliti Artificiali Lezione 5
Ingegneria della conoscenza e sistemi esperti Dario Bianchi, 1999 Risoluzione di problemi e ricerca.
Lezione 13 Equazione di Klein-Gordon Equazione di Dirac (prima parte)
Assicurazioni vita e mercato del risparmio gestito
Elementi di Informatica
Marco Martoccia e Mattia Pancerasa
Copyright 2004 © Rodolfo Soncini Sessa.
Copyright 2004 © Rodolfo Soncini Sessa.
FLOWCHART DELL’ALGORITMO DI APPRENDIMENTO DELLA RETE DI KOHONEN
Passo 3: calcolo del costo minimo
Algoritmi e Strutture Dati
…sulle equazioni.
Rete di Hopfield applicata al problema del TSP Federica Bazzano
R. Soncini Sessa, MODSS, S27 Stima degli effetti (Wald) Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.
I mercati dei beni e i mercati finanziari: il modello IS-LM
La ricorsione.
R. Soncini Sessa, MODSS, L 25 Il Processo decisionale Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.
R. Soncini Sessa, MODSS, L 26 Stima degli effetti Calcolo degli obiettivi (Laplace) Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini.
R. Soncini Sessa, MODSS, L21 Accettare la casualità Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.
Capitolo 13 Cammini minimi: Algoritmo di Floyd e Warshall Algoritmi e Strutture Dati.
Il problema della ricerca Algoritmi e Strutture Dati.
Capitolo 10 Tecniche algoritmiche Algoritmi e Strutture Dati.
Capitolo 10 Tecniche algoritmiche Algoritmi e Strutture Dati.
Flusso di Costo Minimo Applicazione di algoritmi: Cammini Minimi Successivi (SSP) Esercizio 1 Sia data la seguente rete di flusso, in cui i valori riportati.
Programmazione dinamica Algoritmi golosi Analisi ammortizzata
Progetti P02 Progetto Mar Morto Rodolfo Soncini Sessa Pianificazione e gestione delle risorse idriche: progetto di DSS Copyright 2002 © Rodolfo Soncini.
Problemi risolvibili con la programmazione dinamica Abbiamo usato la programmazione dinamica per risolvere due problemi. Cerchiamo ora di capire quali.
R. Soncini Sessa, MODSS, L22 Pianificare la gestione: la politica Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.
L15 Altri componenti: canali e traverse Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.
R. Soncini Sessa, MODSS, L17 Modelli aggregati Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.
R. Soncini Sessa, MODSS, P07 Progetto Bormida Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.
L 18 Progetto delle alternative Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.
L14 I ndicatori Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.
R. Soncini Sessa, MODSS, 2004 L07 Sistemi, dominii e reti causali Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.
P05 Progetto Nihuil Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.
GLI ALGORITMI Appunti preparati dalla prof.ssa Maria D’Angelo.
Il comportamento del motore asincrono è descritto da un sistema di equazioni non lineari; non è, quindi, possibile, quando si desidera ricavare dei legami.
Ancora sulle equazioni di secondo grado….. Equazione di secondo grado completa Relazione tra le soluzioni di un'equazione di secondo grado.
Lezione n° 8 - Matrice di base. - Soluzioni di base ammissibili. - Relazione tra vertici di un poliedro e soluzioni basiche. - Teorema fondamentale della.
Lezione n° 10 Algoritmo del Simplesso: - Coefficienti di costo ridotto - Condizioni di ottimalità - Test dei minimi rapporti - Cambio di base Lezioni di.
Transcript della presentazione:

L23 Politiche fuori linea senza apprendimento: progetto funzionale Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.

R. Soncini Sessa, MODSS, Problema di controllo Problema di minimizzazione del costo totale atteso su un orizzonte finito di lunghezza h. Funzione obiettivo separabile Disturbo bianco

R. Soncini Sessa, MODSS, ma, tramite il nuovo stato che produce, influenza anche i costi degli stadi futuri. Il costo futuro Il Problema è un problema decisionale a più stadi, in ciascuno dei quali, noto lo stato x t, si deve adottare una decisione u t. L’orizzonte è finito. Ogni decisione comporta un costo immediato, 

R. Soncini Sessa, MODSS, Un semplice esempio Ad ogni istante dobbiamo stabilire il volume u t che vorremmo inviare al distretto irriguo; da cui consegue il volume s t+1 inviato al futuro.

R. Soncini Sessa, MODSS, Un semplice esempio tempot-1t+1t

R. Soncini Sessa, MODSS, Un semplice esempio

R. Soncini Sessa, MODSS, Il costo futuro La decisione all’istante t deve quindi considerare : Il costo immediato g t (x t,u t,  t+1 ) i costi futuri sul resto dell’orizzonte h, che dipendono però anche dalle decisioni future. EQUAZIONE DI BELLMAN Definiamo il costo futuro ottimo (totale atteso) come il costo in cui incorreremmo se dall’istante t adottassimo decisioni ottime. Quali costi dunque ? Consideriamoli entrambi!

R. Soncini Sessa, MODSS, Isolamento di un passo del processo

R. Soncini Sessa, MODSS, La Programmazione Dinamica (DP) 1 Il costo futuro. 4. Politiche AUV, progetto funzionale: l’algoritmo risolvente per il problema su orizzonte finito. 2 Esempio. 3 Derivazione formale. 3.1 Una legge di dualità. 2 Esempio.

R. Soncini Sessa, MODSS, Esempio ∞ ∞ t Penale

R. Soncini Sessa, MODSS, ∞ ∞ t Esempio = [∞, 0, ∞] = [4, 2, 1] =[G, D, S] = [4, 4, 2] =[G, G, D]

R. Soncini Sessa, MODSS, ∞ ∞ t Esempio Una delle possibili sequenze di controlli ottimi è quindi : u 0 =D u 1 =S u 2 =G u 3 =D = [6, 5, 7] =[D, S/G, D] = [7]=[S/D]

R. Soncini Sessa, MODSS, Esempio S/GS/D GD DDS GD G t x u In realtà abbiamo trovato molto di più di una sequenza di controlli ottimi, abbiamo trovato una politica APV t xtxt

R. Soncini Sessa, MODSS, Esempio t x ∞ 0 ∞H*H* Conviene quindi memorizzare solo la tabella H *. Abbiamo ottenuto anche i valori dei costi futuri ottimi per tutti i t e tutti gli stati. Nota si può calcolare ad ogni istante la decisione ottima risolvendo l’equazione

R. Soncini Sessa, MODSS, La Programmazione Dinamica (DP) 1 Il costo futuro. 4 Politiche AUV, progetto funzionale: l’algoritmo risolvente per il problema su orizzonte finito. 2 Esempio. 3 Derivazione formale. 3.1 Una legge di dualità. 3 Derivazione formale.

R. Soncini Sessa, MODSS, Derivazione formale Problema di minimizzazione del costo totale atteso su un orizzonte finito di lunghezza h. Ipotesi: processo bianco Funzione obiettivo separabile

R. Soncini Sessa, MODSS, Derivazione formale Ipotesi di processo bianco

R. Soncini Sessa, MODSS, Derivazione formale In generale quindi il costo futuro ottimo sull’orizzonte temporale [0,h] è calcolabile con la seguente equazione ricorsiva: Il controllo ottimo è dato da: EQUAZIONE DI BELLMAN

R. Soncini Sessa, MODSS, La Programmazione Dinamica (DP) 1 Il costo futuro. 2 Esempio. 3 Derivazione formale. 3.1 Una legge di dualità. 4 Politiche AUV, progetto funzionale: l’algoritmo risolvente per il problema su orizzonte finito. 3.1 Una legge di dualità.

R. Soncini Sessa, MODSS, LAPLACE La legge di dualità L’equazione di Bellman per i problemi di Wald si ottiene dalla precedente con le seguenti sostituzioni: + max Per questo mostreremo gli algoritmi solo per il caso di Laplace. va al posto di WALD

R. Soncini Sessa, MODSS, Equazione di Bellman con criterio di Wald In generale quindi il costo sull’orizzonte temporale [t,h] è calcolabile con la seguente equazione ricorsiva: Il controllo ottimo è dato da: EQUAZIONE DI BELLMAN

R. Soncini Sessa, MODSS, La Programmazione Dinamica (DP) 1 Il costo futuro. 4 Politiche AUV, progetto funzionale: l’algoritmo risolvente per il problema su orizzonte finito. 2 Esempio. 3 Derivazione formale. 3.1 Una legge di dualità. 4 Politiche AUV, progetto funzionale: l’algoritmo risolvente per il problema su orizzonte finito.

R. Soncini Sessa, MODSS, L’algoritmo risolvente per orizzonte finito Passo 0 (inizializzazione): si calcolino ricorsivamente i costi-futuri mediante l’equazione di Bellman: si ponga Passo 1:

R. Soncini Sessa, MODSS, L’algoritmo risolvente per orizzonte finito Passo 2 (terminazione):

R. Soncini Sessa, MODSS, Complessità dell’algoritmo

R. Soncini Sessa, MODSS, Procedura esaustiva confronti

R. Soncini Sessa, MODSS, La strategia della DP 9 confronti

R. Soncini Sessa, MODSS, La strategia della DP confronti Complessivamente 9+9+3=21 confronti invece di 27.

R. Soncini Sessa, MODSS, Complessità dell’algoritmo Se il vettore di disturbo ha una unica componente, che assume n ε valori, il calcolo del valore atteso richiede n ε valutazioni di L. L(ε t+1 ) tt nεnε 1

R. Soncini Sessa, MODSS, Complessità dell’algoritmo Se il vettore di disturbo ha un’ unica componente, che assume n ε valori, il calcolo del valore atteso richiede n ε valutazioni di L. Se invece il disturbo ha due componenti ε=(υ,η), ciascuna delle quali assume n ε valori, le valutazioni di L sono n ε 2. L(ε t+1 ) nεnε 1 1 nεnε

R. Soncini Sessa, MODSS, Complessità dell’algoritmo Occorre poi trovare il minimo rispetto ai valori che può assumere il controllo. Come nel caso di ε, se il controllo è scalare e assume n u valori, occorre effettuare n u valutazioni per individuare il minimo. Se il controllo ha due componenti, ne occorrono n u … nunu …nunu

R. Soncini Sessa, MODSS, Complessità dell’algoritmo Occorre infine valutare il costo futuro per tutti gli stati: Se lo stato ha due componenti, ne occorrono n x nxnx …nxnx … Se lo stato è scalare e assume n x valori, occorre effettuare n x valutazioni per determinare l’intera funzione

R. Soncini Sessa, MODSS, Complessità dell’algoritmo Il tempo di calcolo della DP cresce: esponenzialmente con la dimensione di stato, controllo e disturbo, linearmente con la durata dell’orizzonte.

R. Soncini Sessa, MODSS, Complessità dell’algoritmo Il tempo di calcolo della DP cresce: esponenzialmente con la dimensione di stato, controllo e disturbo, linearmente con la durata dell’orizzonte.

R. Soncini Sessa, MODSS, Leggere MODSS Cap. 12