delle procedure sperimentali OTTIMIZZAZIONE delle procedure sperimentali IN CHIMICA ORGANICA
Scopi della CHEMIOMETRIA Estrazione delle informazioni dai dati (analisi dei dati) 2) Ottimizzazione delle procedure sperimentali (raccolta dei dati) tempo e fatica conoscenza metodi statistici metodi tradizionali
Scopi dell’OTTIMIZZAZIONE ottenere la massima informazione con il minor numero di esperimenti costruire un modello matematico in modo da ottenere la migliore risposta come? 1. Identificare le variabili importanti (tramite Factorial o Fractional Design) 2. Costruzione del modello matematico (superfici di responso)
Perché usare le variabili più importanti? Principio di Pareto: poche le variabili importanti molte le variabili triviali facctors and interactions size of the effetc J. M Juran, Managerial Breakthrough, 1964 La Regola 80/20: Si ha l’80% di miglioramento nelle prestazioni del processo cambiando il 20% delle variabili
3 possibilità di approccio al problema esaminare gli effetti variando una variabile per volta approccio a matrice: quanti più esperimenti possibile impiego di metodi statistici
Ipotetici risultati sulla resa di un esperimento Esempio: Ipotetici risultati sulla resa di un esperimento condotto secondo l’approccio una-variabile-per-volta resa resa tmax = 130 min Tmax = 225 °C tempo (min) temperatura (°C) Primo set di esperimenti: temperatura mantenuta costante a 225 °C Secondo set di esperimenti: tempo di osservazione fissato a 130 min
X1 se si varia una variabile per volta, solo una piccola parte dello spazio sperimentale viene esplorata… X2 X1 …al contrario, se si variano le due variabili contemporaneamente X2
Disegni Fattoriali Completi chiameremo... fattore variabile sperimentale livello numero di valori da assegnare ai fattori effetto variazione del fattore disegno fattoriale esame della distribuzione degli effetti nella variazione totale del responso k n nk numero dei fattori numero dei livelli considerati numero di esperimenti
Disegni Fattoriali Completi n. b. : gli esperimenti sono condotti in ordine casuale
Disegni Fattoriali Completi Esempio. Studiare l’influenza che la temperatura, il tempo di reazione e il catalizzatore (3 fattori) esercitano sulla resa (responso) di una reazione; si decide di utilizzare per ciascuna variabile 2 valori possibili (2 livelli): sono quindi richieste 8 prove sperimentali (23 = 8)
Disegni Fattoriali Completi valori C = concentrazione (%) 20 (-) 40 (+) T = temperatura (°C) 160 (-) 180 (+) 160 (-) 180 (+) K = tipo di catalizzatore (A o B) A (-) B (-) A (-) B (-) A (-) B (-) A (-) B (-) resa 60 52 72 83 54 45 68 80
Disegni Fattoriali Completi rappresentazione geometrica dei risultati ottenuti temperatura (T) (+) (-) 54 72 83 80 68 60 52 45 concentrazione (C) catalizzatore (K) 40 20 160 180 A B
Effetto della Temperatura C K temperatura (T) (+) (-) 54 72 83 80 68 60 52 45 concentrazione (C) catalizzatore (K) 40 20 160 180 A B 72 – 60 = 12 20 A 68 – 54 = 14 40 A 83 – 52 = 31 20 B 80 – 45 = 35 40 B La media di queste quattro differenze (+ 23) è detta effetto principale della temperatura
Effetto della Concentrazione K temperatura (T) (+) (-) 54 72 83 80 68 60 52 45 concentrazione (C) catalizzatore (K) 40 20 160 180 A B 54 – 60 = -6 160 A 68 – 72 = -4 180 A 45 – 52 = -7 160 B 80 – 83 = -3 180 B La media di queste quattro differenze (-5) è detta effetto principale della concentrazione
Effetto del Catalizzatore 52 – 60 = -8 160 20 83 – 72 = 11 180 20 temperatura (T) (+) (-) 54 72 83 80 68 60 52 45 concentrazione (C) catalizzatore (K) 40 20 160 180 A B 45 – 54 = -9 160 40 80 – 68 = 12 180 40 La media di queste quattro differenze (1,5) è detta effetto principale del catalizzatore
Disegni Fattoriali Completi L’effetto principale di ciascuna variabile può anche essere calcolato come la differenza fra la media dei valori più alti (+) e la media dei valori più bassi (-) Effetto della temperatura = Effetto della concentrazione = Effetto del catalizzatore = 72+68+83+80 4 60+54+52+45 = 23 54+68+45+80 60+72+52+83 = -5 52+83+45+80 60+72+54+68 = 1,5 N. B. a) sono state usate TUTTE le osservazioni per ottenere informazioni su ciascun effetto principale b) ciascun effetto è stato determinato con la precisione di differenze replicate quattro volte
Interazione tra Due Fattori Considerando l’effetto della temperatura, il valore ottenuto è 23. Tuttavia risulta evidente che gli effetti maggiori sulla resa si hanno con il catalizzatore B. La variabile temperatura e catalizzatore non si comportano additivamente, per cui si può dire che interagiscano. Una misura di questa interazione è fornita dalla differenza fra la media dell’effetto di temperatura ottenuta in presenza del catalizzatore A e del catalizzatore B. Per convenzione, la metà della differenza è detta interazione temperatura-catalizzatore (T x K) catalizzatore medie eff. di temperatura (+) B 33 differenza = 20 (-) A 13 interazione T x K =20/2 = 10
Ricapitolando stima ± errore effetto media delle rese 64,25 ± 0,7 effetti principali Temperatura 23,0 ± 1,4 Concentrazione -5 ± 1,4 Catalizzatore 1,5 ± 1,4 interaz. a due fattori T x C 1,5 ± 1,4 T x K 10,0 ± 1,4 C x K 0,0 ± 1,4 interaz. a tre fattori T x C x K 0,5 ± 1,4
T C K Effetti principali T x C T x K C x K Interazioni a due fattori
Interazioni a tre fattori T x C x K
Vantaggi rispetto all’approccio un-fattore-per-volta: Viene osservato l’effetto di una fattore, mantenendo costanti i valori degli altri fattori: questo è l’approccio ritenuto più corretto dai più. Tuttavia, si ritiene necessario assumere che l’effetto sia lo stesso anche settando diversamente le altre variabili, cioè che le variabili agiscano additivamente sul responso (almeno nell’intervallo considerato). Comunque, anche quando le variabili agissero additivamente, l’approccio fattoriale darebbe risposte più precise. Se piuttosto le variabili non si comportano additivamente, l’approccio fattoriale, rispetto a quello un-fattore-per-volta, può individuare e dare una stima della misura di non additività
Disegni Fattoriali Frazionari: 23-1 + + + 1 2 3 = -1*2 - + - - + - - + + - - - + + - + + + - + - + 1 2 3 = 1*2 - - -
Diversi approcci a confronto: rappresentazioni geometriche 96 misure 15 misure pH pH tempo tempo conc. a matrice: efficace, ma troppe misure richieste conc. una variabile alla volta: potrebbe richiedere molte misure, scarso lo spazio sperimentale esplorato 15 misure centrale composito: poche misure, efficace ed esauriente, tutto lo spazio sperimentale viene esplorato
Although these problem solving methods [statistical approach] have a long and succesful history in many areas of science, resistence to change is universal. We have heard people express their resistance to changing their problem solving approach in some of the following sayings: «We’ll worry about the statistics after we’ve run the experiment». «Let’s vary one thing at time so that we don’t get confused». «I’ll include that factor in the next experiment». It’s too early to use statistical methods». «A statistical experiment would be too large». «My data are too variable to use statistics». However, these reasons are precisely why statistical problem solving tools should be used…