La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Strumenti di supporto alle decisioni Alessandro Mazzetti.

Presentazioni simili


Presentazione sul tema: "Strumenti di supporto alle decisioni Alessandro Mazzetti."— Transcript della presentazione:

1 Strumenti di supporto alle decisioni Alessandro Mazzetti

2 Definizione Strumento che aiuti luomo nel prendere decisioni analisi di scenari simulazione di evoluzione planning valutazione del rischio teoria dei giochi analisi multivariate ed econometriche analisi break-even alberi decisionali

3 Per decidere bisogna conoscere

4 Generazione della conoscenza Business Intelligence –ricerca di conoscenza utile e fruibile Data Mining –investigazione di dati per trarne conoscenza –scoperta di informazioni inattese Machine Learning (apprendimento autom.) –generazione automatica di conoscenza

5 "Pierino, sei una bestia! Non hai capito niente della Rivoluzione Francese!". "Eppure avevo imparato a memoria tutto il capitolo del libro...". "Non serve. Hai fatto un lavoro inutile: dovevi capire, non imparare a memoria!".

6 Apprendimento Capire Imparare a Memoria Capire = –collegare –notare –generalizzare

7 Tipi di apprendimento per spiegazione –il discente può comunicare col docente –il discente deve avere una conoscenza pre-esistente da esempi –il discente non ha la conoscenza necessaria per comunicare col docente –quello che avviene nei neonati (imparare a camminare, a parlare, a riconoscere,…)

8 Apprendimento da esempi = generalizzazione la palla va giù il biberon va giùRICORDARE lacqua va giù Gli oggetti cadonoCAPIRE

9 Esempio Osservare partite a carte Trarne le regole del gioco

10 Due forme di conoscenza Imparare a memoria casi specifici –occupa tanta memoria –copre solo i casi enumerati la palla cade, la penna cade, la forchetta cade,… il termosifone cade ? Generalizzare –forma compatta –copre anche casi mai visti TUTTI gli oggetti cadono (anche i termosifoni)

11 Conoscenza indotta ieri il sole è tramontato ad ovest anche laltroieri anche settimana scorsa anche lanno scorso Il sole tramonta SEMPRE ad ovest Quindi anche domani !

12 Difficoltà È molto difficile generalizzare correttamente –tutti gli italiani mangiano la pizza –tutti gli uomini sono traditori –le bionde sono belle Una buona generalizzazione deve essere: –completa (coprire tutti gli esempi positivi) –consistente (escludere tutti gli esempi negativi) –significativa (classificare correttamente gli esempi non visti)

13 DEDUZIONE (Aristotele IV secolo a.C.) IF A THEN B deduzione (de-duco=portare fuori) A vero implica B vero A falso non implica nulla INDUZIONE (Hume XVI secolo d.C.) A vero B vero A falso B falso A vero B vero A falso B vero induzione (in-duco=portare dentro) IF A THEN B (ma non ne sono sicuro) Inferenza e apprendimento

14 Proprietà dellinduzione La deduzione preserva la verità –data una conoscenza generale corretta, ottengo uninformazione particolare corretta Linduzione preserva la falsità –non bastano miliardi di esempi a verificare una regola –basta un solo controesempio a falsificare una regola

15 Preservazione della falsità Ferrari:rossaveloce Lamborghini:rossaveloce Topolino:blulenta Porche:neraveloce Le auto rosse sono veloci (può darsi) Panda:rossalenta Rosso NON implica veloce (DI SICURO)

16 Apprendimento da esempi apprendimento supervisionato –esiste un maestro che conosce il concetto da apprendere (ma non lo spiega) –generazione di conoscenza che soddisfi il comportamento del maestro apprendimento non supervisionato –scoperta da osservazioni –generazione di conoscenza del tutto autonoma, notando somiglianze, correlazioni, regolarità

17 Esempi di apprendimento supervisionato Leggi fisiche –maestro = Natura Relazioni sociali –maestro = esperienze Operazioni finanziarie –maestro = andamento della Borsa

18 Esempi di apprendimento non supervisionato Categorizzare le persone –le donne sono più intuitive degli uomini –i Capricorni sono cocciuti Notare differenze allestero –in Francia non si usa il bidet –gli inglesi fanno la coda uno ad uno Correlare attributi –le piccole cooperative sono tipiche del nord –gli uomini che comprano pannolini, comprano anche alcoolici

19 …in termini più tecnici... Apprendimento supervisionato: –è noto lattributo da apprendere –al conoscenza appresa è una regola statura capelli occhi aspetto basso biondi blu bello alto biondi scuri brutto alto rossi blu bello basso scuri blu brutto alto scuri blu brutto alto biondi blu bello alto scuri scuri brutto basso biondi scuri brutto Concetto da apprendere se capelli=rossi allora aspetto=bello se capelli=scuri allora aspetto=brutto

20 …in termini più tecnici... Apprendimento NON-supervisionato: – non è noto lattributo da apprendere –al conoscenza appresa è una tassonomia statura capelli occhi aspetto basso biondi blu bello alto biondi scuri brutto alto rossi blu bello basso scuri blu brutto alto scuri blu brutto si assomigliano alto biondi blu bello (alto, occhi-blu) alto scuri scuri brutto basso biondi scuri brutto Esiste la categoria degli alti cogli occhi blu

21 Cosa cè alla base Una grande quantità di dati raccolti per altri motivi organizzati in maniera adeguata DATA WAREHOUSE

22 Generazione di alberi decisionali ID3 (Iterative Dichotomizer) –Ross Quinlan (1982) derivato da CLS (Concept Learning System) –Hunt (1966) Input = tabella Output = procedura decisionale rappresentabile come: –regole –albero –procedura

23 Albero generato da ID3 statura capelli occhi aspetto basso biondi blu bello alto biondi scuri brutto alto rossi blu bello basso scuri blu brutto alto scuri blu brutto alto biondi blu bello alto scuri scuri brutto basso biondi scuri brutto

24 Lidea base di ID3 cercare l'attributo piu' simile al concetto da apprendere (cioe' la colonna "bellezza") considerare la frequenza di ogni valore possibile ("alto", "basso",...) scegliere lattributo che discrimina meglio ripartire daccapo considerando la sotto- tabella rimanente finché ottengo una sotto-tabella vuota

25 Teoria dellinformazione di Shannon su 8 esempi, 3 sono di belli e 5 di brutti -3/8 log 3/8 - 5/8 log 5/8 = bit 2 2 quindi ho un'informazione di bits Quanto conta la statura? –media pesata degli alti belli rispetto ai brutti belli 5/8 * /8 * = bit Lattributo che conta di più è capelli Si genera il nodo capelli e si riparte

26 Esercizio Visitare definire interattivamente il concetto da far apprendere analizzare le tre forme di conoscenza generata Riuscite a generare la regola sei malato se hai la febbre oppure se starnutisci ?

27 Apprendimento non-supervisionato sistema in grado di creare tassonomie a partire da un insieme di dati "sciolti" vengono notate le similarita fra i dati viene scoperta l'esistenza di categorie si forma una partizione (clustering) dei dati i dati appartenenti alla stessa classe si assomigliano fra di loro

28 Tassonomia

29 Apprendimento incrementale

30 Progetti storici "Cluster" (R. Michalski, 1983), "Unimem" (M. Lebowitz, 1986), "Cobweb" (D. Fisher, 1987) approfondiamo Unimem

31 Linput è una tabella disordinata fiat_tipocc1600, abbordabile, posti(5), porte(5), consumo(medio) renault_clioeconomica, corta, cc1200, posti(5), porte(3), consumo(basso) jeepnon_veloce, cc2000, alta, porte(5), cara, consumo(alto) subaru_legacylunga, cara, veloce, cc2000, posti(5), consumo(medio), vol2 renault_19abbordabile, cc1400, posti(5), porte(5), consumo(medio) toyota_4x4cara, non_veloce, cc2500, alta, porte(5), consumo(alto) citroen_zxabbordabile, cc1600, posti(5), porte(5), consumo(medio) opel_omegaSWcara, veloce, lunga, cc2000, posti(5), consumo(medio), vol2 rolls_roycecarissima, lunga, vol3, posti(5), porte(4), consumo(alto) peugeot_205corta, cc1000, posti(5), economica, porte(3), consumo(basso) range_rovercara, alta, cc2500, posti(6), porte(5), consumo(alto) vw_golfabbordabile, cc1600, posti(5), porte(5), consumo(medio) fiat_unoeconomica, cc1100, posti(5), porte(3), consumo(basso) porshecarissima, velocissima, cc3600, posti(2), porte(2), consumo(alto) fiat_tempra_SWlunga, cara, veloce, cc1800, consumo(medio), vol2 renault_nevadacara, veloce, cc2000, posti(7), consumo(medio), lunga, vol2 mercedes_500carissima, vol3, cc5000, posti(5), porte(4), consumo(alto) ferraricarissima, velocissima, cc5000, posti(2), porte(2), consumo(alto)

32 radice [ ] range_rover renault_nevada classe_a [abbordabile,posti(5),porte(5),consumo(medio)] renault_19 /* e' una 1400 cc */ classe_c [cc1600] fiat_tipo citroen_zx vw_golf classe_b [cara,non_veloce,alta,porte(5),consumo(alto)] jeep toyota_4x4 classe_d [cara,veloce,lunga,cc2000,posti(5),consumo(medio),vol2] subaru_legacy opel_omegaSW fiat_tempra_SW classe_e [corta,posti(5),economica,porte(3),consumo(basso)] renault_clio peugeot_205 fiat_uno classe_f [carissima,vol3,posti(5),porte(4),consumo(alto)] rolls_royce mercedes_500 classe_g [carissima,velocissima,posti(2),porte(2),consumo(alto)] porshe ferrari Cosha scoperto ?

33 Cosha scoperto ? I tipi di auto ! radice [ ] range_rover renault_nevada /* non classificate */ classe_a [abbordabile,posti(5),porte(5),consumo(medio)] renault_19 /* e' una 1400 cc */ /* berline */ classe_c [cc1600] fiat_tipo citroen_zx vw_golf classe_b [cara,non_veloce,alta,porte(5),consumo(alto)] jeep toyota_4x4 /* fuoristrada */ classe_d [cara,veloce,lunga,cc2000,posti(5),consumo(medio),vol2] subaru_legacy opel_omegaSW fiat_tempra_SW/* familiari */ classe_e [corta,posti(5),economica,porte(3),consumo(basso)] renault_clio peugeot_205 fiat_uno/* utilitarie */ classe_f [carissima,vol3,posti(5),porte(4),consumo(alto)] rolls_royce mercedes_500/* lussuose */ classe_g [carissima,velocissima,posti(2),porte(2),consumo(alto)] porshe ferrari/* sportive */

34 Metrica È alla base dellapprendimento non- supervisionato misura quanto si assomigliano due casi metrica forte –[a,b,c,d] assomiglia ad [x,d,c,b] ma non a [d,b] metrica debole –[a,b,c,d] assomiglia ad [x,d,y,b] ma non a [b]

35 Conclusioni Apprendimento = generazione di conoscenza Utile per supportare le decisioni Campi dapplicazione –segmentazione del mercato (supermarket, banche,…) –investigazione di frodi (clonazione cellulari,…) –manutenzione preventiva (guast frequenti,…) –valutazione del rischio (ambientale, finanziario,…) –previsione di consumo (energetico, beni,…)


Scaricare ppt "Strumenti di supporto alle decisioni Alessandro Mazzetti."

Presentazioni simili


Annunci Google