Apprendimento Automatico: Valutazione delle Prestazioni

Slides:



Advertisements
Presentazioni simili
La Matematica tra Gioco e Realtà
Advertisements

Disegna un quadrato di 8 quadretti per lato
LE FONTANE DELLACQUANUOVA. PROSPETTO LATERALE 4,0 1,0 B A C D E F G 0,4 H 0,6 I L M 0, ,0 4,0 apertura 8,20 cm apertura 4,70 cm apertura.
2. Introduzione alla probabilità
II° Circolo Orta Nova (FG)
Sistemi di Classificazione usando NCD
Proprietà degli stimatori
Sistemi di numerazione
Classificazione automatica dei nomi di evento in italiano
LA TEORIA DEGLI INSIEMI
Determinanti del primo ordine
1 2. Introduzione alla probabilità Definizioni preliminari: Prova: è un esperimento il cui esito è aleatorio Spazio degli eventi elementari : è linsieme.
Introduzione Cosa sono le reti di Petri?
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
QUESTIONARIO AIR STUDENTI
Bruno Mario Cesana Stefano Calza
L’EPIDEMIOLOGIA CLINICA
Scuola Superiore Economia e Finanza
IL REGIME DI TRASPARENZA PER LE SOCIETA’ DI CAPITALI
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Gli indicatori semplici Costituiscono un ponte tra ciò che è osservabile e misurabile e i concetti di cui si vuole fornire una misura. Assumono significato.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Interpretazione Astratta
Ordini Parziali - Reticoli
Apprendimento Automatico: Apprendimento di Concetti da Esempi
Valutazione delle Prestazioni di un Classificatore
Apprendimento Automatico: Apprendimento Bayesiano
Apprendimento Automatico: Apprendimento Probabilistico Roberto Navigli 1 Apprendimento Automatico: Apprendimento Bayesiano.
Apprendimento Automatico: Alberi di Decisione
Apprendimento Automatico: Apprendimento Pigro (Lazy Learning)
Apprendimento Automatico: Alberi di Decisione
Valutazione delle ipotesi
Apprendimento di funzioni algebriche
Metodi di Ensemble Metaclassificatori.
Apprendimento Bayesiano
Apprendimento di Concetti da Esempi
Canale A. Prof.Ciapetti AA2003/04
I QUADRILATERI.
TECNOLOGIE DEI SISTEMI DI CONTROLLO
Lezioni per Insegnanti mod. 2 prof. Giovanni Raho I metodi della ricerca sociale Lezioni per il corso S. I. S. S. Anno 2004 mod. 2.
VARIABILI E DISTRIBUZIONI DI FREQUENZA
Cos’è un problema?.
Lezione 4 Probabilità.
Num / 17 Lezione 8 Numerosità del campione, metodi grafici.
REPORT DATI QUESTIONARI a.s
Le Nuove Prestazioni adattamento al D Lgs 252/05 e disposizioni COVIP Lucidi a cura dellUfficio Formazione FIM CISL Piemonte dicembre 2011.
incertezza di misura prove chimiche
Ropol09anci INDAGINE SU PATTO DI STABILITA 2009 IN PIEMONTE ANCI PIEMONTE Torino, 29 giugno 2009.
PROBABILITÀ La probabilità è un giudizio che si assegna ad un evento e che si esprime mediante un numero compreso tra 0 e 1 1 Evento con molta probabilità.
METODI E CONTROLLI STATISTICI DI PROCESSO
Esercitazione 1: Rispetto al test di ansia (Media=25; σ=5), calcolare:
LE STATISTICHE di Delle Cave Antonietta. LE STATISTICHE Sono le rielabolazione e la riclassificazione di fenomeni aziendali e permettono di evidenziare.
CONVERSIONE NUMERI INTERI CON COMPLEMENTO A DUE. I computer di oggi effettuano ogni tipo di operazione numerica, ma le prime ALU degli anni 50 erano in.
ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE.
ISTITUTO COMPRENSIVO “G. BATTAGLINI” MARTINA FRANCA (TA)
LE DISEQUAZIONI DI PRIMO GRADO AD UN’INCOGNITA
SCOPRI LA TABELLINA click Trova la regola nascosta… click
Riconoscitori di lingua in documenti testuali
Prima rilevazione sullo stato di attuazione della riforma degli ordinamenti nelle istituzioni scolastiche in LOMBARDIA Attuazione del D.L. 59/2003 a.s.
STATISTICA PER LE DECISIONI DI MARKETING
Valutazione delle prstazioni di un sistema di retrieval
Esempi risolti mediante immagini (e con excel)
Pippo.
Metaclassificazione Giovedì, 18 novembre 2004 Francesco Folino ( Combinare Classificatori Lecture 8.
Mercato del lavoro e condizione giovanile: la crisi si acuisce
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
1 Introduzione Sistema di calcolo Valutazione dell’impatto delle varie modifiche sulle prestazioni globali del sistema Modifiche all’architettura.
Rappresentazione dell'informazione
DATA MINING PER IL MARKETING Andrea Cerioli Sito web del corso GLI ALBERI DI CLASSIFICAZIONE Introduzione alla metodologia Zani-Cerioli,
Stima della qualità dei classificatori per l’ analisi dei dati biomolecolari Giorgio Valentini
Transcript della presentazione:

Apprendimento Automatico: Valutazione delle Prestazioni Roberto Navigli

Valutazione delle Prestazioni Una volta appreso un classificatore è di fondamentale importanza valutarne le prestazioni La valutazione delle prestazioni richiede un attento esame del problema e delle componenti per cui ha senso effettuare una valutazione E’ necessario utilizzare in modo ragionato le misure di valutazione disponibili Giustificare perché utilizzare una misura piuttosto che un’altra o perché complementare una misura con un’altra al fine di avere un quadro completo delle prestazioni

Modalità di test di un classificatore Sul training set stesso overfitting! Su un test set disgiunto dal training set Mediante cross validation Suddivido il training set in k sottoinsiemi (k-fold) Testo il classificatore k volte allenandolo su k-1 sottoinsiemi e testandolo sul sottoinsieme rimanente Le prestazioni complessive possono essere calcolate mediando sui k esperimenti k = 10 risulta sperimentalmente un buon numero di fold Mediante split Suddividiamo l’insieme di dati disponibile in training e test set (normalmente il primo è più grande del secondo, es. 66% e 34%)

Quali sono le prestazioni del classificatore Navigli? Esempio Quali sono le prestazioni del classificatore Navigli?

TP FN FP TN Matrice di Confusione Applicando il classificatore al test set possiamo visualizzare la distribuzione delle istanze rispetto alla classificazione predetta e a quella reale Utilizziamo la cosiddetta matrice di confusione Es. se la classificazione è binaria: TP = true positive TN = true negative FN = false negative FP = false positive Classe predetta Positivo Negativo TP FN FP TN Classe reale Positivo Negativo

Misure per valutare le prestazioni (1) Istanze positive Test Set T TP TN FP FN Istanze negative Istanze con predizione positiva

Misure per valutare le prestazioni (2) Istanze positive Test Set T TP TN FP FN Istanze negative Istanze con predizione positiva Precisione P = TP/(TP+FP) Percentuale di predizioni positive corrette

Misure per valutare le prestazioni (3) Istanze positive Test Set T TP TN FP FN Istanze negative Istanze con predizione positiva Recall R = TP/(TP+FN) Percentuale di istanze realmente positive classificate come positive

Misure per valutare le prestazioni (4) Istanze positive Test Set T TP TN FP FN Istanze negative Istanze con predizione positiva TP rate = TP/(TP+FN) = Recall Percentuale di istanze realmente positive classificate come positive

Misure per valutare le prestazioni (5) Istanze positive Test Set T TP TN FP FN Istanze negative Istanze con predizione positiva FP rate = FP/(FP+TN) Percentuale di istanze realmente negative classificate erroneamente come positive

Misure per valutare le prestazioni (6) Istanze positive Test Set T TP TN FP FN Istanze negative Istanze con predizione positiva Accuratezza = (TP+TN)/(TP+TN+FP+FN) Percentuale di istanze sia positive sia negative classificate correttamente Error rate (Tasso d’errore) = (FP+FN)/(TP+TN+FP+FN)

E’ una media armonica tra precisione e recall F1 measure F1 = 2PR / (P+R) E’ una media armonica tra precisione e recall F1

Come utilizzare le misure Quando utilizzare la accuracy Quando ho un problema multiclasse e tutte le classi sono di interesse Quando ho un problema binario, le due classi sono bilanciate e interessanti Quando utilizzare P, R e F1 Se c'è almeno una classe non interessante Se voglio studiare l’andamento del classificatore su una classe in particolare

Little Britain (Carol Beer): Esempio 1 Little Britain (Carol Beer): Computer says no!

Test Set T Esempio 1 Classificazione binaria 95% 5% Esempio: il classificatore emette sempre classificazione negativa Accuracy = 0.95 P = 0 R = 0 Istanze positive Test Set T 95% 5% Istanze negative

Test Set T Esempio 2 Classificazione binaria 95% 5% Esempio: il classificatore emette sempre classificazione positiva Accuracy = 0.05 P = 0.05 R = 1 Istanze positive Test Set T 95% 5% Istanze negative

Test Set T Esempio 3 Classificazione binaria 80% 70% = 20%+50% 20% Accuracy = 50/100 = 0.5 P = 50/70 = 0.71 R = 50/80 = 0.62 Istanze positive Test Set T 80% 70% = 20%+50% 20% Istanze negative 70% istanze classificate come positive (di cui 20% FP e 50% TP)

Test Set T Esempio 4 Classificazione n-aria 40% 55% 5% Caso: Il classificatore classifica correttamente tutta la classe di interesse, ma assegna classe rossa agli azzurri e azzurra ai rossi Accuracy = 5/100 = 0.05!!! P (rispetto alla classe verde) = 5/5 = 1 R (rispetto alla classe verde) = 5/5 = 1 Classe di interesse Test Set T 40% 55% 5%