CRITERI BASATI SULLE FUNZIONI DI PERDITA

Slides:



Advertisements
Presentazioni simili
Testi di epidemiologia di base
Advertisements

DISTRIBUZIONE BINOMIALE (cenni) DISTRIBUZIONE NORMALE
Esercizio 1 Sul mercato dei pomodori sono presenti consumatori identici con funzione di domanda individuale Qd=2I-2p e 1000 produttori identici.
Proprietà degli stimatori
MICROSCOPIA.
6. Catene di Markov a tempo continuo (CMTC)
Bruno Mario Cesana Stefano Calza
L’EPIDEMIOLOGIA CLINICA
LA LOGICA DIAGNOSTICA NEL LABORATORIO
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Descrizione dei dati Metodi di descrizione dei dati
Gli errori nell’analisi statistica
6. Catene di Markov a tempo continuo (CMTC)
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Esercizio 1 Due collegamenti in cascata, AB e BC hanno una velocità rispettivamente di 100 Mb/s e 50 Mb/s e tempi di propagazione pari a 1 ms e 1.2 ms.
Apprendimento Automatico: Apprendimento Probabilistico Roberto Navigli 1 Apprendimento Automatico: Apprendimento Bayesiano.
Apprendimento Automatico: Valutazione delle Prestazioni
Metodi di Ensemble Metaclassificatori.
Dip. Economia Politica e Statistica
Le analisi per singolo item
1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.
CONTINUITA’ Una funzione continua e’ una funzione il cui grafico non presenta interruzioni CONTINUA DISCONTINUA.
Poligoni di tre lati Con 6 lelementi: 3 lati e 3 angoli
Sistemi di equazioni lineari
STATISTICA a.a VARIABILITA’ BIOLOGICA E CASO
Le fasi della progettazione strutturale delle costruzioni esistenti
MISURE EPIDEMIOLOGICHE
Lezioni per Insegnanti mod. 2 prof. Giovanni Raho I metodi della ricerca sociale Lezioni per il corso S. I. S. S. Anno 2004 mod. 2.
Modello di regressione lineare semplice
Analisi dei gruppi – Cluster Analisys
Determinazione Orbitale di Satelliti Artificiali Lezione 5
I PRINCIPI DELLA TERMODINAMICA. Vogliamo calcolare il lavoro di un gas in una trasformazione isobara. Il lavoro nelle trasformazioni termodinamiche Clic.
PROBABILITÀ La probabilità è un giudizio che si assegna ad un evento e che si esprime mediante un numero compreso tra 0 e 1 1 Evento con molta probabilità.
1 Esercizio 1 Un router riceve da un collegamento A lungo 10 km a 100 Mb/s e instrada i pacchetti ricevuti, lunghi 1000 bit verso una linea duscita B a.
REGOLE DEL CALCOLO DELLE PROBABILITA’
In alcune situazioni di mercato, la richiesta di un prodotto o di un servizio è strettamente legata alla capacità di acquisto del consumatore, ai suoi.
Introduzione alla patologia clinica
STATISTICA PER LE DECISIONI DI MARKETING
STATISTICA PER LE DECISIONI DI MARKETING
POPOLAZIONI E COMUNITA’
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
DATA MINING PER IL MARKETING
I test di screening C.Quercioli
Gli indici di dispersione
Lezione B.10 Regressione e inferenza: il modello lineare
redditività var. continua classi di redditività ( < 0 ; >= 0)
Esercizio su B.E.P. (Albergo)
Analisi discriminante lineare - contesto
REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta.
La variabile casuale (v.c.) è un modello matematico in grado di interpretare gli esperimenti casuali. Infatti gli eventi elementari  che compongono lo.
Certificazione bilancio/121 Statistica e revisione contabile Scopi della certificazione di bilancio Scopi e modalità dell’analisi statistica Esempio.
DATA MINING PER IL MARKETING Andrea Cerioli Sito web del corso GLI ALBERI DI CLASSIFICAZIONE Introduzione alla metodologia Zani-Cerioli,
La distribuzione campionaria della media
Modulo 4: Frazioni Equivalenti
NB: La lettura delle slide è solo un supporto allo studio che non sostituisce i testi di esame Metodi e tecniche della ricerca sociale - Prof. Flavio Ceravolo.
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
massa (kg) costo (euro)
TRATTAMENTO STATISTICO DEI DATI ANALITICI
La covarianza.
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
L’iperbole l'iperbole1IISS "Medi" - Galatone prof. Giuseppe Frassanito.
Nesting e Overbooking. Si presuppone che, dall’analisi dello storico di un albergo di 100 camere, il 15 giugno risulti essere una data in cui l’albergo.
In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
FUNZIONI MATEMATICHE DANIELA MAIOLINO.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
Stima della qualità dei classificatori per l’ analisi dei dati biomolecolari Giorgio Valentini
Transcript della presentazione:

CRITERI BASATI SULLE FUNZIONI DI PERDITA

Matrice di Confusione La matrice di confusione è una misura delle proprietà di una regola di classificazione o segmentazione. Essa contiene il numero di elementi classificati correttamente o meno per ciascuna classe. Sulla diagonale principale compare il numero di oggetti classificati correttamente per ciascuna classe, mentre gli elementi extra- diagonali indicano il numero di oggetti classificati erroneamente. Se viene assunto che ciascuna classificazione errata abbia lo stesso costo, la proporzione delle classificazioni non corrette sul totale dei casi rappresentati costituisce il tasso di errore e rappresenta la quantità che deve essere minimizzata.

Matrice di Confusione (Esempio Teorico) Valori Previsti ------------------- Valori Osservati EVENTO (1) NON EVENTO (0) TOTALE EVENTO (1) a b a + b EVENTO (0) c d c + d a + c b + d a + b + c + d

Matrice di Confusione (Interpretazione Teorica) dove: sensitivity = a/(a+b) = proporzione di eventi, previsti come tali specificity = d/(c+d) = proporzione di non eventi, previsti come tali false positives = c/(c+d) = 1 – specificity = d/(c+d): proporzione di non eventi, previsti come eventi ( Errore di II specie) false negatives = b/(a+b) = 1 – sensitivity: proporzione di non eventi, previsti come non eventi (errore di I tipo)

Matrice di Confusione (Esempio) Previsione Classe A Classe B Classe C 45 2 3 10 38 4 6 40

Matrice di Confusione (Interpretazione) Se si suppone che nella matrice di confusione ogni risposta corretta abbia un valore di 1000 Euro e che ogni errore per la classe A abbia un costo di 500 Euro, per la classe B di 1000 euro e per la classe C di 2000 euro, il costo associato alla matrice sarà: (123 * 1000) – (5 * 500) – (10 * 2000) = 88.500 Euro

Curva ROC (Receiver Operating Characteristic) E’ un grafico che misura anche l’accuratezza previsiva di un modello. La Curva ROC è basata sulla matrice di confusione.

Curva ROC (1/2) dove: sensitivity = a/(a+b): proporzione di eventi, previsti come tali 1 – specificity = d/(c+d): proporzione di non eventi, previsti come eventi ( Errore di II tipo)

Curva ROC (Interpretazione) Guardare sempre Indice AUC (Area Under Roc Curve) Tale Indice può assumere un valore massimo pari a 1 REGOLA GENERALE: più l’indice si avvicina al valore 1 più la bontà del modello predittivo svolto in precedenza è maggiore.