E-mail: valentini@dsi.unimi.it Stima della qualità dei classificatori per l’ analisi dei dati biomolecolari Giorgio Valentini e-mail: valentini@dsi.unimi.it.

Slides:



Advertisements
Presentazioni simili
Primary Italian Saying How You Are.
Advertisements

L’esperienza di un valutatore nell’ambito del VII FP Valter Sergo
Teoria e Tecniche del Riconoscimento
OPTICS BY THE NUMBERS LOttica Attraverso i Numeri Michael Scalora U.S. Army Research, Development, and Engineering Center Redstone Arsenal, Alabama,
Sistemi e processi nei servizi sanitari CdLM Ingegneria gestionale (II anno) Introduzione Prof. Gabriele Cevenini Dipartimento di Chirurgia e Bioingegneria.
Valutazione delle Prestazioni di un Classificatore
Valutazione delle ipotesi
Apprendimento Automatico: Valutazione delle Prestazioni
TIPOLOGIA DELLE VARIABILI SPERIMENTALI: Variabili nominali Variabili quantali Variabili semi-quantitative Variabili quantitative.
Queuing or Waiting Line Models
1 XXVII CONVEGNO DI IDRAULICA E COSTRUZIONI IDRAULICHE - IDRA2000 Genova, settembre 2000 Università della Basilicata Italy Dipartimento di Ingegneria.
Valutazione delle prstazioni di un sistema di retrieval
Architettura software La scelta architetturale: MVA (Model – View – Adapter/Control) The view is completely decoupled from the model such that view and.
LM FOTOCHIMICA E MATERIALI MOLECOLARI
ROCK A Robust Clustering Algorithm for Categorical Attributes Sudipto Guha, Rajeev Rastogi, Kyuseok Shim Sistemi Informativi per le Decisioni a.a. 2005/2006.
Metaclassificazione Giovedì, 18 novembre 2004 Francesco Folino ( Combinare Classificatori Lecture 8.
CRITERI BASATI SULLE FUNZIONI DI PERDITA
Metodi Quantitativi per Economia, Finanza e Management Lezioni n° 7-8.
Un problema multi impianto Un’azienda dispone di due fabbriche A e B. Ciascuna fabbrica produce due prodotti: standard e deluxe Ogni fabbrica, A e B, gestisce.
Accoppiamento scalare
TEORIE E TECNICHE DEL RICONOSCIMENTO
SUMMARY Time domain and frequency domain RIEPILOGO Dominio del tempo e della frequenza RIEPILOGO Dominio del tempo e della frequenza.
TEORIE E TECNICHE DEL RICONOSCIMENTO
L A R OUTINE D EL M ATTINO Ellie B.. Io mi sono svegliata alle cinque del mattino.
SUMMARY Different classes and distortions RIEPILOGO Le diverse classi e le distorsioni RIEPILOGO Le diverse classi e le distorsioni.
Fare Adesso - La Salute (page 9)La Salute Cosa hai? – Look at the picture and write the illness that each person is feeling on the handout provided. Oggi.
1 VALIDITÀ DI CRITERIO DEGLI STRUMENTI DIAGNOSTICI UTILIZZATI PER LA VALUTAZIONE DELL’IDONEITA` ALLA GUIDA.
XXV Riunione MITO Napoli 25 Giugno 2014 MITO2 miRNA microarray profile identifies a strong predictor of disease relapse in ovarian cancer XXV Riunione.
WEKA: Machine Learning Algorithms in java Ilaria Bordino Ida Mele.
Organizzazione e Formazione per l’arresto cardiaco in ospedale Overview Epidemiologia dell’ arresto intraospedaliero Criticita’ organizzative Applicazioni.
I diversi tipi di validità delle indagini empiriche
Department of Experimental Oncology and Molecular Medicine
ING. MAURIZIO TORRES MERCOLEDI’ 14 SETTEMBRE 2016
Valutazione dell’incertezza associata alla mappa acustica dinamica di Milano Giovanni Zambon; Roberto Benocci; Maura Smiraglia; H. Eduardo Roman.
Variabili casuali a più dimensioni
“Costi di salvataggio e parametri di valutazione” Guglielmo Camera
Modello neoclassico di crescita esogena di R. Solow
come sfruttare empiricamente
The prognostic value of biological markers in paediatric Hodgkin lymphoma  Piero Farruggia, Giuseppe Puccio, Alessandra Sala, Alessandra Todesco, Salvatore.
ITEM – PERCORSI FORMATIVI obiettivi e contenuti
Training & Development
Misure Meccaniche e Termiche - Università di Cassino
Metodi Quantitativi per Economia, Finanza e Management Lezione n°12 Regressione Logistica: Le ipotesi del modello, la stima del modello.
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Gruppo storage CCR Nuove attivita’ 2007 Alessandro Brunengo CCR - Roma
Daniele Pedrini INFN Milano-Bicocca
Analisi dei dati dell’Esperimento ALICE
(…. Con animazioni esagerate)
Supporto statistico online
JetWalk: Agenda e review committee
Corso di STATISTICA Prof. Giovanni LATORRE sito web:
Gigi Cosentino - LNL 20 ottobre 2016
APPUNTI DI STATISTICA INFERENZIALE
Intervalli di Fiducia Introduzione Intervalli di fiducia per la media – Caso varianza nota Intervalli di fiducia per la media – Caso varianza non nota.
Human machine interaction
Bubble Sort.
Anno Accademico 2010 – 2011 Corso di Progettazione dei Sistemi di Controllo Prof. Luca Schenato Prof. Gianluigi Pillonetto Gottardo Giuseppe, matr
Servizi web per la bioinformatica strutturale
Adolf Luther Born 1912 in Krefeld, Germany. Died 1990 Krefeld.
Autocorrelazione dei residui
Volume 47, Issue 3, Pages (March 2005)
A Predictive Model Identifies Patients Most Likely to Have Inadequate Bowel Preparation for Colonoscopy  Cesare Hassan, Lorenzo Fuccio, Mario Bruno, Nico.
Università degli Studi di Modena e Reggio Emilia
I materiali metallici sono perfetti?
SWORD (School and WOrk-Related Dual learning)
Direction-sensitive optical module for a km3-detector
Human machine interaction
Svolgimento della Sezione 5: CONTROLLORI
Andrea CORSONELLO IRCCS INRCA Cosenza
2 tag: add category tight-loose
Transcript della presentazione:

e-mail: valentini@dsi.unimi.it Stima della qualità dei classificatori per l’ analisi dei dati biomolecolari Giorgio Valentini e-mail: valentini@dsi.unimi.it

Rischio atteso e rischio empirico L` apprendimento di una funzione non nota f : Rd  C avviene tramite un algoritmo L che genera un insieme di funzioni g che approssimano f utilizzando solo un training set distribuito secondo un distribuzione di probabilità non nota P(x,t) : rappresenta un insieme di parametri della learning machine (ad es., l' insieme dei pesi delle unità di calcolo di una rete neurale). Obiettivo dell’ apprendimento non è minimizzare il rischio empirico Remp (): bensì il rischio atteso R(): A parte le difficoltà matematiche della minimizzazione del funzionale R(), quasi sempre la funzione di densità di probabilità congiunta non è nota ...

Stima del rischio atteso Il rischio empirico non sempre converge al rischio atteso. La Teoria Statistica dell’ Apprendimento di Vapnik ha mostrato che un limite superiore al rischio atteso può essere scomposto in due componenti: dove il primo termine dipende dal rischio empirico, mentre l' intervallo di confidenza  dipende principalmente dal rapporto fra la complessità h della learning machine e la cardinalità m del training set disponibile. Per valutare le capacità di generalizzazione delle learning machine è necessario stimare il rischio atteso e non semplicemente il rischio empirico. Il problema è: come stimare il rischio atteso ?

Due approcci principali alla stima del rischio atteso Stima teorica dei limiti superiori al rischio atteso (basati sull’ errore empirico e sulla stima della complessità della learning machine) Stima sperimentale (basata sul campionamento dei dati disponibili)

Metodi di stima sperimentale dell’ errore di generalizzazione Holdout Suddivisione dei dati in training e test set (tipicamente 2/3 ed 1/3) Sottocampionamento casuale Holdout ripetuto n volte Cross validation Partizione dei dati in k sottoinsiemi disgiunti (fold) k-fold: training con k-1 fold, test sul rimanente; il processo è ripetuto k volte utilizzando ognimvolta come test set un fold differente. Leave-one-out: k = numero dei campioni disponibili Bootstrap Campionamento con rimpiazzo Metodi out-of-bag Training sui campioni estratti tramite bootstrap e testing sui rimanneti campioni non selezionati. Il proceso è ripetuto n volte.

Metodo di hold-out (1)

Metodo di hold-out (2)

Campionamento casuale (holdout ripetuto)

K-fold cross validation

Leave-one-out

How to measure classifier performances Confusion matrix Accuracy Precision, recall, specificity Precision at a given recall F-measure ROC and AUC

Confusion matrix True Predicted Consider a two-class classification problem: True positives (TP): positive examples correctly classified as positives True Negatives (TN): negative examples correctly classified as negatives False positives (FP): negative examples wrongly classified as positives False negatives (FN): positive examples wrongly classified as negatives True Predicted Positives Negatives TP FP FN TN

Accuracy, precision, recall, F-score True Predicted Positives Negatives TP FP FN TN

ROC (Receiver Operating Characteristic) Developed in 1950s for signal detection theory to analyze noisy signals Characterize the trade-off between positive hits and false alarms ROC curve plots TP (on the y-axis) against FP (on the x-axis) Performance of each classifier represented as a point on the ROC curve changing the threshold of algorithm, sample distribution or cost matrix changes the location of the point

ROC Curve At threshold t: TP=0.5, FN=0.5, FP=0.12, FN=0.88 - 1-dimensional data set containing 2 classes (positive and negative) - any points located at x > t is classified as positive At threshold t: TP=0.5, FN=0.5, FP=0.12, FN=0.88

ROC Curve (TP,FP): (0,0): declare everything to be negative class (1,1): declare everything to be positive class (1,0): ideal Diagonal line: Random guessing Below diagonal line: prediction is opposite of the true class

Using ROC for Model Comparison No model consistently outperform the other M1 is better for small FPR M2 is better for large FPR Area Under the ROC curve Ideal: Area = 1 Random guess: Area = 0.5