Average Distance Measure Gianluca Demartini Università degli Studi di Udine 15/06/2005.

Slides:

Advertisements

Presentazioni simili

Termodinamica Chimica

Advertisements

Esperienze di Linking Resolver alla Sapienza - Università di Roma

1 Querying Modelli per la ricerca. 2 Modelli di Retrieval Un modello per il retrieval specifica rappresentazione dei documenti rappresentazione delle.

Parametri Acustici (ISO 3382)

Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.

WEB OF SCIENCE ISI Web of Knowledge

Università degli studi di Modena e Reggio Emilia

Re-engineering del wrapper XML Schema per il sistema MOMIS

Università degli studi di Modena e Reggio Emilia

Campione e campionamento

CAMPIONE E CAMPIONAMENTO

Progetto Pilota 2 Lettura e interpretazione dei risultati

Repository. Progetto sistema elearning Standard per i sistemi di formazione a distanza Slide 2 Livello di contenuti Gli LMS trattano oggetti a livello.

Misura Misura diretta Confronto diretto con l’unita’ di misura e/o multipli e sottomultipli Misura indiretta La grandezza da misurare e’ legata da una.

Gestione Amministrativa dei Periodici Parte 2 Centro Inter-Bibliotecario – Università di di Bologna Orietta Bonora –

Apprendimento Non Supervisionato

LA RICERCA BIBLIOGRAFICA NEL SETTORE BIOMEDICO: il linguaggio della ricerca CENTRO DI BIOTECNOLOGIE SETTORE DOCUMENTAZIONE BIOMEDICA A.O.R.N. A.CARDARELLI-

1 With EU contribution CONCILIATION AND ARBITRATION: two ways to manage the effects of disputes on information and consultation rights in the context of.

Corso di biomatematica lezione 4: La funzione di Gauss

Physically-based Animations of 3D Biped Characters with Genetic Algorithms Università di Roma La Sapienza Relatore: Prof. Marco Schaerf Correlatore: Ing.

BRISCOLA GO ON AVANTI. Storia I giochi di carte hanno le origini più disparate e vengono collocati in differenti epoche, la Briscola risale al La.

Il Teorema del Limite Centrale

Teoria e tecniche della catalogazione e classificazione ricerca9web Prof.ssa Elisa Grignani Università degli studi di Parma aa. 2005/2006.

I database per il medico / 2 n I database n I database: nozioni generali sulle basi di dati, con approfondimento sulle basi bibliografiche Paolo Gardois.

Le pubblicazioni ufficiali dalla carta al web Il caso italiano Official publications from paper to web: the Italian case Official publications and Government.

Database & Information Retrieval

Come nella stampa tradizionale, un giornale online può essere di informazione informazione o un periodico dedicato a una disciplina specifica.

The origin of the Universe and the arrow of time

Metodi Quantitativi per Economia, Finanza e Management Lezione n°8.

Peer-to-Peer Systems Content-Based Routing of Path Queries in Peer-to-Peer Systems Georgia Koloniari and Evaggelia Pitoura Ingargiola Salvatore Montauti.

Valutazione delle prstazioni di un sistema di retrieval

“Alternative methods in animal experimentation: evaluating scientific, ethical and social issues in the 3Rs context” Consiglio Nazionale delle Ricerche,

The Information School of the University of Washington University of Washington1 Introduzione INFO/CSE 100, Spring 2005.

Giovanni Biondi ICT e trasformazione della Scuola.

PRESENTAZIONE SISTEMA MEDIBIOS

Corso di finanza e mercati finanziari internazionali I rischi finanziari Prof. Vittorio de Pedys, ESCP Europe, Unito.

Microsoft Confidential Gabriele Castellani Developer & Platform Evangelism Microsoft.

UNIVERSITA’ DEGLI STUDI DI PAVIA Facoltà di Economia, Giurisprudenza, Ingegneria, Lettere e Filosofia, Scienze Politiche Corso di Laurea Specialistica.

Corso di Analisi Statistica per le Imprese

Short Questions S. Kaul President of American Society of Echocardiography.

Evidenze Sperimentali Attuali (Cosmologia Parte VII)

Metodi Quantitativi per Economia, Finanza e Management Lezioni n° 7-8.

Classificazione TNM dei tumori maligni A system of evaluation of tumors, based on three variables: primary tumor (T), regional nodes (N), and metastasis.

Sociologia delle comunicazioni Rappresentazione/informazione.

A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle.

Informatica Umanistica LM - Scienze del Testo Docente Alessia Scacchi.

Indicizzazione di documenti semistrutturati Sistemi informativi – AA D’Este Laura.

SUMMARY Time domain and frequency domain RIEPILOGO Dominio del tempo e della frequenza RIEPILOGO Dominio del tempo e della frequenza.

THE LIGHT How does the light propagate?. 1)To verify that light propagates in straight lines 2)To compare an object with its projection on a rigid screen.

La distribuzione campionaria della media

From this year, by kind permission of Taeco S.r.l., the Working Retrievers Club Italia has the pleasure to award the prize “Big Hunter Project”. This.

Progetto AMBIT: Ottimizzazione e Valutazione Sperimentale del Motore di Ricerca Semantico Basato sul Contesto Università degli studi di Modena e Reggio.

SUMMARY Interconnection of quadripoles RIEPILOGO Interconnessione di quadripoli RIEPILOGO Interconnessione di quadripoli.

TRATTAMENTO STATISTICO DEI DATI ANALITICI

Le risorse elettroniche per l’ingegneria Maddalena Morando Biblioteca Centrale di Ingegneria.

A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle Prof.

S.t.e.L.L.L.a. (The stimulation of eLearning for life long learning for adults)

Corso di ricerca bibliografica. I motori di ricerca in rete Un motore di ricerca è un software composto da tre parti: 1.Un programma detto ragno (spider)

Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.

Identification of a New Locus for Medullary Cystic Disease, on Chromosome 16p12 Francesco Scolari, Daniela Puzzer, Antonio Amoroso, Gianluca Caridi, Gian.

#sqlsatTorino #sqlsat400 May 23, 2015 AzureML - Creating and Using Machine Learning Solutions Davide

Statistica con Excel Corso di Fisica ed Elementi di Laboratorio ed Informatica CdL Scienze Biologiche AA 2015/2016.

Usare Excel per risolvere problemi….. Esercizi…..

Università degli Studi di Genova - Sistema Bibliotecario di Ateneo Corso REICAT Fernanda Canepa, Le nuove Regole italiane di catalogazione - Bibliografia,

Attività e idee progettuali Politecnico di Torino Istituto Zooprofilattico 02/aprile/2014 Istituzione: Politecnico di Torino Dipartimento: Dipartimento.

9. THE CONTROL OF THE TAX PAYER DECLARATION

A randomized study on eversion versus standard carotid endarterectomy: Study design and preliminary results: The Everest Trial Piergiorgio Cao, MD, Giuseppe.

Parametri Acustici (ISO 3382)

Transcript della presentazione:

Average Distance Measure Gianluca Demartini Università degli Studi di Udine 15/06/2005

15/06/05G. Demartini - ADM 2 Scaletta Misure classiche: richiami ADM: richiami, esempi, estensioni Esperimenti fatti Esperimenti da fare Strumenti

15/06/05G. Demartini - ADM 3 Misure classiche (1/2) Precision, recall … – rel[i]=1 se i-esimo doc reperito è relevant – rel[i]=0 altrimenti

15/06/05G. Demartini - ADM 4 Misure classiche (2/2) Avg-Prec: – n= num docs reperiti – R= num docs relevant R-Prec:

15/06/05G. Demartini - ADM 5 R-Prec ≈ Avg-Prec tot_rel i =# relevant docs reperiti al rank i rp=tot_rel R /R=recall al rank R R-precision is approximately average precision

15/06/05G. Demartini - ADM 6 ADM Average Distance Measure Ok per URS e SRS continui (o discreti non binari)

15/06/05G. Demartini - ADM 7 Grafico ADM

15/06/05G. Demartini - ADM 8 Somma del quadrato delle distanze Favorire i sistemi che sono più precisi nel valutare i documenti Sfavorire quelli che valutano molto bene certi e peggio altri (avendo ADM uguale)

15/06/05G. Demartini - ADM 9 Esempio (1/2) Somma del quadrato delle distanze:

15/06/05G. Demartini - ADM 10 Esempio (2/2) PeggioreMigliore URSSRSURSSRS 0,30 0,20,4 0,401,000,40,6 0,60 0,70,5 ADM(Peggiore)=1-(0+0,6+0)/3=0,8 ADMquad(Peggiore)=1-(0,6 2 )/3=0,88 ADM(Migliore)=1-(0,2+0,2+0,2)/3=0,8 ADMquad(Migliore)=1-(0,2 2+ 0, ,2 2 )/3=0,96

15/06/05G. Demartini - ADM 11 Misure legate ad ADM ADP: ADM sui “sopravvalutati” ADR: ADM sui “sottovalutati” ADM = ADP + ADR - 1 ADM sui primi x docs

15/06/05G. Demartini - ADM 12 La Relevance ADM va bene anche se la relevance non è binaria. E’ naturale pensare che un doc può essere più o meno relevant invece che del tutto relevant o per niente relevant

15/06/05G. Demartini - ADM 13 Relevance in INEX Two dimensions were employed to define relevance: – Exhaustivity (e-value) measures the extent to which the given element covers or discusses the topic of request. – Specificity (s-value) measures the extent to which the given element is focused on the topic of request. 4 livelli per ogni dimensione!

15/06/05G. Demartini - ADM 14 Scaletta Misure classiche: richiami ADM: richiami, esempi, estensioni Esperimenti fatti Esperimenti da fare Strumenti

15/06/05G. Demartini - ADM 15 Conferenze di valutazione Per gli esperimenti su ADM sono stati utilizzati dati di TREC, INEX, NTCIR TREC: conferenza principale NTCIR: reperimento su docs in più lingue INEX: reperimento sul documenti XML

15/06/05G. Demartini - ADM 16 Esperimenti Obiettivi: Scoprire se ADM è più “sensibile” rispetto le altre metriche di valutazione Rank dei sistemi: ADM si basa sullo score assegnato dai SRI Correlazione: – (stat.) Tendenza di due grandezze a variare in modo concomitante Versioni di ADM testate: – ADM, ADP, ADR, ADM(rank), ADM(score)

15/06/05G. Demartini - ADM 17 Esperimenti su TREC-8 Usato il rank indotto dallo score (e non i valori di score) Risultati: ADM correla bene con le golden standard Correlazioni ADM AvgPrec 0,876 R-Prec 0,844

15/06/05G. Demartini - ADM 18 Esperimenti su NTCIR Score a 4 livelli (S,A,B,C) S=7/8, A=5/8, B=3/8, C=1/8 – (per poter sopravvalutare/sottovalutare) Risultati: – ADM (4) ADM (2) – ADM (4)

15/06/05G. Demartini - ADM 19 Esperimenti da fare Eero Sormunen ha ri-classificato (su 4 livelli di relevance) alcuni docs di TREC-7/8 Vedere se con 4 livelli ADM funziona meglio che con 2 Correlazioni con AvgPrec, R-Prec

15/06/05G. Demartini - ADM 20 Esperimenti da fare In TREC-2003: – HARD Track: 3 livelli di relevance (hard relevant, soft relevant, no relevant) – Robust Retrieval track: pochi docs reperiti – TeraByte Collection: su grandi collezioni (tipo il Web) ADM va meglio?

15/06/05G. Demartini - ADM 21 Strumenti usati R, correlazione di Kendall, DB, … Quello che ho studiato in 5 anni serve! Obiettivo: costruire un "banco di prova” Quando arrivano i risultati di una conferenza si vede come va ADM

15/06/05G. Demartini - ADM 22 Probabilità di relevance Con una relevance non binaria dovrei avere una distribuzione della probabilità sui vari livelli Fornire un intervallo di confidenza in cui cade il valore esatto di relevance Esempio: – Media 0,7 – Varianza 0,1

15/06/05G. Demartini - ADM 23 Conclusioni ADM sembra essere più sensibile (stessi valori con meno docs reperiti) Avere una valutazione sistematica che lo provi

15/06/05G. Demartini - ADM 24 Bibliografia (1/3) S. Mizzaro. A new measure of retrieval effectiveness (Or: What's wrong with precision and recall). In T. Ojala editor, International Workshop on Information Retrieval (IR'2001), pages Infotech Oulu, Oulu, Finland, September 2001 V. Della Mea and S. Mizzaro. Measuring retrieval effectiveness: A new proposal and a first experimental validation. Journal of the American Society for Information Science and Technology, 55(6): , 2004

15/06/05G. Demartini - ADM 25 Bibliografia (2/3) V. Della Mea, L. Di Gaspero, and S. Mizzaro. Evaluating ADM on a four-level relevance scale document set from NTCIR. In Proceedings of NTCIR Workshop 4 Meeting - Supplement Vol. 2, Tokyo, 2- 4 giugno National Institute of Informatics (NII), pages Norbert Fuhr, Saadia Malik, Mounia Lalmas. Overview of the INitiative for the Evaluation of XML Retrieval (INEX) 2003

15/06/05G. Demartini - ADM 26 Bibliografia (3/3) Text REtrieval Conference (TREC) A Geometric Interpretation of Rprecision and Its Correlation with Average Precision (SIGIR05, 2005, in corso di pubblicazione).