Teoria e tecniche della catalogazione e classificazione Processo di ricerca, tattiche e strategie, valutazione, rilevanza ricerca7ricerca Prof.ssa Elisa.

Slides:



Advertisements
Presentazioni simili
Territorio: provincia di Pordenone
Advertisements

Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Caduta non guidata di un corpo rettangolare in un serbatoio Velocità e rotazione.
1 t Mobilità internazionale e conversione dei voti Maria Sticchi Damiani Università della Calabria 8 febbraio 2013.
TAV.1 Foto n.1 Foto n.2 SCALINATA DI ACCESSO ALL’EREMO DI SANTA CATERINA DEL SASSO DALLA CORTE DELLE CASCINE DEL QUIQUIO Foto n.3 Foto n.4.
II° Circolo Orta Nova (FG)
II° Circolo Orta Nova (FG)
1 Pregnana Milanese Assessorato alle Risorse Economiche Bilancio Preventivo P R O P O S T A.
1 DECRETO LEGISLATIVO 626/94 19 SETTEMBRE 1994 MODIFICHE ED INTEGRAZIONI DECRETO LEGISLATIVO 242/96 19 MARZO 1996 CORSO DI FORMAZIONE ED INFORMAZIONE IN.
Frontespizio Economia Monetaria Anno Accademico
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
1 Tavolo del Patto per la crescita intelligente, sostenibile e inclusiva Il ricorso agli ammortizzatori sociali nei territori colpiti dagli eventi sismici.
DISEGNO TECNICO INDUSTRIALE
Training On Line – CONA. 2 Richiesta Da Menu: Conferimenti ad inizio anno termico > Agosto > Annuali > Nuova Richiesta Si accede alla pagina di Richiesta.
Numerazione in base tre Prof. Lariccia Giovanni Gruppo: Roberta Spicciariello, Roberta Accaria e Maria Elisa Graziano.
Teoria della Finanza Aziendale
GESTIONE DELLA PRODUZIONE
Reaching Definitions. Tino CortesiTecniche di Analisi di Programmi 2 Reaching definitions Dato un punto del programma, quali sono i comandi di assegnamento.
Dipartimento di Ricerca Sociale - Università del Piemonte Orientale 1 Castelli Aperti giugno 2005 Castello di Camino (AL) IL PUBBLICO DI CASTELLI.
Capitolo 3 Strutture dati elementari Algoritmi e Strutture Dati.
Algoritmo di Ford-Fulkerson
Programmazione 1 9CFU – TANTE ore
1 Il servizio di prestito e fornitura documenti ILL-SBN una visione di insieme caratteristiche della procedura illustrazione delle funzionalità
Ufficio Studi UNIONCAMERE TOSCANA 1 Presentazione di Riccardo Perugi Ufficio Studi UNIONCAMERE TOSCANA Firenze, 19 dicembre 2000.
eliana minicozzi linguaggi1a.a lezione2
Il linguaggio Fortran 90: 4. Array: Vettori e Matrici
1 A cura di Vittorio Villasmunta Metodi di analisi dei campi meteorologici Corso di base sulluso del software di analisi meteorologica DIGITAL ATMOSPHERE.
La partita è molto combattuta perché le due squadre tentano di vincere fino all'ultimo minuto. Era l'ultima giornata del campionato e il risultato era.
Prof.ssa Elisa Grignani Università degli studi di Parma aa. 2005/2006
Bibliografia. Sistemi di recupero dellinformazione Teoria e tecniche della catalogazione e classificazione Presentazioni, presentazione del corso ricerca1intro.
Teoria e tecniche della catalogazione e classificazione ricerca9web Prof.ssa Elisa Grignani Università degli studi di Parma aa. 2005/2006.
Teoria e tecniche della catalogazione e classificazione Ciclo di trasferimento dellinformazione ricerca3ciclo Prof.ssa Elisa Grignani Università degli.
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Scritte scritte scritte scritte scritte scritte scritte Scritte scritte Titolo.
Cercare informazioni sul Web. 5-2 Organizzazione dellinformazione tramite gerarchie Classificazione gerarchica Linformazione è raggruppata in un piccolo.
DHTML: Modello degli Eventi 1. 2 Sommario Introduzione Evento onclick Evento onload Gestione errori con onerror Gestione mouse con levento onmousemove.
Strutture di controllo in C -- Flow Chart --
Il marketing: costruire una relazione profittevole con il cliente
Questionari sulla didattica: le risposte di studenti & docenti.
19 Lezione 21/5/04 Composizione dell'immagine 1 COMPOSIZIONE DELLIMMAGINE.
Portale Capacità STOGIT
2 3 4 RISERVATEZZA INTEGRITA DISPONIBILITA 5 6.
Wks ott 05 - soddisfazione partecipanti CONSIDERAZIONI SUI WKS Presenze, ricavi, marginalità lorda e analisi soddisfazione partecipanti.
Melfi, 1 aprile 2011 – MediaShow 1 Social Network: possibilità di uso consapevole nella didattica Uso, consapevolezza, opportunità, proposte Caterina Policaro.
1ROL - Richieste On Line Ente pubblico 5ROL - Richieste On Line.
1 Informatica Senza Computer? Chiariamoci un po le idee!!! Carlo Gaibisso Informatica senza Computer?
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
INFORMATICA MATTEO CRISTANI. INDICE CICLO DELLE LEZIONI LEZ. 1 INTRODUZIONE AL CORSO LEZ. 2 I CALCOLATORI ELETTRONICI LEZ. 3 ELEMENTI DI TEORIA DELL INFORMAZIONE.
POLITICHE URBANE E MOBILITÀ SOSTENIBILE: LE PROSPETTIVE PER ROMA CAPITALE Qualità dei servizi pubblici a Roma: focus sul trasporto locale Roma, 20 settembre.
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
TECNOLOGIE DELLINFORMAZIONE E DELLA COMUNICAZIONE PER LE AZIENDE Materiale di supporto alla didattica.
1 Guida per linsegnamento nei corsi per il conseguimento del CERTIFICATO DI IDONEITÀ ALLA GUIDA DEL CICLOMOTORE.
Bando Arti Sceniche. Per poter procedere è indispensabile aprire il testo del Bando 2ROL - Richieste On Line.
1 Questionario di soddisfazione ATA - a. sc. 2008/09 Il questionario è stato somministrato nel mese di aprile Sono stati restituiti 29 questionari.
LE SAI LE TABELLINE? Mettiti alla prova!.
21 marzo 2002 (ri-)Avvisi: Giovedi 28 marzo la lezione e sospesa. Nuovo indirizzo di Spedire messaggi e esercizi solo.
1 Ly-LAB Sistema di gestione dei dati analitici di laboratorio.
Capitolo 3 Strutture dati elementari Algoritmi e Strutture Dati Camil Demetrescu, Irene Finocchi, Giuseppe F. Italiano.
23/ 23 Novembre Scaletta 1. Lavvento del Web marketing: rompere le routine consolidate, creare nuove routine 2. Cosa chiedere al Web marketing?
Bando di Residenza Cap Scheda ENTE 3ROL - Richieste On Line.
1Piero Scotto - C14. Finalità del corso Programma Materiale Requisiti Spendibilità 2Piero Scotto - C14.
Sviluppare un programma in C che, dato un array da 100 elementi interi caricato con numeri casuali compresi tra [10,100], sia in grado di cercare il valore.
Atzeni, Ceri, Paraboschi, Torlone Basi di dati McGraw-Hill,
CMDBuild: un progetto open source di supporto alla gestione ICT Esempi di workflow implementati in ottica ITIL CMDBuild è un progetto di: Tecnoteca srl.
Modulo 6 Test di verifica
Acceleratori e Reattori Nucleari
lun mar mer gio ven SAB DOM FEBBRAIO.
A.P. cat. B - 1 Per chi vuole: Libro di testo D.P. Curtis, K. Foley, K. Sen, C. Morin Informatica di base 2° edizione Mc Graw-Hill Companies.
1 Microsoft Access Gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni Informatica per laurea triennale.
USR-INRiM-GMEE-CE.SE.DI Formazione&Metrologia Modulo 1 1 Modulo 1 Costruzione di un linguaggio comune Preparazione liste dei termini. Condivisione.
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
Transcript della presentazione:

Teoria e tecniche della catalogazione e classificazione Processo di ricerca, tattiche e strategie, valutazione, rilevanza ricerca7ricerca Prof.ssa Elisa Grignani Università degli studi di Parma aa. 2005/2006

2 Abbiamo visto: Informazione Gerarchia dellinformazione Teoria dellinformazione (C. Shannon) Ciclo di trasferimento dellinformazione Sistemi IR Alcuni concetti base IR Cataloghi

3 Concetti di base IR Utenti, bisogni informativi, domande Documenti, raccolte di documenti Linguaggi di indicizzazione, vocabolari controllati Processo di ricerca Valutazione - Rilevanza

4 OGGI Concetti di base IR Utenti, bisogni informativi, domande Documenti, raccolte di documenti Linguaggi di indicizzazione, vocabolari controllati Processo di ricerca Valutazione - Rilevanza

5 OGGI: Concetti di base IR Utenti, bisogni informativi, domande Documenti, raccolte di documenti Linguaggi di indicizzazione, vocabolari controllati Processo di ricerca Valutazione - Rilevanza

6 Processo di ricerca e recupero dellinformazione: modello standard

7 Modello standard: problemi Gli utenti apprendono nel corso del processo di ricerca –attraverso le voci di soggetto assegnate –leggendo i documenti trovati –navigando attraverso gli hyperlink –...

8 IR è un processo iterativo Repositories Workspace Goals

9 IR è un dialogo –Lo scambio non termina alla prima risposta –Lutente può riconoscere elementi utili di una risposta –Le domande si modificano nel corso del processo

10 Raccolta delle bacche come strategia IR (Bates 90) Modello standard –Assume che il bisogno informativo rimanga statico nel corso del processo di ricerca Raccolta delle bacche –Interessanti informazioni sono sparpagliate in giro, come le bacche tra i cespugli –La richiesta si modifica gradualmente –Nuove informazioni possono portare a nuove idee e a nuove direzioni di ricerca –Il bisogno informativo non viene soddisfatto da un unico insieme finale di risposte recuperate viene soddisfatto attraverso una serie di scelte e pezzi di informazione raccolti nel corso della ricerca, lungo la strada

11 Schizzo di un ricercatore … moving through many actions towards a general goal of satisfactory completion of research related to an information need. (Bates 89) Q0 Q1 Q2 Q3 Q4 Q5

12 Tattiche vs. Strategie Tattica: azione a breve termine per raggiungere un determinato obiettivo (goal) –operazioni, azioni Strategia: pianificazione complessiva per raggiungere uno determinato scopo (objective) –una serie di operazioni e di azioni collegati tra loro

13 Tattiche di ricerca dellinfo. Formulare la ricerca –Individuare una formulazione della ricerca –Selezionare e riformulare gli specifici termini Monitoraggio –Tenere una traccia dei passi della ricerca Fonti di informazione –Navigare verso e allinterno delle fonti (cfr. Lopuscolo di Jenny RYAN, Steph CAPRA. Research Projects:An Information Literacy Planner For Students. American Library Association, 2001)

14 Formulare la ricerca Specificità / Ambito –Usare i termini più specifici; ma anche: –Tenere conto dellambito generale in cui ci colloca la ricerca Esaustività –Considerare tutti gli elementi implicati Filtro –Sottrarre progressivamente alcuni elementi Formulazione parallela –Usare sinonimi e termini paralleli Controllo terminologico –Verificare la coerenza dei termini usati con quelli adottati dal sistema IR (p.e., voci da un thesauro, soggettario, authority file)

15 Monitoraggio (anche a livello di strategia) Confrontare –Comparere lo stato attuale della ricerca con il suo scopo originario Pesare –Fare una analisi costi/benefici delle azioni in atto o programmate Corregere gli errori Registrare –Tenere traccia - un diario – dei passi della ricerca

16 Fonti di informazione La Bibbia: – Un autorevole punto di partenza p.e., un classico sullargomento, una pagina web fatta bene Ricercare/indagare: –Ricercare e verificare tra opzioni diverse p.e., a partire da una lista di documenti ottenuta da una ricerca in OPAC, o da una citazione in un documento Tagliare/filtrare: –Non considerare ciò che non ci serve e delimitare il settore di ricerca

17 Paradosso Paradosso di base della ricerca/recupero dellinformazione (Roland Hjerrpe) –The need to describe that which you do not know in order to find it –Il bisogno di descrivere ciò che non conoscete in modo da trovarlo

18 Concetti di base IR Utenti, bisogni informativi, domande Documenti, raccolte di documenti Linguaggi di indicizzazione, vocabolari controllati Processo di ricerca Valutazione - Rilevanza

19 Valutazione Perché valutare? Che cosa? Come?

20 Perché valutare? Verificare se il sistema è accettabile Formulare giudizi comparativi Altro?

21 Che cosa valutare? In che misura il bisogno informativo è stato soddisfatto. Quanta informazione nuova e corretta si è acquisita sullargomento. Apprendimento occasionale: –Quanto si è appreso sulla collezione. –Quanto si è appreso su altri argomenti. Quanto il sistema è invitante e amichevole.

22 Come valutare? Misure di riferimento per valutare lefficacia e lefficienza di un sistema IR: richiamo precisione rilevanza –Richiamo Proporzione del materiale rilevante di fatto recuperato –Precisione Proporzione del materiale recuperato di fatto rilevante effectiveness

23 Doc. Rilevanti vs. Recuperati Rilevanti Recuperati Tutti i doc.

24 Precisione vs. Richiamo Rilevanti Recuperati Tutti i doc.

25 Precisione: doc. rilev. recuperati/totale doc. recuperati Precisione vs. Richiamo Richiamo: doc. rilev. recuperati/totale doc. rilevanti Rilevanti Recuperati Tutti i doc.

26 Perchè precisione e richiamo? Get as much good stuff as possible while at the same time getting as little junk as possible (Larson, 2004)

27 Documenti Ritrovati vs. Rilevanti Precisione molto alta, richiamo molto basso Rilevanti

28 Documenti Ritrovati vs. Rilevanti Precisione e richiamo molto bassi (di fatto, recupero 0) Rilevanti

29 Documenti Ritrovati vs. Rilevanti Richiamo alto, ma bassa precisione Rilevanti

30 Documenti Ritrovati vs. Rilevanti Precisione e richiamo alti (finalmente!) Rilevanti

31 Curva Precisione/Richiamo in riferimento al n.o dei documenti Curva di tipo Zipf precision recall x x x x

32 Curva Precisione/Richiamo Difficile stabilire quale di questi due ipotetici risultati sia il migliore: precision recall x x x x

33 Livelli di Cutoff Fissare il numero dei documenti RILEVANTI che si intende recuperare, p.e.: Top 5 (solo i primi 5) Top 10 Top 20...

34 Problemi con Precisione/Richiamo Non siamo in grado di valutare il vero valore del richiamo (solo se i documenti della raccolta sono molto pochi) Precisione/Richiamo sono correlati in modo inverso Si dà per scontata limportanza di un ordinamento dei risultati secondo il livello di rilevanza

35 Concetti di base IR Utenti, bisogni informativi, domande Documenti, raccolte di documenti Linguaggi di indicizzazione, vocabolari controllati Processo di ricerca Valutazione Rilevanza

36 Information Retrieval (IR) Obiettivo dellIR è di recuperare, allinterno di una collezione, tutti e solo i documenti rilevanti per un particolare utente con una particolare richiesta informativa The goal is to search large document collections (millions of documents) to retrieve small subsets relevant to the users information need Rilevanza è un concetto chiave dellIR, che ora cercheremo di chiarire

37 Rilevanza Intuitively, we understand quite well what relevance means. It is a primitive y know concept, as is information for which we hardly need a definition. … if and when any productive contact [in communication] is desired, consciously or not, we involve and use this intuitive notion of relevance. (Saracevic, 1975)

38 Rilevanza In che misura un documento è rilevante –per questo utente, per questo bisogno informativo Quello di rilevanza è un giudizio soggettivo, ma: in qualche misura calcolabile –Quanto spesso la gente concorda sul fatto che un certo documento è rilevante per una certa domanda ? (criterio della popolarità)

39 Rilevanza In quali modi un documento può essere rilevante al fine di soddisfare un bisogno informativo? –Fornisce in modo preciso risposte dettagliate Quando è morto Dante Alighieri? Nel 1321 –Risponde in modo preciso ma parziale Dove si trova Stradella? Vicino a Pavia –Suggerisce una diversa fonte di informazione Dove si trova Stradella? Guarda su un atlante geografico –Altro …

40 Alcuni studi sul tema della rilevanza Rassegna bibliografica: Saracevic, 1975 Riconsiderazione dellidea di rilevanza come centrata sullutente: Schamber, Eisenberg, Nilan, 1990 Numero speciale sulla di rilevanza in JASIS, Aprile 1994

41 Prossimamente: …