La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Teoria e tecniche della catalogazione e classificazione Utenti, documenti, linguaggi di indicizzazione ricerca5ir Prof.ssa Elisa Grignani Università degli.

Presentazioni simili


Presentazione sul tema: "Teoria e tecniche della catalogazione e classificazione Utenti, documenti, linguaggi di indicizzazione ricerca5ir Prof.ssa Elisa Grignani Università degli."— Transcript della presentazione:

1 Teoria e tecniche della catalogazione e classificazione Utenti, documenti, linguaggi di indicizzazione ricerca5ir Prof.ssa Elisa Grignani Università degli studi di Parma aa. 2004/2005

2 T&T 2004/05 2 Abbiamo visto: Informazione Gerarchia dellinformazione Teoria dellinformazione (C. Shannon) Ciclo di trasferimento dellinformazione Sistemi di recupero dellinformazione

3 T&T 2004/05 3 Gerarchia dellinformazione Wisdom Knowledge Information Data

4 T&T 2004/05 4 Teoria dellinformazione Noise SourceDecodingEncodingDestination Message Channel StorageSource Decoding (Retrieval/Reading) Encoding (writing/indexing) Destination Message

5 T&T 2004/05 5 Ciclo di trasferimento dellinformazione Creation UtilizationSearching Active Inactive Semi-Active Retention/ Mining Disposition Discard Using Creating Authoring Modifying Organizing Indexing Storing Retrieval Distribution Networking Accessing Filtering

6 T&T 2004/05 6 Struttura di un sistema IR Search Line Interest profiles & Queries Documents & data Rules of the game = Rules for subject indexing + Thesaurus (which consists of Lead-In Vocabulary and Indexing Language Storage Line Potentially Relevant Documents Comparison/ Matching Store1: Profiles/ Search requests Store2: Document representations Indexing (Descriptive and Subject) Formulating query in terms of descriptors Storage of profiles Storage of Documents Information Storage and Retrieval System Adapted from Soergel, p. 19

7 T&T 2004/05 7 Sistemi IR: struttura (Cooper - Maron, 1985) 1.linsieme delle possibili chiavi di accesso assegnate ai documenti; 2.linsieme delle domande formulabili dagli utenti; 3.linsieme degli indicatori di valore informativo da assegnare ai documenti; 4.una regola di recupero.

8 T&T 2004/05 8 Oggi (e domani) IR: alcuni concetti di base

9 T&T 2004/05 9 Concetti di base IR Utenti, bisogni informativi, domande Documenti, raccolte di documenti Linguaggi di indicizzazione, vocabolari controllati Processo di ricerca Valutazione - Rilevanza

10 T&T 2004/05 10 Concetti di base IR Utenti, bisogni informativi, domande Documenti, raccolte di documenti Linguaggi di indicizzazione, vocabolari controllati Processo di ricerca Valutazione - Rilevanza

11 T&T 2004/05 11 Utenti: bisogni informativi Perchè costruire sitemi IR? Le diverse persone hanno bisogni informativi diversi e del tutto svariati Le persone spesso non sanno cosa cercano, o possono non essere in grado di esprimere il loro bisogno informativo in modo utile

12 T&T 2004/05 12 Utenti: domande Una domanda (query) è una forma di espressione dei bisogni informativi dellutente Può essere espressa in vari modi –in linguaggio naturale –nei termini di un linguaggio di indicizzazione Le domande talvolta non rappresentano in modo accurato il bisogno informativo –Differenze tra una conversazione tra persone e una espressione formale di ricerca

13 T&T 2004/05 13 Utenti: domande: cataloghi Indagine sponsorizzata dal Council on Library Resources sullutilizzo dei cataloghi online nelle biblioteche USA: Using online catalogs: a nationwide survey, New York, Neal- Schuman, 1983.

14 T&T 2004/05 14

15 T&T 2004/05 15 Utenti: domande: Web Indagini sulluso del Web: La gente che cosa cerca? Come utilizza i motori di ricerca? –In quale percentuale trova ciò che sta cercando? –Qual è il livello di difficoltà nel trovare ciò che cerca? Come si possono migliorare i motori di ricerca?

16 T&T 2004/05 16 La gente che cosa cerca nel Web? Studio di Amanda Spink et al., Ott Indagine su Excite; dati tratti da un campione di 316 utenti intervistati tramite questionario

17 T&T 2004/05 17 What Do People Search for on the Web? Self-reported topics Genealogy/Public Figure:12% Computer related:12% Business:12% Entertainment: 8% Medical: 8% Politics & Government 7% News 7% Hobbies 6% General info/surfing 6% Science 6% Travel 5% Arts/education/shopping/images 14% Something is missing…

18 T&T 2004/05 18 What Do People Search for on the Web? 4660 sex 3129 yahoo 2191 internal site administr chat 1498 porn 1315 horoscopes 1284 pokemon 1283 SiteScope test 1223 hotmail 1163 games 1151 mp weather maps 1036 yahoo.com 983 ebay 980 recipes 50,000 queries from Excite 1997 Most frequent terms:

19 T&T 2004/05 19 Google come spirito del tempo Zeitgeist Andiamo a vedere la pagina:

20 T&T 2004/05 20 Concetti di base IR Utenti, bisogni informativi, domande Documenti, raccolte di documenti Linguaggi di indicizzazione, vocabolari controllati Processo di ricerca Valutazione - Rilevanza

21 T&T 2004/05 21 Documenti Un documento è una rappresentazione di una aggregazione di informazioni, considerata come una unità Cosa intendiamo con documento? –lintero documento? –un suo surrogato? –pagine? M. Buckland, What is a Document, JASIS, Sept. 1997, pp J. LeGoff, Documento/Monumento, in Enciclopedia, Torino, Einaudi, , vol. 5, pp

22 T&T 2004/05 22 Raccolte di documenti / Collezioni Una collezione è una aggregazione fisica o logica di documenti –museo, pinacoteca –biblioteca –base di dati –biblioteca digitale –... Krzysztof POMIAN, Memoria, in Enciclopedia, Torino, Einaudi, , vol. 15, pp

23 T&T 2004/05 23 Concetti di base IR Utenti, bisogni informativi, domande Documenti, raccolte di documenti Linguaggi di indicizzazione, vocabolari controllati (da approfondire nel modulo B del corso) Processo di ricerca Valutazione - Rilevanza

24 T&T 2004/05 24 Linguaggi di indicizzazione Indicizzazione a parole chiave non controllate: p.e. KWIC, KWOC, cerca nel titolo in un OPAC Linguaggi di indicizzazione controllati ma non strutturati Thesauri: controllati e strutturati Schemi di classificazione: controllati, strutturati e codificati

25 T&T 2004/05 25 Vocabolari controllati Il controllo terminologico è un tentativo di fornire un insieme standardizzato e coerente di termini (quali voci di soggetto, nomi di persone o enti, notazioni di uno schema di classificazione) con lo scopo di portare un aiuto nella ricerca di informazioni Un esempio linguistico: Word Net

26 T&T 2004/05 26 Vocabolari controllati Soggettari: p.e., Soggettario di Firenze, Library of Congress Subject Headings: Thesauri: p.e., ERIC Thesaurus of Descriptors, The Art and Architecture Thesaurus, Medical Subject Headings (MESH) Name Authority File: Schemi di classificazione: p.e., CDD, CDU, CC...

27 T&T 2004/05 27 Sistemi pre- e post-coordinati Sistemi pre-coordinati: è lindicizzatore (bibliotecario, etc.) che costruisce adeguate rappresentazioni del contenuto dei documenti. Sistemi post-coordinati: è lutente o chi conduce la ricerca che combina i singoli concetti per descrivere documenti che potrebbero essere considerati rilevanti.

28 T&T 2004/05 28 Concetti di base IR Utenti, bisogni informativi, domande Documenti, raccolte di documenti Linguaggi di indicizzazione, vocabolari controllati Processo di ricerca Valutazione - Rilevanza

29 T&T 2004/05 29 Prossimamente Processo di ricerca dellinformazione Valutazione – Rilevanza Cataloghi e bibliografie come sistemi IR


Scaricare ppt "Teoria e tecniche della catalogazione e classificazione Utenti, documenti, linguaggi di indicizzazione ricerca5ir Prof.ssa Elisa Grignani Università degli."

Presentazioni simili


Annunci Google