Gestire le collezioni elettroniche con dati qualitativi e quantitativi Il case-study di Wiley-Blackwell allUniversità degli Studi di Milano Tiziana Morocutti e Federica Zanardini
Parte 1. sviluppo di un toolkit per la raccolta e lanalisi dei dati SISTEMA BIBLIOTECARIO DI ATENEO
Le ragioni di questo lavoro : gestire la collezione in tempi di crisi economica progressiva riduzione del budget reshaping della collezione e ripensamento delle politiche di sviluppo necessità di un team multidisciplinare e multifunzionale a supporto delle decisioni necessità di conoscenza profonda del dominio, a cominciare dai Big Deal Sviluppo di un metodo di analisi sostenibile e riusabile
Analizziamo le relazioni tra le entità in gioco usage perceived value subject coverage content usefulness prices IF behaviours users (ingranaggi o mine vaganti?) impact
SISTEMA BIBLIOTECARIO DI ATENEO Il primo case-study: la collezione Wiley-Blackwell I dati a nostra disposizione: Statistiche duso (2008 JR1) Dati economici (2009 listino prezzi, termini contrattuali) Dati bibliografici (2009 lista dei titoli, copertura disciplinare) Dati demografici sugli utenti (anagrafica UNIMI 2009) Risultati del questionario agli utenti (2009)
Recuperare dati qualitativi: un questionario online per verificare il grado di interesse dei titoli Wiley Per ogni titolo del catalogo Wiley 2009 è stato chiesto di indicare se utile o irrinunciabile Non voto = non utile Somministrato a docenti e ricercatori (2.440 persone) Aperto per 40 giorni Il 25% del campione ha risposto (650 persone) SISTEMA BIBLIOTECARIO DI ATENEO
Distribuzione dei prezzi dei titoli W-B SISTEMA BIBLIOTECARIO DI ATENEO
Distribuzione delluso (f.t. scaricati) 2008 downloads = 157,606 30% dei titoli => 85% delluso (sottoscritti e non in carta) 4% dei titoli mai scaricati Nella classe[0-100 dw] –sono contenuti 850 titoli –corrispondenti a dw –È una long-tail? SISTEMA BIBLIOTECARIO DI ATENEO
Distribuzione del valore percepito (questionario) Quali riviste Wiley-Blackwell sono importanti per te? 94% dei titoli sono stati selezionati 35% dei titoli sono stati selezionati da almeno 10 utenti
Relazione tra uso e valore percepito Uso e valore percepito sono correlati e/o connessi? Rappresento i dati su uno scatter plot: ogni titolo è rappresentato da una coppia di valori => larea a maggior densità è quella del basso-uso e basso valore percepito SISTEMA BIBLIOTECARIO DI ATENEO #selezioni #download
La correlazione tra le due variabili è lineare? Si calcola lindice di Pearson R, cioè il grado di correlazione lineare R è adimensionale (0< R < 1) Si ottiene: –R = 0.55 titoli con #download > 100 (media correlazione lineare) –R = 0.35 titoli con #downloads <= 100 (scarsa correlazione lineare) SISTEMA BIBLIOTECARIO DI ATENEO
Un altro tool del kit: lindice di anomalia Ci sono anomalie nella relazione tra uso e valore percepito? I valori estremi nel rapporto M=(downloads)/(selections) danno informazioni interessanti: M= => corrisponde a titoli usati ma non selezionati » è una sottostima del valore del titolo? » sono giornali di nicchia che interessano persone non rispondenti il questionario? M=0 => corrisponde a titoli non usati ma selezionati »È una sovrastima dellimportanza del titolo? M individua i casi anomali
Journal ranking 1/2 Lutilità viene definita attraverso un algoritmo che combina dati sulluso e valore percepito: U = (e + 0.2u) * downloads U = utilità e = numero di selezioni irrinunciabile u = numero di selezioni utile Ai titoli viene assegnato un punteggio e una classifica Considerando anche il prezzo di listino (p+e) la lista può essere usata per calcolare il risparmio in relazione alle cancellazioni SISTEMA BIBLIOTECARIO DI ATENEO
Journal ranking 2/2 Con lattuale modello di pricing risparmi apprezzabili rispetto al Big Deal sono raggiunti solo tagliando un numero considerevole di titoli I primi 300 titoli costano quanto lintero pacchetto sottoscritto in Big Deal