La statistica ufficiale incontra… la comunità degli sviluppatori di software per la statistica Di quali innovazioni nel software per la statistica abbiamo bisogno? Marco Scarnò Decima Conferenza Nazionale di Statistica
Il 2002: vedere e poi… entrare nei meccanismi di sviluppo Derivato da Osiris III.2 (Univ. Michigan, 1975), in distribuzione dal 2001 La scelta dellOS fu dettata da: Il software risultante è migliore; Costi di sviluppo minori; Ri-usabilità del codice; => Gli utenti del progetto sono sia gli utilizzatori sia gli sviluppatori
Il 2002: vedere e poi… entrare nei meccanismi di sviluppo… …come è andata a finire? Dopo aver scritto dei dettagliati Terms Of Reference e aver realizzato diversi prototipi… nel 2006 sono emerse: -visioni differenti sulle funzionalità del software (modernizzare WinIDAMS o meno?) -LUNESCO non compete… diffonde cultura Nel 2007 comincia a essere distribuito ADaMSoft… è da osservare che viene sviluppato allinterno di un contesto di ricerca, senza alcuna esigenza commerciale… interazioni successive con utenti- ricercatori lo stabilizzano.
Qualche considerazione… Dallesperienza di ADaMSoft e da quanto visto con altri software dietro il termine OS si celano alcune problematiche fondamentali… - Il risultato funziona ma non è sempre documentato; - I sorgenti saranno pure aperti ma… sfida aperta a interpretarli e a modificarli! - Una logica di ritorno (anche non monetario) è, comunque, necessaria alla sopravvivenza del pacchetto (per ADaMSoft, in questo caso, è il risparmio dal non avere altri software proprietari per gestione dati e lavere un ambiente che consente di fare ricerca metodologica). In realtà quello che sembra funzionare (ed è così da tempo… LISP, SAS-IML, S, STATA) è: - un motore proprietario od OS (che non viene modificato, se non da un ristretto gruppo di sviluppatori); -di un linguaggio che, appoggiandosi sul motore, consenta agli utenti di realizzare il proprio pacchetto. Lesempio nellambito statistico è… R, ma… è sempre stato così con i linguaggi di programmazione… Fortran, C, C++, C#, JAVA, ecc.
Il contesto odierno… il WWW e… le esigenze Dal punto di vista dellutente di un software statistico… esistono problemi specifici e necessità di prodotti adatti (e facili da utilizzare)… Un esempio: come fare il grafico che rappresenta congiuntamente lassociazione di geni e il loro livello di espressione? Una ricerca su Google e… si può scaricare un software (di solito utilizzato dai Biologi) che consente immediatamente di fare il grafico!
Perché non sempre è facile? Problemi differenti (o afferenti a diverse discipline, campi di attività) potrebbero/possono essere risolti utilizzando metodologie trasversali (proprie di altre discipline o campi di attività)… tuttavia: -Non cè accordo sul tipo (formato, rappresentazione, ecc.) dInformazione che i software utilizzano; -Non è sempre chiaro allutente (non specializzato) il percorso che questi può seguire per utilizzare, con successo, del software specializzato -Dal lato dello sviluppatore non sempre cè chiarezza su quali siano i risultati che lutilizzatore si aspetta (quali informazioni mettere nei risultati, a quale livello di dettaglio, cosa può essere omesso, ecc.)
Era il 1985…
Del resto anche Neal Van Eck… Nota: anche ADaMSoft implementa un sistema simile… proponendo la sintassi da utilizzare sulla base dei problemi che si hanno a disposizione
Di quali innovazioni nel software per la statistica abbiamo bisogno? Dal punto di vista dellutente specializzato: Semplicità duso; integrazione tra vari strumenti (possibilità di utilizzare la medesima informazione tra software differenti, ecc.) Dal punto di vista del diffusore dellInformazione: Certezza della sua corretta interpretazione (a livello micro e macro) Dal punto di vista dello sviluppatore: Dettagli sulla rappresentazione dellInformazione e sui risultati che ci si aspetta di ottenere Dal punto di vista del ricercatore: Un ambiente che consenta di provare e diffondere nuovi metodi in maniera semplice Dal punto di vista dellutente non statistico: Disponibilità di materiale per scegliere/interpretare e conoscere le metodologie
Linnovazione, comunque, non può non tenere conto anche dellevoluzione dei metodi dinterazione con la tecnologia