di Pietro Demurtas
È il nome di un pacchetto statistico implementato a partire dai primi anni ‘90 da Ihaka e Gentleman. È un linguaggio di programmazione che può essere considerato come un dialetto del linguaggio S, a sua volta creato nel 1976 nei Bell Laboratories e poi commercializzato come S-PLUS da Insightful2. È una comunità (l’R Developement Core Team) che include numerosi statistici e computer scientists di tutto il mondo, i quali sono interessati a migliorarlo e pubblicizzarlo. È un software open-source, ovvero gratuito.
di alta qualità. è implementato, tra gli altri, da importanti studiosi riconosciuti nell’ambito del calcolo statistico; personalizzabile, poiché consente all’utente (esperto) di creare istruzioni per risolvere nuovi problemi o per migliorare le istruzioni già presenti facilmente scaricabile da internet. Il download del software e dei pacchetti è effettuabile a partire dal Comprehensive R Archive Network (CRAN) all’indirizzo web:
A differenza dei pacchetti per l’analisi statistica più diffusi nell’ambito delle scienze sociali (ed ex: Spss), basati su interfacce grafiche user-friendly che tramite un click consentono di svolgere le operazioni desiderate, R è un software commanded-oriented: gli utenti digitano i comandi nel linguaggio di programmazione R e il software risponde interattivamente eseguendoli. NB: è stato creato un pacchetto che consente anche agli utenti meno esperti di svolgere le più diffuse operazioni statistiche mediante un’interfaccia grafica per molti versi simile a quella di Spss. Il pacchetto in questione si chiama R Commander (RCmdr) ed è facilmente scaricabile da R Studio.
Entrare nel sito Dal menù di sinistra selezionare la voce CRAN. Scegliere un CRAN geograficamente vicino (ad esempio Palermo, Padova, Milano). Selezionare il download per il sistema operativo utilizzato (Mc, Windows, etc.) Scegliere la distribuzione base. Effettuare il download Installare il software.
Il nucleo centrale di R è costituito da un software-interprete che esegue i comandi impartiti dagli utilizzatori e da alcuni pacchetti forniti inizialmente in modo da consentire le funzionalità di base. Tutte le altre funzionalità possono essere aggiunte, scaricando i rispettivi pacchetti (ve ne sono più di 2000)!
Poiché l’interfaccia base di R non è facile da utilizzare, è stato creato un ambiente di sviluppo chiamato R-Studio, anch’esso gratuito e scaricabile da internet. R studio è user-friendly poiché consente di eseguire alcune operazioni mediante l’utilizzo di pulsanti. N.B. Il download di R Studio deve essere effettuato dopo quello di R
dkd l Digitazione dei comandi Esecuzione dei comandi Global environment Pacchetti, Aiuti …
R è object-oriented: qualsiasi cosa al suo interno è un oggetto che in R-Studio viene registrato e può essere visualizzabile all’interno del Global Environment. Per oggetto si intende qualsiasi entità che possa essere manipolata: variabili qualitative e quantitative, matrici, funzioni, stringhe di caratteri etc.
Possono essere semplici come i Numeri e le Stringhe. Possono essere compositi come i Vettori che corrispondono alle nostre variabili, le quali sono sia numeriche che categoriali (in quest’ultimo caso si parla di Fattori). Infine possono essere complesse come le Matrici, gli Array, le Liste e i Data Frames. In particolare, questi ultimi sono tabelle composte da uno o più vettori e /o fattori della stessa lunghezza (nostri data base).
Gli oggetti si caratterizzano ovviamente per i loro nomi e il loro contenuto, ma anche per attributi che specificano il tipo di dati rappresentati al loro interno. Due sono gli attributi intrinseci dei vettori: Mode. Ci sono quattro tipi di mode: numerico, carattere, logico e complesso. Length. La lunghezza è il numero degli elementi dell’oggetto Per quanto riguarda le matrici è necessario fare riferimento ad altri attributi non intrinseci: Dim. La dimensione di un oggetto come una matrice ci descriverà il numero delle righe e delle colonne presenti