Fondamenti di informatica Funzioni statistiche Ordinamenti e filtri
Funzioni statistiche: mediana La media è un valore “centrale” Si potrebbe pensare che, confrontando la media con i dati da cui è ricavata, all'incirca il 50% dei dati sia al di sotto della media, il 50% al di sopra Non è vero: la media è molto sensibile ai valori estremi 9 persone che guadagnano 10.000$ e una che guadagna 110.000$ Il reddito medio delle 10 persone è uguale a 20.000$ Il reddito medio è il doppio del reddito del 90% della popolazione
Valore centrale in un insieme ordinato di dati È una misura robusta Mediana La precedente osservazione fa, in alcuni casi, preferire alla media la mediana come indice di posizione centrale La mediana un valore m tale che almeno metà delle osservazioni sono maggiori o uguali a m, e almeno metà sono minori o uguali a m Valore centrale in un insieme ordinato di dati È una misura robusta Poco influenzata dalla presenza di dati anomali In Excel: MEDIANA(n1;n2;...)
La moda è il valore con frequenza più alta nei dati Non risente di picchi Molto instabile In Excel: MODA(n1;n2;...) Esempio: 1 1 2 2 3 3 1 4 2 3 1 5 3 2 1 1 La moda è 1
Distribuzione gaussiana
Riassumono bene l'insieme della distribuzione Indici di dispersione Indicano se una distribuzione è dispersa o “concentrata” intorno alla posizione centrale Riassumono bene l'insieme della distribuzione Varianza s2, deviazione standard s In EXCEL: VAR(intervallo) e DEV.ST(intervallo)
La mediana puo` essere interpretata come il 50-esimo percentile Quartili e percentili Dato un insieme di valori ordinato, il percentile p-esimo è il valore che separa p% dei dati dal resto La mediana puo` essere interpretata come il 50-esimo percentile In Excel: PERCENTILE(range;p) dove 0 <= p <= 1 Il quartile separa un quarto dei dati dal resto Si parla di primo (25%), secondo (50%), terzo (75%) quartile In Excel: QUARTILE(range;n) dove n = 1, 2 o 3
Ordinamenti e filtri Per facilitare la gestione e l'analisi di un gruppo di dati correlati, è possibile vedere un intervallo di celle in una “tabella excel” Una tabella excel contiene dati correlati in una serie di righe e colonne, in cui le righe rappresentano oggetti e le colonne rappresentano proprietà degli oggetti Utilizzando le funzionalità per le tabelle (ordinamenti e filtri) è quindi possibile gestire i dati nelle righe e nelle colonne di una tabella in modo indipendente dai dati nelle altre righe e colonne del foglio di lavoro La riga contenente i nomi delle proprietà viene detta “riga di intestazione”
Ordinamenti e filtri
Ordinamenti e filtri