La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia lanalisi statistica 1.

Presentazioni simili


Presentazione sul tema: "Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia lanalisi statistica 1."— Transcript della presentazione:

1 Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia lanalisi statistica 1

2 I dati grezzi Il risultato della rilevazione del fenomeno X sulla popolazione U di numerosità N è un insieme di N osservazioni Ciascuna osservazione coincide con una (e una sola) delle k modalità x i previste dalla scala utilizzata. Esempio: il numero di partner degli studenti universitari: fenomeno X quantitativo e discreto, che si rileva contando; le sue modalità x i sono i numeri interi 0,1,... ; la scala delle modalità è quantitativa rapporto. 2

3 Distribuzioni di frequenza L'analisi statistica procede per sintesi successive: l'obiettivo è di fare emergere dai dati, ad ogni livello di sintesi, informazioni utili a descrivere e spiegare il comportamento di X su U. Il numero di volte in cui una modalità x i è stata rilevata in U si chiama frequenza (assoluta). La somma delle frequenze assolute riproduce la numerosità N di U La colonna di destra costituisce la distribuzione di frequenza. La distribuzione delle frequenze assolute si costruisce per conteggio e consente di organizzare i dati in tabella 3

4

5 Variabili statistiche Le modalità x i, a seconda della natura del fenomeno X e della tipologia di scala utilizzata, possono essere attributi, categorie, numeri, intervalli Le frequenze f i sono sempre numeri interi non negativi Una variabile statistica (v.s.) è un insieme di k coppie { x i, f i }, X indica sia il fenomeno di interesse (prima di essere rilevato), sia la corrispondente variabile statistica (dopo la rilevazione e la strutturazione dei dati grezzi) Il passaggio dai dati grezzi alla v.s. ha fatto ordine, nel senso di rendere i dati più organizzati e leggibili, ma ha perso l'ordine, nel senso che non abbiamo più l'informazione sull'ordine con il quale i dati sono stati rilevati 5

6 Frequenze relative e percentuali Se l'obiettivo è il confronto delle distribuzioni di frequenza di X su più popolazioni con numerosità diversa, occorre depurare le frequenze assolute dall'influenza di N costruendo le frequenze relative Le percentuali sono le frequenze relative moltiplicate per 100 6

7

8 Frequenze cumulate 8 Quando X è ordinale o cardinale è buona pratica costruire la v.s. ordinando in senso crescente le modalità osservate Le frequenze cumulate ci dicono quante sono le unità statistiche che manifestano una modalità non superiore di una certa …..ovvero minore o uguale a tale 46 studenti hanno non più di 5 partners (ovvero un num. di partners minore o uguale a 5) Il 50% degli studenti ha non più di 2 partners (il 50% degli studenti ha più di 2 partners)

9 Distribuzioni di frequenza per variabili statistiche con modalità raggruppate in classi Carattere continuo o con un numero di modalità molto elevato

10 Scala delle modalità Fenomeni quantitativi continui: classi di modalità classi di modalità

11 Scala delle modalità Fenomeni quantitativi continui: classi di modalità classi di modalità Estremo superiore Estremo inferiore Classe aperta

12 Fenomeni quantitativi continui: classi di modalità Scala o insieme delle modalità di X Estremi delle classi di modalità Classi di modalità Estremi esclusi E.inferioreE.superiore Estremi inclusi Estremo sup. incluso Estremo inferiore incluso Ampiezza della classe Estremo inferiore incluso

13 Estremo inferiore incluso

14 Ipotesi del valore centrale

15 Le densità di frequenza Quante u.s. si osservano nellintervallo per ogni unità di misura della v.s. (in questo caso lanno) nellipotesi di equi-ripartizione Indicano laddensamento delle osservazioni nelle diverse classi, al netto della diversa ampiezza

16 Le densità di frequenza Istogrammi (rappresentazione grafica delle frequenze)

17 Rappresentazioni grafiche Dalle distribuzioni di frequenza (assolute, relative, % e cumulate) si possono costruire grafici I grafici sono alternativi alle tabelle: non si tratta di una ulteriore forma di sintesi, ma solo di una diversa presentazione I grafici sono preferibili alle tabelle soprattutto se k è grande Per i fenomeni qualitativi il grafico è un semplice disegno (barre, torte...), in cui l'altezza/lunghezza delle barre o la dimensione dello spicchio della torta danno un'idea della frequenza associata a ciascuna categoria x i osservata 17

18 Esempio 18

19 Rappresentazioni grafiche di fenomeni quantitativi Per i fenomeni quantitativi, dove anche le x i, oltre alle f i, sono dei numeri, si costruiscono dei diagrammi cartesiani: sull'asse delle ascisse si mettono le x i, su quello delle ordinate le f i o le p i – Fenomeni discreti: il diagramma più efficace è quello a bastoncini : in corrispondenza di ogni modalità x i, identificata con un singolo punto sulle ascisse, si innalza un bastoncini alto quanto la corrispondente frequenza posta sulle ordinate – Fenomeni continui: se si fa l'ipotesi del valore centrale questo equivale ad una discretizzazione (vedi sopra); se si fa invece l'ipotesi della distribuzione uniforme, la frequenza viene rappresentata da un'area, con un istogramma. – L'istogramma è l'unica rappresentazione sensata quando le classi hanno un'ampiezza diversa. 19

20 Esempio 20

21 Sintesi del capitolo La prima forma di sintesi dei dati è data dalla distribuzione di frequenza assoluta che, per ogni modalità del carattere, ci dice quante u.s. presentano quella modalità: la loro somma da la numerosità totale della popolazione Per favorire il confronto si ricorre alle frequenze relative e percentuali che ci dicono quale quota di u.s. su 1 (o su 100) presentano una certa modalità: la loro somma da 1 (o 100) Un informazione ulteriore è costituita dalle frequenze cumulate che, per ogni modalità, ci dice quante u.s. presentano un valore minore o uguale a quella data modalità: hanno senso solo se il carattere è almeno ordinabile Quando il carattere è continuo o misurato con una scala che prevede un elevato numero di modalità (generalmente quantitativa), si ricorre a distribuzioni di frequenza per modalità raggruppate in classi, caratterizzate da una certa ampiezza e da un certo valore centrale La densità rappresenta laddensamento della frequenza in ogni classe e consente di svincolar e il giudizio sulla frequenza dallampiezza della classe


Scaricare ppt "Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia lanalisi statistica 1."

Presentazioni simili


Annunci Google