La distribuzione normale
Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di casi infinitamente grande Misurazioni di una stessa grandezza variano tra loro ma le differenze tra misure e indice di riferimento (x) più sono elevate e meno sono frequenti Se distribuiamo per classi le misurazioni di una stessa grandezza l’istogramma che ne deriva è rappresentato da curve continue esprimibili attraverso equazioni matematiche La distribuzione normale è una di queste curve
La distribuzione normale Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di casi infinitamente grande Misurazioni di una stessa grandezza variano tra loro ma le differenze tra misure e indice di riferimento (x) più sono elevate e meno sono frequenti Se distribuiamo per classi le misurazioni di una stessa grandezza l’istogramma che ne deriva è rappresentato da curve continue esprimibili attraverso equazioni matematiche La distribuzione normale è una di queste curve
La forma della curva normale L’area di ogni rettangolo rappresenta la proporzione di casi che cade nella classe L’area compresa sotto la curva continua all’interno di ogni classe data può essere uguagliata all’area del rettangolo corrispondente Con l’aumentare del numero dei rettangoli la somma delle aree dei rettangoli stessi si avvicina sempre di più all’area sottesa alla curva continua completa Considerato che la somma delle aree dei rettangoli corrisponde a una unità questo sarà vero anche per l’area sottesa alla curva continua costruita
Caratteristiche della curva normale L’ascissa del punto di massimo è pari alla media (μ) e coincide con mediana e moda L’ordinata del punto di massimo varia al variare di DS (σ) È asintotica all’asse x( quanto più ci si allontana dalla media tanto più la curva si avvicina all’asse x È simmetrica rispetto alla retta parallela all’asse y e passante per l’ascissa del punto massimo L’area racchiusa dalla curva è =1 L’area racchiusa dalla curva, dall’asse x e dalle due ordinate in corrispondenza di due punti x 1 e x 2 dà la percentuale di casi compresi nell’intervallo (x 1, x 2 ), posta l’area sottesa alla curva pari a 100
Le aree sottese alla curva normale Spesso è necessario determinare la proporzione di casi che ricadono entro un dato intervallo Proprietà della curva normale l’area sottesa alla porzione di curva che vi è tra le media e una ordinata posta a una distanza data, determinata in termini di unità di deviazione standard, è costante
Importanza della deviazione standard Se le osservazioni seguono una distribuzione normale l’intervallo compreso tra (x 1 DS) include circa il 68% delle osservazioni (x 2 DS) include circa il 95% delle osservazioni (x 3 DS) include circa il 99% delle osservazioni σ è uno dei due parametri ( con x /μ) che caratterizza la distribuzione normale (Gaussiana)
Si consideri ad esempio che la statura media di una popolazione di sesso maschile e di età adulta sia di 170 cm. con deviazione standard di 10 cm. La legge di Gauss mi dice che il 95% circa di questa popolazione avrà una statura compresa entro i limiti , cioè 150 e 190 cm. Ne deriva che nel 5% della stessa popolazione la statura sarà inferiore o superiore a tali limiti Essendo la curva simmetrica si avrà il 2,5% della popolazione avrà una statura inferiore a 150 cm. e il 2,5% avrà una statura superiore a 190 cm.
Curve normali La posizione nel piano della curva normale e la sua forma dipendono dalla media (μ) e dalla DS ( σ) Ognuno di questi parametri può assumere infiniti valori, esistono nel piano infinite curve normali Al variare della media (parametro di posizione)la curva trasla (si sposta nel piano parallelamente a se stessa lungo l’asse x, conservando la stessa forma) Al variare di σ (parametro di dispersione) la curva cambia forma: si appiattisce se σ cresce e si restringe quando σ decresce
Standardizzazione della curva normale Non è necessario che le distanze dalla media siano sempre multipli esatti della deviazione standard E’ sempre possibile determinare l’area sottesa alla porzione di curva delimitata da due ordinate È possibile trasformare ogni curva normale in modo da permettere di calcolare il numero di casi sottostante ogni porzione della curva mediante l’uso di una tabella
Distribuzione gaussiana standardizzata Per agevolare il ricercatore la variabile x viene trasformata in una nuova variabile Z Mentre la distribuzione di X è normale con media X e D.S., quella della nuova variabile è normale con media 0 e D.S. 1 La distribuzione standardizzata presenta il vantaggio di consentire la predisposizione di tabelle che permettono di calcolare porzioni di area della distribuzione e di stabilire la probabilità statistica di riscontrate valori in relazione a determinati valori Z
Curva standardizzata quale proporzione di casi ricade nell’intervallo 50 e 65? Una distribuzione normale, media 0 e D.S 1 viene indicata come curva standardizzata e Z è il valore standardizzato Una Z di valore 1,5 indica che la distanza tra l’ordinata è a 1,5 D.S. dalla media Esistono tabelle che riportano per tutti le ordinate della curva standardizzata qual è la proporzione di area sottesa
Utilizzo della tavola normale I valori di z sono riportati nella prima colonna a sinistra e nella riga posta in alto Le prime due cifre di z si leggono sulla colonna, l’ultima sulla prima riga. I vari numeri riportati nella tabella individuano la proporzione dell’area che è sottesa alla curva delimitate da un lato dalla media e dall’altro dall’ordinata z Esempio precedente uno z di valore 1,5 indica che l’ordinata è a 1,5 D.S. dalla media l’area delimitata dai punti (z=1,5) è 0,4332
Aree sottese alla curva normale Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0, , , , , , , , ,
Utilizzo della tavola normale Data una distribuzione con X=168 e D.S.=12 Trovare la proporzione di casi inferiori o uguali (≤ )a
Utilizzo della tavola normale Nella tabella normale si legge che l’area compresa tra la media e uno z = 2,08 è di 0,4812 Considerata la simmetria della curva l’area a destra della media deve essere = 0,5 L’area tratteggiata si ottiene sottraendo il valore trovato sulla tabella dal totale dell’area alla sinistra della media (percentuale di casi ≤ 143)= 0,5000 – 0,4812 = 0,0188 Meno del 2% dei casi hanno un valore minore o uguale a 143