La distribuzione normale
La distribuzione normale Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di casi infinitamente grande Misurazioni di una stessa grandezza variano tra loro ma le differenze tra misure e indice di riferimento (x) più sono elevate e meno sono frequenti Se distribuiamo per classi le misurazioni di una stessa grandezza l’istogramma che ne deriva è rappresentato da curve continue esprimibili attraverso equazioni matematiche La distribuzione normale è una di queste curve
La forma della curva normale L’area di ogni rettangolo rappresenta la proporzione di casi che cade nella classe L’area compresa sotto la curva continua all’interno di ogni classe data può essere uguagliata all’area del rettangolo corrispondente Con l’aumentare del numero dei rettangoli la somma delle aree dei rettangoli stessi si avvicina sempre di più all’area sottesa alla curva continua completa Considerato che la somma delle aree dei rettangoli corrisponde a una unità questo sarà vero anche per l’area sottesa alla curva continua costruita
Caratteristiche della curva normale L’ascissa del punto di massimo è pari alla media (μ) e coincide con mediana e moda L’ordinata del punto di massimo varia al variare di DS (σ) È asintotica all’asse x( quanto più ci si allontana dalla media tanto più la curva si avvicina all’asse x È simmetrica rispetto alla retta parallela all’asse y e passante per l’ascissa del punto massimo L’area racchiusa dalla curva è =1 L’area racchiusa dalla curva, dall’asse x e dalle due ordinate in corrispondenza di due punti x1 e x2 dà la percentuale di casi compresi nell’intervallo (x1, x2), posta l’area sottesa alla curva pari a 100
Le aree sottese alla curva normale Spesso è necessario determinare la proporzione di casi che ricadono entro un dato intervallo Proprietà della curva normale l’area sottesa alla porzione di curva che vi è tra le media e una ordinata posta a una distanza data, determinata in termini di unità di deviazione standard, è costante
Importanza della deviazione standard Se le osservazioni seguono una distribuzione normale l’intervallo compreso tra (x 1 DS) include circa il 68% delle osservazioni (x 2 DS) include circa il 95% delle osservazioni (x 3 DS) include circa il 99% delle osservazioni σ è uno dei due parametri ( con x /μ) che caratterizza la distribuzione normale (Gaussiana)
Si consideri ad esempio che la statura media di una popolazione di sesso maschile e di età adulta sia di 170 cm. con deviazione standard di 10 cm. La legge di Gauss mi dice che il 95% circa di questa popolazione avrà una statura compresa entro i limiti 170 20, cioè 150 e 190 cm. Ne deriva che nel 5% della stessa popolazione la statura sarà inferiore o superiore a tali limiti Essendo la curva simmetrica si avrà il 2,5% della popolazione avrà una statura inferiore a 150 cm. e il 2,5% avrà una statura superiore a 190 cm.
Curve normali La posizione nel piano della curva normale e la sua forma dipendono dalla media (μ) e dalla DS( σ) Ognuno di questi parametri può assumere infiniti valori, esistono nel piano infinite curve normali Al variare della media (parametro di posizione)la curva trasla (si sposta nel piano parallelamente a se stessa lungo l’asse x, conservando la stessa forma) Al variare di σ (parametro di dispersione) la curva cambia forma: si appiattisce se σ cresce e si restringe quando σ decresce
Standardizzazione della curva normale Non è necessario che le distanze dalla media siano sempre multipli esatti della deviazione standard E’ sempre possibile determinare l’area sottesa alla porzione di curva delimitata da due ordinate È possibile trasformare ogni curva normale in modo da permettere di calcolare il numero di casi sottostante ogni porzione della curva mediante l’uso di una tabella
Distribuzione gaussiana standardizzata Per agevolare il ricercatore la variabile x viene trasformata in una nuova variabile Z Mentre la distribuzione di X è normale con media X e s.q.m. s, quella della nuova variabile è normale con media 0 e s.q.m. 1 La distribuzione standardizzata presenta il vantaggio di consentire la predisposizione di tabelle che permettono di calcolare porzioni di area della distribuzione e di stabilire la probabilità statistica di riscontrate valori in relazione a determinati valori Z
Curva standardizzata quale proporzione di casi ricade nell’intervallo 50 e 65? Una distribuzione normale, media 0 e s. q. m. 1 viene indicata come curva standardizzata e Z è il valore standardizzato Una Z di valore 1,5 indica che la distanza tra l’ordinata è a 1,5 s.q.m. dalla media Esistono tabelle che riportano per tutti le ordinate della curva standardizzata qual è la proporzione di area sottesa
Utilizzo della tavola normale I valori di z sono riportati nella prima colonna a sinistra e nella riga posta in alto Le prime due cifre di z si leggono sulla colonna, l’ultima sulla prima riga. I vari numeri riportati nella tabella individuano la proporzione dell’area che è sottesa alla curva delimitate da un lato dalla media e dall’altro dall’ordinata z Esempio precedente uno z di valore 1,5 indica che l’ordinata è a 1,5 s.q.m. dalla media l’area delimitata dai punti (z=1,5) è 0,4332
Aree sottese alla curva normale Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0000 0040 0080 0120 0159 0199 0239 0279 0319 0359 0,1 0398 0438 0478 0517 0557 0596 0636 0675 0714 0753 0,2 0793 0832 0871 0910 0948 0987 1026 1064 1103 1141 ...................... ................ 1,0 3413 3438 3461 3485 3508 3531 3554 3577 3599 3621 1,1 3643 3665 3686 3718 3729 3749 3770 3790 3810 3830 .......................... ................... 1,5 4332 4345 4357 4370 4382 4394 4406 4418 4430 4441 ..................... 1,9 4713 4719 4726 4732 4738 4744 4750 4756 4761 4767......... 2,0 4773 4778 4783 4788 4793 4798 4803 4808 4812 4817 .......... 2,5 4938 4940 4941 4943 4945 4946 4948 4949 4951 4952 ............... ........
Utilizzo della tavola normale Data una distribuzione con X=168 e S=12 Trovare la proporzione di casi inferiori o uguali (≤ )a 143 143 168
Utilizzo della tavola normale Nella tabella normale si legge che l’area compresa tra la media e uno z = 2,08 è di 0,4812 Considerata la simmetria della curva l’area a destra della media deve essere = 0,5 L’area tratteggiata si ottiene sottraendo il valore trovato sulla tabella dal totale dell’area alla sinistra della media (percentuale di casi ≤ 143)= 0,5000 – 0,4812 = 0,0188 Meno del 2% dei casi hanno un valore minore o uguale a 143 Per calcolare l’area complessiva esterna rispetto ai punti 168 25 si raddoppia il risultato (si considera anche l’ area tratteggiata simmetrica)