La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

1 Elaborazione statistica di dati. 2 CONCETTI DI BASE DI STATISTICA ELEMENTARE.

Presentazioni simili


Presentazione sul tema: "1 Elaborazione statistica di dati. 2 CONCETTI DI BASE DI STATISTICA ELEMENTARE."— Transcript della presentazione:

1 1 Elaborazione statistica di dati

2 2 CONCETTI DI BASE DI STATISTICA ELEMENTARE

3 3 Per la presenza di errori casuali, ripetendo più volte la misura di una stessa grandezza, si può ottenere una serie di valori diversi. Taratura strumenti di misura IPOTESI: grandezza da misurare identica da misura a misura

4 4 Una serie di valori di misure casualmente diverse può essere ottenuta anche misurando diversi elementi, nominalmente uguali, di una produzione industriale. Collaudo sistemi di produzione IPOTESI: accuratezza strumento di misura migliore della variabilità dei manufatti

5 5 Esempio di serie di dati: Lo spessore di 110 dadi estratti dalla produzione di una macchina

6 6 serie di valori campione Ogni serie di valori estratta dalla totalità dei valori possibili può essere considerato un campione. rappresentativo Esistono vari metodi per estrarre un campione che sia rappresentativo dell'universo. Qui si considerano 11 campioni estratti casualmente. Ciascun campione contiene 10 misure di spessore

7 7

8 8

9 9 Al sottoinsieme di “n” valori estratti dall’insieme dei valori possibili viene dato il nome di campione; l’intero insieme di dati “N” viene definito popolazione (o universo).

10 10 media m= x 1 n x i i1 n    1 n-1  i (x i 1 n   -x) 2 varianza s 2 CAMPIONE

11 11 La media gode della proprietà di rendere minima la somma dei quadrati degli scarti. Inoltre la somma algebrica degli scarti rispetto al valore medio è nulla.

12 12 La radice quadrata della varianza s, costituisce una stima della dispersione delle misure intorno al valore medio, al pari di s 2, ma ha il pregio di avere le stesse dimensioni delle misure x.

13 13 I due parametri precedenti nel caso della popolazione, o universo composto di N elementi, si indicano con i simboli: 1 N 1   x i  1 i N     1 N i N (  2 x i )

14 14 I dati possono essere raggruppati in diversi modi. Una prima forma di raggruppamento si può osservare nella tabella.

15 15

16 16 Una forma di raggruppamento molto più usata e significativa è quella delle classi di intervalli di appartenenza, che non è necessario abbiano tutti la stessa ampiezza.

17 17 Raggruppando per intervalli: Limiti delle classi Valore centrale della classe Frequenza assoluta Frequenza percentuale Densità di frequenza Frequenza cumulata percentuale > di mm < di mm x j ( mm ) f j f p = f j n 100 (%) fp  x  k=1 j f k n 100 (%) 6,1606,1706,16532,730,2732,73 6,1706,1806,17565,450,5458,18 6,1806,1906, ,911,09119,09 6,1906,2006, ,912,09140,00 6,2006,2106, ,642,36463,64 6,2106,2206, ,091,90982,73 6,2206,2306, ,001,00092,73 6,2306,2406,23565,450,54598,18 6,2406,2506,24521,820,182100,00

18 18 Il numero dei dati che appartengono a una determinata classe j si chiama frequenza della classe e viene indicato con f j.

19 19 Il raggruppamento in k classi o sottogruppi, G 1...G j...G k, avviene secondo il valore, ad esempio se a è il minimo degli x i e b il massimo: xG ij  ajxxajx i +-  <+()1  x ba k = -  se

20 20 Ad ogni classe G i è associato il numero di elementi che vi appartengono, f i. Si definisce frequenza relativa percentuale della classe il parametro: f p,i è compreso nell'intervallo [0-100]% f f n pi i,  100

21 21 Raggruppando per intervalli: Limiti delle classi Valore centrale della classe Frequenza assoluta Frequenza percentuale Densità di frequenza Frequenza cumulata percentuale > di mm < di mm x j ( mm ) f j f p = f j n 100 (%) fp  x  k=1 j f k n 100 (%) 6,1606,1706,16532,730,2732,73 6,1706,1806,17565,450,5458,18 6,1806,1906, ,911,09119,09 6,1906,2006, ,912,09140,00 6,2006,2106, ,642,36463,64 6,2106,2206, ,091,90982,73 6,2206,2306, ,001,00092,73 6,2306,2406,23565,450,54598,18 6,2406,2506,24521,820,182100,00

22 22 Rappresentazione della DENSITA’ DI PROBABILITA’

23 23 Nell’esempio precedente per ognuna delle classi G i è possibile definire la probabilità p i che una misura qualsiasi ricada nell’intervallo della classe i- esima vale: p f n i n i   lim NOTA: il limite può andare ad infinito oppure N nel caso di popolazioni con numero limitato di possibili elementi

24 24 La densità di probabilità viene espressa con l’andamento delle probabilità p i in funzione delle k classi. La rappresentazione della densità di probabilità può essere fatta o con l’istogramma delle frequenze o con il poligono delle frequenze, cioè mediante k punti discreti.

25 25 Per variabili discrete valgono le seguenti relazioni: p s,t rappresenta la probabilità cumulata delle classi da s a t ovvero del verificarsi che : ppp pxpx i i K sti is t ii i k ii i k           ; (),  xxx st 

26 valore centrale della classe Frequenza _ relativa [%] 10% = Percentuale di dati con valore compreso in questa classe

27 27 Poligono delle frequenze G1G x [mm] Frequenza relativa [%]

28 28 Un diagramma di tipo diverso si ottiene rappresentando le frequenze cumulate. In corrispondenza al limite superiore di ogni classe si riporta la frequenza relativa percentuale dei dati che hanno una misura inferiore a quel limite.

29 29 limite superiore della classe mm Frequenze cumulate percentuali k = 4 % dati che assumono valori minori di x k

30 30 frequenza relativa

31 31 LE DISTRIBUZIONI DI PROBABILITA’

32 32 Variabili continue

33 33 Nell’esempio precedente se si considera lo spessore del dado che quindi è una variabile continua. Ogni valore dell’altezza è possibile e la distribuzione di probabilità è rappresentata da una funzione continua.

34 34 LA DISTRIBUZIOINE GAUSSIANA NORMALE E TEOREMA DEL LIMITE CENTRALE

35 35 PDF (Probability Density Function) gaussiana (o normale)  f(x) 1 2 e x         Quanto più è ampio sigma tanto più è distribuita e bassa la PDF

36 36 Perché il modello gaussiano di probabilità è sovente impiegato nell’ingegneria?

37 37 Il teorema del limite centrale afferma che la distribuzione delle medie tende ad essere normale anche se la distribuzione di origine non lo è.

38 38 Inoltre, come è evidente dall’animazione la distribuzione della media gode delle seguenti due proprietà: 1.Ha la stessa media (la distribuzione non si ‘sposta’) 2.Ha una deviazione standard minore (la distribuzione si ‘stringe’) pari a:  / √n

39 39 Esempio: distribuzione della variabile somma Distribuzione di ‘a’ Distribuzione di ‘b’ aBaB aAaA bBbB bAbA probabilità di a B = a A = b B = b A = 50% probabilità di a B + b B = 25% probabilità di a B + b A = 25% probabilità di a A + b B = 25% probabilità di a A + b A = 25% probabilità valore basso = 25% probabilità valore alto = 25% probabilità valore medio = 50% Distribuzione di ‘a+b’

40 40 Il teorema limite centrale afferma che la distribuzione gaussiana permette di descrivere in maniera soddisfacente tutti quei fenomeni fisici caratterizzati dalla sovrapposizione di un elevato numero di effetti deboli indipendenti aventi loro natura statistica a media nulla.

41 41 Conseguenza di tale teorema è che nel caso in cui si abbia un fenomeno dato dalla sovrapposizione di numerosi effetti, nonostante singolarmente siano dotati di distribuzione non gaussiana, il fenomeno complessivo sarà normalmente distribuito, purché essi siano indipendenti e nessuno degli effetti sia prevalente Dal momento che i fenomeni del mondo reale sono spesso il risultato del contributo di molti eventi casuali non osservabili, questo teorema fornisce una spiegazione per la prevalenza ‘in natura’ della distribuzione di probabilità normale.

42 42 Data una distribuzione qualsiasi di risultati di un processo di misurazione che abbia media  e scarto quadratico  Anche ipotizzando PDF non gaussiana, se si estraggono non singole misure ma campioni sufficientemente numerosi, n > 5 - 6, la distribuzione delle medie delle misure segue quasi fedelmente la legge di distribuzione normale (di Gauss) … QUINDI SI CONOSCE LA VARIABILITA’ ED E’ POSSIBILE QUANTIFICARE GLI INTERVALLI DI CONFIDENZA !!!

43 43 Inoltre la media di tali medie è ancora m e lo scarto quadratico si riduce a: E QUINDI MIGLIORA L’ACCURATEZZA !!! … per questo motivo è sempre opportuno ripetere più volte una misura e prendere come migliore stima il valore medio !!!

44 44 DISTRIBUZIONE CUMULATA E DISTRIBUZIONE NORMALE STANDARD

45 45 Distribuzione normale standard  f (z) 5 0 z= x- f(z) 1 2 e z 2 2      Il valor medio è nullo e la varianza è pari ad 1

46 F (z) Frequenze cumulate Grafico delle Frequenze cumulate F(z) = p(z i  z) Il valor medio è in corrispondenza del 50% di probabilità cumulata

47 47 z1z F(z) = p(z i  z) p(z i  [z 1,z 2 ]) = p(z i < z 2 ) - p(z i < z 1 ) z2z2 F(z 1 ) F(z 2 ) p(z i  [z 1,z 2 ]) = F(z 2 ) - F(z 1 ) Utilità della funzione cumulata:

48 48 p(z i  [z 1,z 2 ]) = p(z i < z 2 ) - p(z i < z 1 ) Nota sulla relazione di prima: Si può dire in due modi diversi lo stesso concetto: - la probabilità che il valore appartenga all’intervallo è pari alla probabilità che sia inferiore all’estremo superiore e superiore all’estremo inferiore - la probabilità che il valore appartenga all’intervallo è pari alla probabilità che sia inferiore all’estremo superiore ma non inferiore all’estremo inferiore

49 49 Usando la variabile non normalizzata px px px (). (). ().       z z p(z i z) p(z i  [z 1,z 2 ]) = F(z 2 ) - F(z 1 ) p(x i  [ ,  ]) = F(  ) - F(  ) = F(z=1) - F(z=-1)

50 50 5 z z p(z i z) La distribuzione normale è simmetrica: Oppure, ad esempio:

51 51 Esempio: - supponiamo di voler misurare la temperatura - al fine di associare l’intervallo di confidenza alla misura ottenuta si opera come segue: -1: si effettuano un numero N, limitato, di ripetizioni (circa 20 ad esempio) -2: si calcola da tale campione statistico media Tm e deviazione standard Sm -3: il risultato sarà pari a Tm ± 2  Sm/√N (95% lc) NOTA: tale risultato vale anche se il fenomeno aleatorio associato alla misura non è gaussiano


Scaricare ppt "1 Elaborazione statistica di dati. 2 CONCETTI DI BASE DI STATISTICA ELEMENTARE."

Presentazioni simili


Annunci Google