La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Biostatistica (SECS-S/02 ) STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Incontro 2 13 Ottobre 2011 Università degli Studi di Pisa Facoltà di Scienze.

Presentazioni simili


Presentazione sul tema: "Biostatistica (SECS-S/02 ) STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Incontro 2 13 Ottobre 2011 Università degli Studi di Pisa Facoltà di Scienze."— Transcript della presentazione:

1 Biostatistica (SECS-S/02 ) STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Incontro 2 13 Ottobre 2011 Università degli Studi di Pisa Facoltà di Scienze matematiche fisiche e naturali Anno Accademico

2 Medie di potenze di ordine k A volte può essere interessante calcolare la media di variabili trasformate del tipo x 2, x 3, x 1/2 o in generale x k,definite come : Per frequenze n i =1 la media di potenza di ordine k si definisce come: Il ricorso ad una particolare potenza delle variabili dipende in generale dalla funzione di invarianza individuate dalle somme oppure

3 Media quadratica (momento di ordine 2) Esempio: Due piastre quadrate hanno lato x 1 =3 e x 2 =5.Si desidera sostituirle con 2 piastre uguali che mantengono invariata la superficie totale ( =34 ).Il lato delle nuove piastre è

4 Media Geometrica (k →0) È usata in campi come la microbiologia o sierologia,quando le osservazioni sono espresse in titoli,i cui valori sono multipli dello stesso fattore di diluizione. Per n osservazioni la media geometrica è la radice n-esima del prodotto delle osservazioni :

5 Media Geometrica(Esempio) Il numero di mosche presenti in una popolazione di laboratorio è costituita originariamente da 100 elementi,viene rilevato in 3 periodi successivi. Al primo conteggio le mosche sono 112,al secondo 196,al terzo 369. Qual è il tasso di incremento medio della popolazione ? Gli incrementi osservati nei tre periodi sono: Il tasso di incremento medio della popolazione è del 54%

6 Media Armonica (k=-1) Adatto per valori espressi come rapporti X=Y/Z La prima formula vale se Y è costante,la seconda ha valenza generale

7 Esempio(Media Armonica) Una certa proteina viene studiata mediante elettroforesi;si vuol conoscere la velocità di migrazione media. La proteina viene fatta correre sul gel in un campo elettrico per 20mm e viene misurato il tempo necessario a percorrere questa distanza in 5 prove diverse. ProvaTempo (s) Velocità (mm/s) /40= /60= /30= /50= /70=

8 Esempio(Media Armonica ) (2) La media aritmetica della velocità è 2.186/5= è diversa dalla velocità media ; il totale del cammino percorso nelle 5 prove è (20*5)mm=100mm,mentre questa risulterebbe pari a 109.3mm=0.4372*250. Invece usando la media armonica la distanza risulta invariata!

9 Indici di dispersione Limite degli indici di tendenza centrale:l’informazione fornita dalla misura di tendenza centrale(moda,media,mediana) può risultare più o meno affidabile a seconda della dispersione dei dati e della forma della distribuzione :è molto buona se le osservazioni sono poco disperse e simmetriche generica se la variabilità è ampia. Il ‘Campo di variazione’ (range) offre una prima informazione sulla dispersione campionaria :è la differenza tra i valori estremi delle osservazioni. Indicando con x (1) il più piccolo e con x (n) il più grande di n valori osservati il range risulta : È poco affidabile perché dipende fortemente dal numero di osservazioni e dai valori estremi

10 Tabella riassuntiva indici di tendenza centrale

11 Esempio: Misura del quoziente d’intelligenza in due diversi campioni In entrambe i casi la media è 100,ma mentre nella figura 1 il valor medio è molto rappresentativo della distribuzione,nel secondo caso,dove i dati sono maggiormente dispersi il valor medio non rispecchia del tutto la distribuzione dei dati.

12 Indici di dispersione

13 Indici di dispersione(Sum of Squares e Varianza ) Per operare confronti tra collettivi formati da un diverso numero di individui si utilizza la varianza :

14 Indici di dispersione

15 Standard Error (Errore quadratici Medio) e Coefficiente di Variazione(CV)

16 Esempio(Indici di dispersione)

17 Esempio2 (Concentrazione media di un fitofarmaco)

18 Esempio2 (Concentrazione media di un fitofarmaco)(2)

19 Trasformazioni lineari Sia nota la media μ x e la varianza σ 2 x di una variabile X. Y=a+bX con a e b costanti arbitrarie. Definiamo il valore atteso E(X)= μ x e V(X)= σ 2 x. Il valor atteso (media ) è un operatore lineare La varianza è un operatore quadratico

20 Tabella a doppia entrata(Esempio1) Indipendentemente dal tipo di variabili in studio, quando si ha a che fare con un numero notevole di individui è possibile costruire delle tabelle di contingenza: si tratta di tabelle a due entrate nelle quali ogni numero rappresenta la frequenza congiunta (in genere assoluta) per una particolare coppia di valori delle due variabili. Ad esempio consideriamo le variabili di fantasia X=Varietà (con i valori SANREMO e FANO) e Y=Forma delle bacche (con i valori LUNGO, TONDO, OVALE), nella tabella a seguire il valore 37 indica il numero di individui che presentano congiuntamente la modalità SANREMO e la modalità LUNGO.I totali mostrano le frequenze marginali delle due variabili separatamente. Ogni riga della tabella di cui sopra (esclusi i totali) costituisce una distribuzione condizionata della variabile Y, dato un certo valore della X (Y|SANREMO e Y|FANO). Viceversa ogni colonna (X|LUNGO, X|TONDO e X|OVALE). LungoTondoOvaleTotale Sanremo Fano Totale

21 In simboli:Tavola di contingenza generica Y1Y1 …YjYj …YkYk Totale X1X1 n 11 …n 1j n 1k n 1. ………………… XiXi n i1 …n ij ……n i. ………………… XhXh n h1 …n hj …n hk n h. Totalen.1 n.j n.k n

22 Tavole di contingenza :Dipendenza Se guardiamo le due distribuzioni condizionate Y|SANREMO e Y|FANO possiamo notare che esiste una certa differenza. Potremmo chiederci quindi se il presentarsi di una data modalità del carattere X (SANREMO o FANO) influenza il presentarsi di una particolare modalità del fenomeno Y. Se ciò non è vero si parla di indipendenza delle variabili (allora le distribuzioni condizionate sono uguali) altrimenti si parla di dipendenza o connessione. In caso di indipendenza, le distribuzioni condizionate di Y dovrebbero essere uguali tra loro e alla distribuzione marginale di X. In simboli:

23 Indice χ 2 A questo punto è logico costruire un indice statistico di connessione, detto χ 2 che misuri lo scostamento tra le frequenze osservate e quelle attese nell'ipotesi di indipendenza perfetta : dove n ij è frequenza osservata ed n ij * frequenza attesa nel caso indipendenza perfetta. Questo indice assume valore pari a zero nel caso di indipendenza completa (le frequenze osservate sono uguali a quelle attese) ed assume un valore positivo tanto più alto quanto maggiore è la connessione tra i due caratteri.

24 Calcolo e proprietà dell’indice V di Cramer Nel caso in esame : Per valutare il significato del valore ottenuto, nel campo della statistica descrittiva si suole dividere l'indice per il suo valore massimo, che è proporzionale al numero di righe e di colonne della tabella: 0≤ V ≤1 V=0 se i caratteri sono indipendenti V=1 se viè dipendenza o interdipendenza perfetta

25 Esempio:Presenza assenza di virosi in un campione di piante di frumento di varietà differenti SiNo C43 N33 S21 V22


Scaricare ppt "Biostatistica (SECS-S/02 ) STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Incontro 2 13 Ottobre 2011 Università degli Studi di Pisa Facoltà di Scienze."

Presentazioni simili


Annunci Google