STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA

Slides:



Advertisements
Presentazioni simili
LA MEDIA STATISTICA di Zappa Giacomo.
Advertisements

- le Medie la Moda la Mediana
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
____________________
LA VARIABILITA’ IV lezione di Statistica Medica.
Distribuzione Normale o Curva di Gauss
Intervalli di confidenza
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Statistica I valori medi.
Il chi quadro indica la misura in cui le
“Teoria e metodi della ricerca sociale e organizzativa”
Variabili casuali a più dimensioni
Lez. 3 - Gli Indici di VARIABILITA’
Gli errori nell’analisi statistica
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Popolazione, campione, parametri e stimatori
Esercizio 1 In una indagine statistica si vuole rilevare il numero di cellulari posseduti dagli studenti iscritti alla facoltà di economia. Si dica: -
Inferenza statistica per un singolo campione
Introduzione alla statistica per la ricerca Lezione I
Appunti di inferenza per farmacisti
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Statistica sociale Modulo A
Nicola Paparella, Università degli Studi, Lecce, aprile 2006 Pedagogia sperimentale Note ed appunti Corso di base / 5
Statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Di Capuano,Colucci e Panunzi Valori medi I valori medi.
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
MEDIE STATISTICHE.
Le distribuzioni campionarie
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
INDICE I VALORI MEDI LA MEDIA GEOMETRICA LA MEDIA ARITMETICA
La Variabilità e La Concentrazione
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Sintesi della lezione Il concetto di variabilità Campo di variazione Differenza interquartile La varianza La deviazione standard Scostamenti medi VARIABILITA’
Lez. 3 - Gli Indici di VARIABILITA’
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Statistica La statistica è
Corso di Analisi Statistica per le Imprese Cross tabulation e relazioni tra variabili Prof. L. Neri a.a
Gli indici di dispersione
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Accenni di analisi monovariata e bivariata
Strumenti statistici in Excell
Corso di Analisi Statistica per le Imprese Indici di variabilita’ ed eterogeneita’ Prof. L. Neri a.a
3 June Biostatistica Biostatitistica= Statistica per scienze Biostatitistica= Statistica per scienze biologiche e sanitarie. biologiche e sanitarie.
Test basati su due campioni Test Chi - quadro
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
Accenni di analisi monovariata e bivariata
ANALISI E INTERPRETAZIONE DATI
STATISTICHE DESCRITTIVE
Scelta del metodo analitico:
analisi bidimensionale #2
DIPENDENZA STATISTICA TRA DUE CARATTERI Per una stessa collettività può essere interessante studiare più caratteri presenti contemporaneamente in ogni.
In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Analisi delle osservazioni
Gli Indici di VARIABILITA’
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Università degli Studi di Pisa Facoltà di Scienze matematiche fisiche e naturali Anno Accademico 2011-12 Biostatistica (SECS-S/02 ) STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Incontro 2 13 Ottobre 2011

Medie di potenze di ordine k A volte può essere interessante calcolare la media di variabili trasformate del tipo x2 , x3 , x1/2 o in generale xk,definite come : Per frequenze ni=1 la media di potenza di ordine k si definisce come: Il ricorso ad una particolare potenza delle variabili dipende in generale dalla funzione di invarianza individuate dalle somme oppure

Media quadratica (momento di ordine 2) Esempio: Due piastre quadrate hanno lato x1=3 e x2=5 .Si desidera sostituirle con 2 piastre uguali che mantengono invariata la superficie totale (32+52=34 ).Il lato delle nuove piastre è

Media Geometrica (k→0) È usata in campi come la microbiologia o sierologia ,quando le osservazioni sono espresse in titoli ,i cui valori sono multipli dello stesso fattore di diluizione . Per n osservazioni la media geometrica è la radice n-esima del prodotto delle osservazioni :

Media Geometrica(Esempio) Il numero di mosche presenti in una popolazione di laboratorio è costituita originariamente da 100 elementi,viene rilevato in 3 periodi successivi. Al primo conteggio le mosche sono 112 ,al secondo 196 ,al terzo 369. Qual è il tasso di incremento medio della popolazione ? Gli incrementi osservati nei tre periodi sono: Il tasso di incremento medio della popolazione è del 54%

Media Armonica (k=-1) Adatto per valori espressi come rapporti X=Y/Z La prima formula vale se Y è costante ,la seconda ha valenza generale

Esempio(Media Armonica) Una certa proteina viene studiata mediante elettroforesi;si vuol conoscere la velocità di migrazione media . La proteina viene fatta correre sul gel in un campo elettrico per 20mm e viene misurato il tempo necessario a percorrere questa distanza in 5 prove diverse. Prova Tempo (s) Velocità (mm/s) 1 2 3 4 5 40 60 30 50 70 250 20/40=0.05 20/60=0.33 20/30=0.66 20/50=0.40 20/70=0.29 2.186

Esempio(Media Armonica ) (2) La media aritmetica della velocità è 2.186/5=0.4372 è diversa dalla velocità media ; il totale del cammino percorso nelle 5 prove è (20*5)mm=100mm,mentre questa risulterebbe pari a 109.3mm=0.4372*250. Invece usando la media armonica la distanza risulta invariata!

Indici di dispersione Limite degli indici di tendenza centrale:l’informazione fornita dalla misura di tendenza centrale(moda,media,mediana) può risultare più o meno affidabile a seconda della dispersione dei dati e della forma della distribuzione :è molto buona se le osservazioni sono poco disperse e simmetriche generica se la variabilità è ampia . Il ‘Campo di variazione’ (range) offre una prima informazione sulla dispersione campionaria :è la differenza tra i valori estremi delle osservazioni. Indicando con x(1) il più piccolo e con x(n) il più grande di n valori osservati il range risulta : È poco affidabile perché dipende fortemente dal numero di osservazioni e dai valori estremi

Tabella riassuntiva indici di tendenza centrale

Esempio: Misura del quoziente d’intelligenza in due diversi campioni In entrambe i casi la media è 100 ,ma mentre nella figura 1 il valor medio è molto rappresentativo della distribuzione ,nel secondo caso,dove i dati sono maggiormente dispersi il valor medio non rispecchia del tutto la distribuzione dei dati. Esempio: Misura del quoziente d’intelligenza in due diversi campioni

Indici di dispersione

Indici di dispersione(Sum of Squares e Varianza ) Per operare confronti tra collettivi formati da un diverso numero di individui si utilizza la varianza :

Indici di dispersione

Standard Error (Errore quadratici Medio) e Coefficiente di Variazione(CV)

Esempio(Indici di dispersione)

Esempio2 (Concentrazione media di un fitofarmaco)

Esempio2 (Concentrazione media di un fitofarmaco)(2)

Trasformazioni lineari Sia nota la media μx e la varianza σ2x di una variabile X . Y=a+bX con a e b costanti arbitrarie . Definiamo il valore atteso E(X)= μx e V(X)= σ2x . Il valor atteso (media ) è un operatore lineare La varianza è un operatore quadratico

Tabella a doppia entrata(Esempio1) Indipendentemente dal tipo di variabili in studio, quando si ha a che fare con un numero notevole di individui è possibile costruire delle tabelle di contingenza: si tratta di tabelle a due entrate nelle quali ogni numero rappresenta la frequenza congiunta (in genere assoluta) per una particolare coppia di valori delle due variabili. Ad esempio consideriamo le variabili di fantasia X=Varietà (con i valori SANREMO e FANO) e Y=Forma delle bacche (con i valori LUNGO, TONDO, OVALE), nella tabella a seguire il valore 37 indica il numero di individui che presentano congiuntamente la modalità SANREMO e la modalità LUNGO .I totali mostrano le frequenze marginali delle due variabili separatamente. Ogni riga della tabella di cui sopra (esclusi i totali) costituisce una distribuzione condizionata della variabile Y, dato un certo valore della X (Y|SANREMO e Y|FANO). Viceversa ogni colonna (X|LUNGO, X|TONDO e X|OVALE). Lungo Tondo Ovale Totale Sanremo 37 32 61 130 Fano 45 74 69 178 82 106 120 308

In simboli:Tavola di contingenza generica Y1 … Yj Yk Totale X1 n11 n1j n1k n1. Xi ni1 nij ni. Xh nh1 nhj nhk nh. n.1 n.j n.k n

Tavole di contingenza :Dipendenza Se guardiamo le due distribuzioni condizionate Y|SANREMO e Y|FANO possiamo notare che esiste una certa differenza. Potremmo chiederci quindi se il presentarsi di una data modalità del carattere X (SANREMO o FANO) influenza il presentarsi di una particolare modalità del fenomeno Y. Se ciò non è vero si parla di indipendenza delle variabili (allora le distribuzioni condizionate sono uguali) altrimenti si parla di dipendenza o connessione. In caso di indipendenza, le distribuzioni condizionate di Y dovrebbero essere uguali tra loro e alla distribuzione marginale di X. In simboli:

Indice χ2 A questo punto è logico costruire un indice statistico di connessione, detto χ2 che misuri lo scostamento tra le frequenze osservate e quelle attese nell'ipotesi di indipendenza perfetta: dove nij è frequenza osservata ed nij* frequenza attesa nel caso indipendenza perfetta. Questo indice assume valore pari a zero nel caso di indipendenza completa (le frequenze osservate sono uguali a quelle attese) ed assume un valore positivo tanto più alto quanto maggiore è la connessione tra i due caratteri.

Calcolo e proprietà dell’indice V di Cramer Nel caso in esame : Per valutare il significato del valore ottenuto, nel campo della statistica descrittiva si suole dividere l'indice per il suo valore massimo, che è proporzionale al numero di righe e di colonne della tabella: 0≤V ≤1 V=0 se i caratteri sono indipendenti V=1 se viè dipendenza o interdipendenza perfetta

Esempio:Presenza assenza di virosi in un campione di piante di frumento di varietà differenti No C 4 3 N S 2 1 V