Principali analisi statistiche

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
L’Analisi della Varianza ANOVA (ANalysis Of VAriance)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
2. Introduzione alla probabilità
STATISTICA DESCRITTIVA
STATISTICA DESCRITTIVA
Intervalli di confidenza
Proprietà degli stimatori
Fondamenti della Misurazione
Analisi dei dati per i disegni ad un fattore
Campione e campionamento
Teorema del limite centrale …dimostra che la distribuzione campionaria delle medie si approssima alla distribuzione normale qualunque sia la forma delle.
CAMPIONE E CAMPIONAMENTO
Elementi di STATISTICA DESCRITTIVA
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Test Statistici Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia l’analisi statistica.
Inferenza statistica per un singolo campione
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
CAMPIONAMENTO Estratto dal Cap. 5 di:
Esercitazione su test d’ipotesi
DIFFERENZA TRA LE MEDIE
Analisi della varianza (a una via)
1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.
Matematica e statistica Versione didascalica: parte 8 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste
Appunti di inferenza per farmacisti
Alcune domande agli autori Lo studio affronta un argomento scientifico e/o clinico importante? Lo studio è originale? Lo studio è volto a provare le ipotesi.
Corso di biomatematica lezione 9: test di Student
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 6: la funzione c2
Corso di biomatematica lezione 7: Test di significatività
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a LA STATISTICA INFERENZIALE
STATISTICA a.a VARIABILITA’ BIOLOGICA E CASO
Le carriere universitarie degli studenti in matematica
di cosa si occupa la statistica inferenziale?
Complementi al Corso di Ecologia - Approfondimenti di statistica
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Confronto fra 2 popolazioni
Il test di ipotesi Cuore della statistica inferenziale!
Verifica delle ipotesi su due campioni di osservazioni
Principali analisi statistiche
Le distribuzioni campionarie
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
STATISTICA PER LE DECISIONI DI MARKETING
Pippo.
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
LABORATORIO DI ANALISI AVANZATA DEI DATI Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LINEARE MULTIPLA Esempio (d)istruttivo.
Analisi Bivariata: Test Statistici
La verifica d’ipotesi Docente Dott. Nappo Daniela
Psicologia come scienza:
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
La statistica F Permette di confrontare due varianze, per stabilire se sono o no uguali. Simile al valore t di Student o al chi quadrato, l’F di Fisher.
Corso di Laurea in Scienze e tecniche psicologiche
Disegni ad un fattore tra i soggetti. Disegni ad un solo fattore between Quando i livelli del trattamento possono influenzarsi reciprocamente è necessario.
1 Statistica Scienza dell’incertezza PROBABILITÀ ALLA BASE DELL’INFERENZA Ipotesi VERA o FALSA? Campionamento Analisi statistica Scelta di una delle due.
La covarianza.
Corso di Statistica Applicata C. L. in Tecnologie forestali e ambientali 4 crediti (32 ore) Docente: Lorenzo Marini DAFNAE, Università di Padova
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Introduzione all’inferenza
Transcript della presentazione:

Principali analisi statistiche 1. Confronto fra medie (2 o piú campioni) Voto Variabile continua in funzione di una categorica (es. voto più alto M vs. F) M F 2. Correlazione e regressione Relazione fra due variabile continue (es. il voto medio dipende dal consumo di birre?) Voto Birre 3. Analisi di tabelle di contigenza Birre SÌ NO Conteggi con due o più variabili categoriche (es. essere astemi dipende dal genere?) M F

Logica del processo inferenziale: i 5 passi 1. Costruire un’ipotesi (questione oggetto della ricerca) E.g. Problema: gli studenti maschi hanno dei voti più alti delle femmine? 2. Scegliere l’analisi statistica E.g. Analisi per testare differenze fra medie 3. Pianificare ed eseguire il campionamento E.g. Selezionare un campione di M e F e raccogliere i dati 4. Eseguire il test 5. Rifiutare o accettare l’ipotesi di partenza E.g. Maschi e femmine non sono diversi Errore comune Eseguire il campionamento prima di aver costruito l’ipotesi e aver scelto l’analisi

Se entrambre le condizioni sono soddisfatte Analisi statistica: assunzioni e campionamento Analisi statistica Campionamento Ogni analisi richiede un campionamento adeguato Assunzioni Ogni analisi richiede che i dati seguano rispettino alcune condizioni Se entrambre le condizioni sono soddisfatte Possiamo procedere con il test di ipotesi

Concetti generali: campionamento Il campionamento consiste nelle tecniche di estrazione di un sottoinsieme di unità statistiche dalla popolazione L’insieme di tutti gli studenti dell’Università di Padova Infiniti campioni possibili di diversa dimensione N= dimensione della popolazione n= numerosità del campione

Campionamento: randomizzazione Molte analisi richiedono che i dati siano fra loro indipendenti e che siano estratti a random dalla popolazione L’insieme di tutti gli studenti dell’Università di Padova Tutti gli studenti devono avere la stessa probabilità di essere estratti dalla popolazione

Campionamento: replicazione Per applicare ogni analisi devo avere un sufficiente numero di osservazioni (repliche) La dimensione del campione n corrisponde al numero di repliche Numero di repliche (n) Gradi di libertà P Varia la potenza del test!!!

Campionamento: replicazione Popolazione 4 repliche 4 repliche Le repliche devono essere fra loro indipendenti (campionare a random spesso non è sufficiente!) 3 principali problemi in biostatistica 1. Dipendenza spaziale 2. Dipendenza temporale 3. Dipendenza biologica

Campionamento: replicazione Genere Voto 1 Maschio 10 2 9 3 5 4 6 7 Femmina 8 11 12 Ogni osservazione è una vera replica? Non confondete le osservazioni con le repliche Spesso non coincidono! Prima di fare ogni tipo di campionamento deve essere chiaro quale sia la replica

Dipendenza spaziale Voglio vedere se la lunghezza media di una parametro morfologico (penna) varia fra maschi e femmine ♂ Popolazione TN-BZ ♀ 10 individui per genere 15 penne per individuo 300 misure

Dipendenza spaziale ♀ ♂ 15 measures per bird

Effetti della pseudoreplicazione df SS MS F value P sex 1 3.42 3.42 5.887 0.025 Residuals 18 10.48 0.58 --------------------------------------------------- df SS MS F value P sex 1 51.4 51.4 63.19 0.0000000000039 Residuals 298 242.4 0.81 Supponiamo di lavorare con un alpha=0.01 Cosa concludiamo?

Esempio 2: Dipendenza spaziale Effetto della fertilità del suolo sulla crescita dell’abete rosso Basso N Area di studio 4 siti 10 alberi 4 misure per anello Media1= 15 mm Quante repliche abbiamo? Alto N 4 siti 10 alberi 4 misure per anello Media2= 17 mm

Dipendenza spaziale Quando misuriamo la variabile ripetutamente sulla stessa unità di campionamento le misure non sono indipendenti Performance degli studenti prima e dopo il corso di statistica: 6 studenti, 12 misure Quante repliche? Tempo 1 Tempo 2 misura 1 misura 2

Dipendenza biologica Similarità nelle caratteristiche genetiche Ad es. individui che appartengono alla stessa famiglia, popolazione biologica ecc. Madre A Madre B Farmaco A Farmaco B Sampling A Sampling B

Esempio Esplicativa: Irrigazione ------- Variabile risposta: Produttività pioppo i passo: identificare l’unità di campionamento ii passo: identificare il numero di repliche iii passo: decidere la distribuzione spaziale delle repliche Terreno Canale

Sampling design: “buoni” e “cattivi” Esempi di cattivi design Nessuna replica Pseudoreplicato Sistematico Esempi di buoni design Blocco randomizzato Completamente randomizzato

Sampling design: conclusioni Prima di fare il campionamento devi capire qual è la replica dello studio Campionare un sufficiente numero di repliche Maggiore la variabilità della popolazione maggiore dovrà essere il numero di repliche