La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Ricevimento: Lunedì 11:00 – 12:00 Materiale didattico su:

Presentazioni simili


Presentazione sul tema: "Ricevimento: Lunedì 11:00 – 12:00 Materiale didattico su:"— Transcript della presentazione:

1 Ricevimento: Lunedì 11:00 – 12:00 Materiale didattico su:

2 Le distribuzioni di probabilità teoriche permettono di associare ad un singolo evento/caso la sua probabilità di verificarsi vs Per determinare con quale probabilità è possibile estrarre casualmente da una popolazione un campione con media superiore o inferiore ad un certo punteggio usiamo le DISTRIBUZIONI CAMPIONARIE

3 È una distribuzione di probabilità relativa ad una STATISTICA specifica che viene calcolata su tutti i possibili campioni di ampiezza n estraibili dalla popolazione di interesse. Per costruire una distribuzione campionaria è necessario: 1.Individuare tutti i possibili campioni di ampiezza n estraibili dalla popolazione 2.Calcolare per ogni campione la statistica di cui ci interessa determinare la distribuzione 3.Determinare la frequenza per ogni valore osservabile della statistica DISTRIBUZIONE CAMPIONARIA NELLA POPOLAZIONE PARLIAMO INVECE DI PARAMETRO

4 È una distribuzione di probabilità relativa ad una STATISTICA specifica che viene calcolata su tutti i possibili campioni di ampiezza n estraibili dalla popolazione di interesse. Per costruire una distribuzione campionaria è necessario: 1.Individuare tutti i possibili campioni di ampiezza n estraibili dalla popolazione 2.Calcolare per ogni campione la statistica di cui ci interessa determinare la distribuzione 3.Determinare la frequenza per ogni valore osservabile della statistica DISTRIBUZIONE CAMPIONARIA NELLA POPOLAZIONE PARLIAMO INVECE DI PARAMETRO

5 Variabile: superamento di un esame Distribuzione teorica: distribuzione binomiale del numero di successi/persone che hanno superato lesame Distribuzione campionaria: distribuzione del numero medio di successi/di persone che hanno superato lesame in ogni campione estratto Nel caso di probabilità…

6 Media del numero di successi nella popolazione Ampiezza della popolazione Probabilità di successo nella popolazione Deviazione standard nella popolazione PER OTTENERE LA DISTRIBUZIONE CAMPIONARIA DIVIDIAMO LA MEDIA E LA DEVIAZIONE STANDARD DELLA POPOLAZIONE PER N

7 La media delle medie dei campioni coincide con la media della popolazione dalla quale i campioni sono stati estratti FUNZIONE CAMPIONARIA DELLA MEDIA: proprietà Media della popolazione Media delle medie dei campioni Anche se la media della distribuzione campionaria è uguale alla media della popolazione, le due distribuzioni non coincidono perché la loro forma dipende dallampiezza n dei campioni

8 La VARIANZA della funzione campionaria delle medie per campioni di ampiezza n è uguale alla varianza della popolazione diviso lampiezza del campione FUNZIONE CAMPIONARIA DELLA MEDIA: proprietà Varianza della popolazione Varianza della funzione campionaria Ampiezza del campione

9 Quando la deviazione standard della popolazione NON E NOTA per calcolare lerrore standard è necessario stimarlo a partire da quello campionario FUNZIONE CAMPIONARIA DELLA MEDIA: proprietà

10 Quando la deviazione standard della popolazione NON E NOTA per calcolare lerrore standard è necessario stimarlo a partire da quello campionario FUNZIONE CAMPIONARIA DELLA MEDIA: proprietà La varianza di una popolazione è La varianza di un campione è

11 Se n>30, anche se la variabile è su scala nominale/dicotomica, la distribuzione si approssima alla normale ed usiamo i PUNTI Z La classica procedura di standardizzazione implica Se il campione è numeroso…. Quando i campioni sono indipendenti e le varianze sono uguali Quando i campioni sono indipendenti e le varianze sono diverse

12 ESEMPIO Qual è la probabilità che in un campione di 600 studenti, un gruppo fra i 330 e i 370 studenti superino lesame alla prima prova, sapendo che la proporzione nella popolazione è del 53%?

13 Poiché vogliamo conoscere la probabilità che un campione di studenti dai 330 ai 370 superi lesame dobbiamo calcolare due valori dei punti z. ESEMPIO

14

15 Poiché vogliamo conoscere la probabilità che un campione di studenti dai 330 ai 370 superi lesame dobbiamo calcolare due valori dei punti z. ESEMPIO Area compresa per z=1 è 0,3413 Area compresa per z=4,5 è 0,500

16 Per conoscere la probabilità è necessario fare la differenza tra i due valori ottenuti

17 Nel caso di variabili su scala a intervalli In questo caso usiamo la media e la deviazione standard della distribuzione campionaria Attraverso le distribuzioni campionarie, partendo dai dati rilevati su un campione,è possibile determinare un intervallo di valori allinterno del quale ricade con una certa probabilità la media della popolazione INTERVALLO DI FIDUCIA O INTERVALLO DI CONFIDENZA

18 1.Stabilire la probabilità che il nostro intervallo contenga la media della popolazione (90%, 95%, 99%) 2.Stabilire lampiezza del campione Intervallo di fiducia Costruire un intervallo di confidenza al 95% intorno alle statistiche di un campione SIGNIFICA individuare i due punteggi che racchiudono il 95% delle medie della distribuzione delle medie campionarie.

19 Si individuano i punti z che lasciano al di là di sè il 5% della distribuzione

20 Se non conosciamo la deviazione standard

21 … in sintesi

22 Ricevimento: Lunedì 11:00 – 12:00 Materiale didattico su:

23 INFERENZA STATISTICA Teoria della verifica dellipotesi : si verifica, in termini probabilistici, se una certa affermazione relativa alla popolazione è da ritenersi vera sulla base dei DATI CAMPIONARI Teoria della stima dei parametri: si stabilisce, in termini probabilistici, il valore numerico di uno o più parametri incogniti della popolazione a partire dai DATI CAMPIONARI

24 POPOLAZIONE: insieme di individui/item/osservazioni o più genericamente di elementi a cui il ricercatore fa riferimento nel generalizzare ed interpretare i risultati di unindagine o di un esperimento. … alcune definizioni Può essere FINITA se lampiezza della popolazione è determinabile. Es: punteggi in un test di intelligenza ottenuti da un gruppo di aspiranti ad un posto di lavoro. Può essere INFINITA se lampiezza della popolazione non è determinabile.

25 PARAMETRO della popolazione: è una caratteristica della popolazione espressa con un simbolo o con un numero. Un esempio è rappresentato dalla media e/o dalla varianza. … alcune definizioni CAMPIONE: un sottoinsieme di n elementi della popolazione/universo di interesse. Definisce lampiezza, cioè il numero di elementi di cui è costituito STATISTICA: è unespressione formale o un valore che descrive una caratteristica di un campione di ampiezza n.

26 PRESUPPOSTI DELLA VERIFICA DELLE IPOTESI Formulazione Ipotesi Statistiche z Raccolta dati sul Campione z verifica delle Ipotesi e Decisione (in base alla Teoria della Probabilità) y sempre soggetta ad errore y si assume a priori il rischio di errore che accettiamo di assumere nel prenderla z Individuazione del Campione

27 rappresentativitàÈ una fase molto delicata in quanto il campione DEVE avere la caratteristica della rappresentatività rispetto alla popolazione Campionamento Un campione rappresentativo è un campione che presenta tutte le più importanti caratteristiche della popolazione da cui proviene

28 Campionamento arbitrario uso di metodi arbitrari per il reclutamento delle persone Campionamento finalizzato ad uno scopo campione scelto per qualche ragione particolare (es: opinioni dei rettori di differenti università sui cambiamenti desiderabili) notevole influenza della soggettività del ricercatore Campionamento di convenienza si seleziona un gruppo desiderabile in quanto non è possibile effettuare il campionamento dellintera popolazione (es: ricerche condotte su studenti universitari) Differenti tipi di campionamento

29 Campionamento probabilistico e selezione casuale ogni membro della popolazione ha la stessa probabilità di essere scelto. La selezione di ogni membro è indipendente da quello di ogni altro membro. E necessario stabilire la popolazione di riferimento in base a quali sono gli scopi della nostra ricerca (Quadro di riferimento del campione). Ogni soggetto che cade nel quadro di riferimento entrerà a far parte del campione Campionamento sistematico è un campionamento probabilistico ma NON casuale. si stabilisce un criterio (es: selezionare il primo di un gruppo di 4 nomi) ed i soggetti vengono selezionati in base a tale criterio. Campionamento casuale semplice si usa quando si ritiene che la popolazione sia relativamente omogenea rispetto allo scopo della nostra ricerca. Come metodo si usa la tavola dei numeri random

30 Campionamento casuale stratificato Tratta la popolazione come due o più sottopopolazioni separate in modo da effettuare un campionamento casuale separato in ogni sottopopolazione. Viene usato quando si effettua una ricerca su una popolazione con sottogruppi identificabili che potrebbero dare delle risposte significativamente diverse. Campionamento a gruppi In ogni tipo di campionamento è comunque fondamentale stabilire il QUADRO DI RIFERIMENTO DEL CAMPIONE!!!!!!!!!!!!

31 2 campioni si dicono DIPENDENTI se ogni dato presente in una serie può essere abbinato ad un dato nellaltra serie. –È il caso delle rilevazioni che vengono effettuate sugli stessi soggetti Prima e Dopo un certo trattamento 2 campioni si dicono INDIPENDENTI se un dato presente in una serie NON può essere abbinato ad un dato nellaltra serie. –È il caso di gruppo sperimentale vs gruppo di controllo

32 Il ricercatore deve verificare se lipotesi formulata può essere considerata vera. La verifica delle ipotesi:principi generali IL VALORE OTTENUTO SUL CAMPIONE E SUFFICIENTEMENTE VICINO AL VALORE ATTESO IN FUNZIONE DELLIPOTESI? Necessità di formulare delle IPOTESI STATISTICHE, cioè delle ipotesi che possono essere verificate con il metodo statistico

33 È lipotesi che si vorrebbe rifiutare Afferma che gli effetti osservati nei campioni sono dovuti a fluttuazioni casuali Deve essere rifiutata solo se levidenza la contraddice Non è mai provata o verificata ma è SOLO POSSIBILE NEGARLA o DISAPPROVARLA sulla base dei dati sperimentali LIpotesi Nulla ipotesi in cui un certo parametro della popolazione è posto essere uguale ad un certo valore

34 LIpotesi Alternativa si indica con H 1 È detta anche sostantiva o sperimentale È lipotesi in cui si assume che il valore del parametro sia diverso dal valore indicato nella ipotesi nulla. H 1 può essere: – bidirezionale () –monodirezionale destra/sinistra (>/<)

35 Verificare se esiste una differenza nellesecuzione di una prova tra soggetti maschi e soggetti femmine H 0 (ipotesi nulla): non esiste una differenza tra Maschi e Femmine H 1 (ipotesi alternativa): esiste una differenza tra Maschi e Femmine

36 Verificare se una moneta è truccata H 0 (ipotesi nulla): la probabilità di Testa è uguale alla probabilità di Croce H 1 (ipotesi alternativa): la probabilità di Testa è diversa dalla probabilità di Croce

37 Si indica con α è un valore di probabilità che funge da linea di demarcazione tra lIpotesi Nulla e quella Alternativa Rappresenta la REGOLA DECISIONALE Definisce una REGIONE DI ACCETTAZIONE ed una REGIONE DI RIFIUTO della Ipotesi Nulla Il valore di α dipende dal tipo di Ipotesi Alternativa H1: –Se è monodirezionale destra, il valore di α verrà preso tutto nella coda di destra della distribuzione –Se è monodirezionale sinistra il valore di α verrà preso tutto nella coda di sinistra della distribuzione IL LIVELLO DI SIGNIFICATIVITA

38 Ipotesi Alternativa monodirezionale destra H0H0 Regione di rifiuto Regione di accettazione (1- )

39 Ipotesi Alternativa monodirezionale sinistra H0H0 Regione di rifiuto Regione di accettazione (1- )

40 Ipotesi Alternativa Bidirezionale (1- ) /2 H0H0 Regione di rifiuto Regione di rifiuto Regione di accettazione

41 Stabilire il livello di Stabilire il rischio che siamo disposti a correre di commettere lerrore di respingere H 0 quando è vera (Errore di I° tipo) Si tende a stabilire un valore di basso ( α=.05; α=.01; α=.001) perché è preferibile non affermare lesistenza di un fenomeno se non se ne è più che certi

42 Cosa significano i valori di α =.05 rischio di sbagliare rifiutando H 0 quando è vera = 5 volte su 100 =.01 rischio di sbagliare rifiutando H 0 quando è vera = 1 volte su 100 =.001 rischio di sbagliare rifiutando H 0 quando è vera = 1 volte su 1000

43 REGOLE DI DECISIONE Regole di decisione su base probabilistica La decisione non è mai certa La decisione è sempre soggetta ad errore

44 H o E VERA SI ACCETTA LIPOTESI NULLA H 0 SI RIFIUTA LIPOTESI NULLA H 0 DECISIONE CORRETTA DECISIONE SCORRETTA ERRORE DI I° TIPO

45 H o E FALSA SI ACCETTA LIPOTESI NULLA H 0 SI RIFIUTA LIPOTESI NULLA H 0 DECISIONE CORRETTA DECISIONE SCORRETTA ERRORE DI II° TIPO

46 REGOLE DI DECISIONE

47 α 1-α β 1-β Decisione corretta Accetto H O quando è vera Rifiuto H O quando è falsa Decisione corretta

48 1-α 1-β Zona di rifiuto di H 1 in comune con H 0 Zona di rifiuto di H 0 in cui è vera anche H 1 Zona di rifiuto di H 1 non in comune con H O

49 Probabilità di prendere la decisione corretta, cioè ACCETTARE LIPOTESI ALTERNATIVA QUANDO E CORRETTA 1 - β POTENZA DEL TEST STATISTICO È una misura dellimportanza delleffetto individuato statisticamente indipendente dal numero di soggetti utilizzati.

50 Relazione tra α e β αβ 1 - β Diminuendo alfa diminuisce il potere statistico del test

51 Fattori che incidono sulla potenza del test Livello di α (rischio di commettere un errore di I° Tipo) scelto dal ricercatore Numerosità del campione Grandezza delleffetto che si vuole evidenziare Attendibilità delle misure n (per gruppo)1 - β (potenza)

52 Il p-value nella procedura decisionale In alternativa al considerare le due regioni di accettazione e rifiuto, è possibile prendere la decisione in base al p-value Il p-value rappresenta la probabilità di osservare un valore della statistica test uguale o più estremo del valore che si calcola a partire dal campione, quando lipotesi H0 è vera. È anche chiamato livello di significatività osservato, in quanto coincide con il più piccolo livello di significatività in corrispondenza del quale H0 è rifiutata.

53 La regola decisionale per Rifiutare H O è: Se p Accetto H 0 e Rifiuto H 1 se p Rifiuto H 0 e Accetto H 1 p


Scaricare ppt "Ricevimento: Lunedì 11:00 – 12:00 Materiale didattico su:"

Presentazioni simili


Annunci Google