La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

La covarianza.

Presentazioni simili


Presentazione sul tema: "La covarianza."— Transcript della presentazione:

1 La covarianza

2 Il coefficiente di correlazione lineare

3 Il coefficiente di correlazione lineare

4 Rappresentazione grafica della relazione tra due variabili numeriche

5 Variabili aleatorie variabile aleatoria
Una variabile casuale o aleatoria è una variabile che può assumere determinati valori in corrispondenza al verificarsi di eventi aleatori variabile aleatoria normale, o “gaussiana” il suo grafico è a forma di campana, simmetrica rispetto al suo valore medio; la simmetria della distribuzione normale da vita ad un’importante proprietà che lega tra loro la probabilità degli eventi e la deviazione standard: l’area (la probabilità) compresa nell’intervallo [m - s ,m + s ] rappresenta il 68,3% della popolazione

6 Variabili aleatorie gaussiane

7 Variabili aleatorie i due punti di ascissa m - s e m + s individuano i cosiddetti punti di flesso della gaussiana, laddove essa muta il suo andamento convesso in concavo

8 La distribuzione gaussiana per calcolare le probabilità a partire da una media e una varianza in un campione

9

10

11

12 Variabili aleatorie Esistono anche altre importanti variabili aleatorie In effetti, una qualunque funzione matematica f( x) che sia non negativa e che permetta di individuare una regione di area uguale a uno si può considerare come la funzione di densità di una variabile aleatoria

13 variabile aleatoria t di Student
il grafico della t di Student è dotato di naturale simmetria rispetto al valor medio zero, ed anche in esso la media, la mediana e la moda coincidono. Tuttavia sussiste una importante differenza con la gaussiana: il grafico della t di Student cambia di forma in relazione alla numerosità n degli esperimenti che si prendono in considerazione; esso però tende ad avvicinarsi alla distribuzione normale standard, di media zero e varianza uno, al crescere di n. Praticamente, per n maggiore di 30 (ma alcuni autori dicono 50, od anche più) le due variabili aleatorie più o meno si equivalgono. Comunemente gli statistici indicano tale parametro n con il nome di grado di libertà

14 variabile aleatoria t di Student
n = 1 grado di liberta n = 5 gradi di liberta n = 25 gradi di liberta Verde: gaussiana Nera: t Student

15 variabile aleatoria c2 Un’altra variabile aleatoria molto importante e stata studiata dal letterato e matematico inglese Karl Pearson: si tratta della distribuzione c2 , del chi-quadro (si indica usando la lettera greca chi, c ) è legata alla distribuzione gaussiana in una maniera abbastanza esplicita: se infatti si parte dalla distribuzione normale e la si eleva al quadrato si ottiene la distribuzione del chi quadro ad un grado di liberta. Se invece si sommano due, tre, n distribuzioni normali elevate al quadrato, si ottengono le distribuzioni del chi-quadro a due, tre, n gradi di liberta. Queste, essendo delle quantità elevate al quadrato, devono giocoforza essere definite solo per valori positivi, diversamente da quanto accade per le distribuzioni normale e di Student.

16 variabile aleatoria c2

17 Distribuzioni teoriche discrete di probabilità

18 Distribuzioni teoriche discrete di probabilità

19 Distribuzioni teoriche discrete di probabilità

20 Ipotesi statistiche Un’ipotesi statistica è una congettura sul valore di un parametro (nella popolazione di interesse per una certa indagine). Per esempio è un’ipotesi statistica la congettura che l’altezza media degli italiani nati nel 1980 sia pari a 175 cm: m = 175 Un’ipotesi statistica è dunque individuata da un vincolo su un parametro: i valori che soddisfano il vincolo (qui uno solo) sono quelli per i quali la congettura è vera.

21 Ipotesi statistiche Per fare un altro esempio è un’ipotesi statistica l’affermazione di un’azienda produttrice di batterie per autovetture secondo la quale la durata media di un certo modello di batteria è almeno pari a 3400 ore: m ≥3400 Qui il vincolo è un vincolo di disuguaglianza (invece che di uguaglianza) soddisfatto dagli infiniti valori della durata media es. 3400, 3500, 4000, . . . per i quali l’affermazione dell’azienda produttrice è vera.

22 Ipotesi statistiche Un terzo esempio di ipotesi statistica è la congettura che la pressione sanguigna media dei soggetti che assumono un certo farmaco sia la stessa di quella dei soggetti che non lo assumono: mF = mN Qui il parametro è un vettore con due componenti: m = (mF , mN) L’ipotesi statistica è individuata, nel piano cartesiano, dalla bisettrice del primo e terzo quadrante. . .

23 Ipotesi statistiche l’ipotesi sottoposta a verifica si dice ipotesi nulla H0

24 Ipotesi statistiche La verifica di un’ipotesi statistica consiste nello stabilire se un dato campione casuale (semplice) contiene “abbastanza” evidenza per rifiutare l’ipotesi in questione; per esempio - si prendono a caso 40 italiani nati nel 1980 e se ne misurano le altezze: la loro media è “molto” diversa da 175? - si prendono a caso 30 batterie e se ne osservano le durate: la loro media è “molto” minore di 3400? - si somministra a 20 soggetti, presi a caso, il farmaco e ad altri 20 soggetti, sempre presi a caso, un placebo: le pressioni medie nei due gruppi sono “molto” diverse? Se si, i dati forniscono una “chiara” indicazione contro l’ipotesi sottoposta a verifica e questa sarà rifiutata; altrimenti. . .

25 Ipotesi statistiche La negazione dell’ipotesi nulla si dice ipotesi alternativa: - nell’esempio dell’altezza degli italiani l’ipotesi alternativa è che la media dei nati nel 1980 sia diversa m ≠ 175 - nell’esempio delle batterie l’ipotesi alternativa è che la durata media sia minore di 3400 ore. . . m < 3400 - nell’esempio della pressione sanguigna l’ipotesi alternativa è che la pressione media dei soggetti che assumono il farmaco sia diversa da quella dei soggetti che non lo assumono. . mF ≠ mN

26 Ipotesi statistiche

27 Ipotesi statistiche

28 Ipotesi statistiche

29 Ipotesi statistiche

30

31 Test statistici

32 Test statistici

33 Test statistici

34

35 Test statistici

36 Test statistici

37 Test statistici

38 Test statistici La distribuzione della media campionaria
Ha minore ampiezza al crescere di n È centrata sulla media della variabile nella popolazione È normale anche se la variabile non ènormale, ma n è grande

39 Test statistici

40 Test statistici

41 Test statistici

42 Test statistici

43 Test statistici

44 Esempio

45 Test statistici

46

47 La distribuzione t-Student

48 La distribuzione t-Student

49

50

51 I gradi di libertà

52 Test t di Student

53 Formalizzazione del test di ipotesi: Esempio

54

55

56

57

58

59

60 L’approccio del p-value nella verifica dell’ipotesi

61

62

63 Il test del c2 test di verifica d'ipotesi che utilizza la distribuzione della variabile casuale c2 per decidere se rifiutare o non rifiutare l'ipotesi nulla:

64 Il test del c2

65 Il test del c2

66 La distribuzione del c2

67 Estratto tabella del c2

68

69

70

71

72

73

74


Scaricare ppt "La covarianza."

Presentazioni simili


Annunci Google