La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

1 STATISTICA. 2 Perché la Statistica Nei fenomeni collettivi, cioè in quei fenomeni, in senso generale, in cui gli elementi coinvolti sono molti, non.

Presentazioni simili


Presentazione sul tema: "1 STATISTICA. 2 Perché la Statistica Nei fenomeni collettivi, cioè in quei fenomeni, in senso generale, in cui gli elementi coinvolti sono molti, non."— Transcript della presentazione:

1 1 STATISTICA

2 2 Perché la Statistica Nei fenomeni collettivi, cioè in quei fenomeni, in senso generale, in cui gli elementi coinvolti sono molti, non interessa il comportamento di ogni singolo elemento, ma interessa il loro comportamento globale. Esempi: gli alunni di un istituto scolastico; la popolazione di una nazione; ecc….

3 3 Una industria deve produrre un prodotto da immettere sul mercato. Per preparare il prodotto l’industria ha la necessità di conoscere il gusto della popolazione. Ovviamente non vengono interpellate tutte le persone a cui è indirizzato il prodotto per capire quali debbano essere le sue proprietà, tali da soddisfare il gusto degli acquirenti. Si interpellano un gruppo di persone, un campione, si raccolgono le riposte e si raccolgono i dati, che vengono opportunamente elaborati matematicamente. Da questa elaborazione si traggono delle conclusioni, da cui si ricavano le informazioni molto utili circa il gusto dei clienti. La fase descritta è un’indagine statistica.

4 4 La statistica è la scienza che si occupa della raccolta e dell'analisi dei dati relativi ad un certo gruppo di persone, animali o oggetti al fine di descrivere in maniera sintetica un fenomeno che li riguarda e fare eventualmente previsioni sul suo andamento futuro. Statistica deriva da stato, poiché i regnanti raccoglievano dati demografici ed economici di vitale interesse per la gestione di una nazione. Successivamente essa si è sviluppata con metodo scientifico nell’analisi dei dati ed è applicata in molte discipline: fisica, chimica, biologia, medicina, ingegneria, economia, scienze sociali. È diventata una branca molto importante della matematica.

5 5 In sintesi: Nelle scienze sperimentali (fisica, biologia, medicina, ingegneria, scienze sociali) si progettano esperimenti di vario tipo, si raccolgono i dati, li si analizzano e si interpretano i risultati. Per fare questo si usano argomenti statistici e calcoli matematici. Quindi la statistica è uno strumento di analisi dati ed un insieme di metodi e tecniche per: 1.Raccogliere informazioni su un fenomeno; 2.Sintetizzare l’informazione (elaborare dati); 3.Generalizzare i risultati ottenuti.

6 6 Elementi di un’indagine statistica La popolazione, da non confondersi con un gruppo di persone, o universo, è il gruppo di oggetti che viene preso in considerazione nell’indagine statistica (esempio: alunni di una scuola, elettori di una città, le molecole di un gas, i malati di un ospedale, geni, cellule, ecc..)

7 7 Elementi di un’indagine statistica Il censimento è la fase inerente la raccolta di dati che viene effettuata su di una popolazione. Il campione è solo una parte della popolazione che viene presa in considerazione durante l’indagine statistica. La scelta del campione viene effettuata in modo che sia una rappresentanza significativa dell’intera popolazione.

8 8 Elementi di un’indagine statistica Fissata una popolazione, si chiamano variabili statistiche tutte quelle caratteristiche che variano al variare dei componenti della popolazione. Esempi: il colore bianco, fulvo, nero, ecc..., della pelliccia degli esemplari di una certa specie, il sesso (maschio o femmina), sono variabili statistiche qualitative (non numeriche), dette anche attributi.

9 9 Elementi di un’indagine statistica Altri esempi di variabili statistiche: l'età in mesi dei bambini il numero di cuccioli nati da ogni femmina, sono variabili statistiche quantitative discrete (sono numeri ben precisi.) la temperatura di Roma rilevata alle ore 14 del primo Giugno di ogni anno è una variabile quantitativa continua, In generale le variabili discrete possono assumere solo un numero finito o una infinita numerabile di valori, mentre quelle continue possono assumere tutti i valori compresi in un intervallo.

10 10 Statistica descrittiva e statistica induttiva La statistica descrittiva (cioè che descrive i fenomeni) è l’insieme di metodi e tecniche per l'esplorazione e la sintesi dell'evidenza empirica o sperimentale (dati), ovvero l’insieme di strumenti matematici utilizzati per descrivere i dati relativi ad un certo gruppo scelto come popolazione. Essa si occupa dell’analisi dei dati osservati.

11 11 Statistica descrittiva e statistica induttiva La statistica descrittiva spiega come i dati raccolti devono essere riportati in tabella, rappresentati in grafici e sintetizzati in indici matematici, allo scopo di individuare le caratteristiche fondamentali del campione.

12 12 Statistica descrittiva e statistica induttiva Lo scopo principale della statistica descrittiva è di ridurre il volume dei dati osservati, esprimendo l’informazione contenuta dei dati per mezzo di tabelle, di grafici e indicatori numerici che li descrivono. Inoltre si possono effettuare indagini di tipo comparativo e si può verificare l’adattarsi dei dati sperimentali ad un certo modello teorico.

13 13 Statistica descrittiva e statistica induttiva Lo scopo principale della statistica descrittiva è di descrivere il fenomeno sulla base dei risultati contnuti nel campione, senza estendere i risultati all’intera popolazione e di ridurre il volume dei dati osservati, esprimendo l’informazione contenuta dei dati per mezzo di tabelle, di grafici e indicatori numerici che li descrivono. Inoltre si possono effettuare indagini di tipo comparativo e si può verificare l’adattarsi dei dati sperimentali ad un certo modello teorico.

14 14 Statistica descrittiva e statistica induttiva La statistica induttiva (o inferenza – deduzione statistica) è l’insieme di metodi e principi per dedurre le caratteristiche generali di un fenomeno mediante l'osservazione di un insieme limitato di manifestazioni dello stesso. Dall’analisi dei dati del campione, mediante adeguati strumenti matematici si effettuano previsioni circa le caratteristiche dell’intera popolazione. È bene precisare che le deduzioni e le previsioni non sono certezze, ma sono delle asserzioni che vengono formulate mediante metodi matematici particolari, precisi e quantitativi, come il calcolo delle probabilità.

15 15 Statistica descrittiva e statistica induttiva La statistica induttiva (o inferenza – deduzione statistica) permette di dedurre leggi generali, disponendo di un campione di dati variabili. Quindi cerca di estendere i risultati ottenuti sul campione all’intera popolazione. Per poter estendere i risultati occorre che il campione sia scelto con criterio.

16 16 Fase di un’indagine statistica Un’indagine statistica per la sua esecuzione richiede di essere svolta in varie fasi. Prima fase: Cosa indagare Prima di tutto è necessario individuare l’oggetto (cosa indagare) di un’indagine riguardante una certa popolazione. L’oggetto dell’indagine si chiama carattere. Questi si distinguono in caratteri qualitativi e in caratteri quantitativi, che possono essere, a loro volta, discreti e continui (definizioni visti in precedenza.) Ogni soggetto o elemento che costituisce una popolazione si chiama unità statistica.

17 17 Seconda fase: Come indagare Il secondo passo consiste come effettuare l’indagine. Un carattere rappresenta un aspetto di un fenomeno collettivo che si vuole analizzare. Ciascuno dei possibili modi in cui un carattere si presenta si chiama modalità. Esempio: Si vuole analizzare il titolo di studio conseguito dai giovani. “Titolo di studio” rappresenta il carattere su cui raccogliere informazioni. Il titolo di studio può essere la licenza media, diploma di scuola superiore, laurea. I diversi modi in cui si presenta il carattere, ovvero il diverso titolo di studio conseguito, si chiama modalità.

18 18 Terza fase: Raccolta dei dati La raccolta dei dati può avvenire o sull’intera popolazione (chiamata anche insieme universo), allora si dice che si esegue un censimento (rilevazione diretta o globale), oppure su una parte della popolazione chiamata campione (rilevazione indiretta o parziale). Quest’ultimo vien scelta in modo opportuno in modo da essere una rappresentanza significativa della popolazione. L’indagine effettuata sull’intera popolazione risulta più significativa di quella effettuata su un campione, però risulta più costosa e più lunga nei tempi. Pertanto l’indagine sul campione è più redditizia, sia nei costi che nei tempi, però presenta un certo grado di incertezza nei suoi risultati. Con il tempo i matematici hanno trovato sistemi per diminuire tali incertezze.

19 19 Quarta fase: Spoglio delle schede La raccolta dei dati avviene mediante la compilazione di schede o questionari da parte del soggetto “intervistato”. Una volta eseguita la raccolta delle schede contenenti i dati dell’indagine, è necessario effettuare lo spoglio per poter organizzarli. Una buona organizzazione dei dati permette di trarre informazioni sintetiche sul fenomeno studiato. Pertanto si inizia il conteggio delle risposte che vengono date a ciascuna domanda. A tale proposito si predispongono delle opportune tabelle in cui inserire il conteggio delle diverse risposte.

20 20 Quinta fase: Rappresentazione grafica Per trarre delle informazioni adeguate, i dati, che sono stati predisposti in tabelle, vengono rappresentati mediante opportuni grafici. Dallo studio dei grafici e adoperando adeguati strumenti matematici si traggono informazioni circa l’indagine statistica. I grafici possono essere del tipo: 1.Ortogramma 2.Istogramma 3.Aerogramma

21 21 Tipi di grafici I grafici possono essere del tipo: 1.Ortogramma 2.Istogramma 3.Aerogramma 4.Diagrammi cartesiani 5.Ideogrammi e cartogrammi 6.Diagrammi a strisce o a colonne 7.Diagrammi circolari o a torta

22 22 Sesta fase: Elaborazione dei dati Dai dati sistemati in tabelle e dai grafici che si producono, gli statistici, adoperando opportune tecniche matematiche, elaborano i dati. Dalla interpretazione dei dati si traggono opportune informazioni. Se l’indagine è stata effettuata su un campione, le conclusioni possono essere considerate valide per l’intera popolazione.

23 23 Esempio di indagine statistica Come esempio di indagine statistica, si possono considerare i voti conseguiti da una classe al termine dell’anno scolastico. Poiché l’analisi della classe viene fatta considerando i voti presi da tutti gli alunni della classe, la raccolta dei dati viene fatta su una intera popolazione (la classe.) I dati stati inseriti in un foglio di calcolo Excel. L’analisi dei dati ed i grafici saranno esguiti utilizzando le funzioni presenti nel foglio di Excel.

24 24

25 25 Analisi dei dati Alunni della classe Il numero, N, degli alunni di cui è composta la classe è: N = 31 Prima di tutto si vuol conoscere come è composta la classe, cioè conoscere il numero di ragazzi e ragazze. Dal conteggio risulta: RagazziRagazze 922

26 26 Conta-se() – Conteggio condizionato La funzione di Excel che permette il conteggio dei ragazzi e delle ragazze è: conta.se() Per contare il numero dei ragazzi si deve digitare, in una qualsiasi cella del foglio, la seguente istruzione: =CONTA.SE(C2:C22;”M”) Il significato della scrittura è il seguente: Conta tutte le “M” (condizione) che si trovano nelle celle comprese tra C2 e C22.

27 27 Aerogramma o diagramma a torta L’ aerogramma, detto anche diagramma circolare o diagramma a torta, è un utili mezzo per rappresentare le percentuali di ripartizioni della popolazione rispetto ad una caratteristica. Il diagramma viene eseguito utilizzando “Creazione guidata grafico” di Excel.

28 28 Aerogramma o diagramma a torta Il diagramma a torta ha il pregio di fornire subito visivamente l’idea di come sono suddivisi, in ragazzi e ragazze, gli alunni della classe. I numeri che vi compaiono indicano: il primo numero indica il valore assoluto di ragazzi e ragazze; il secondo la percentuale. L’ampiezza degli angoli dei settori circolari sono in relazione alla percentuale.

29 29 Percentuale - Calcolo La percentuale, che indica la suddivisione tra ragazzi e ragazze della classe, si calcola nel seguente modo: Siano N = 31; Ragazzi = 9; Ragazze = 22 Rispettivamente, il numero totale degli alunni, il numero di ragazze e di ragazze. Il calcolo della percentuale dei ragazzi presenti nella classe è il seguente: da cui si ha:

30 30 Media aritmetica Volendo confrontare il rendimento scolastico dei singoli alunni, è molto comodo avere a disposizione un solo numero piuttosto che tutti i voti, da cui non sarebbe possibile ricavare una informazione immediata. Il numero capace di sintetizzare il rendimento scolastico è la media aritmetica. Definizione: La media aritmetica di una distribuzione statistica di dati numerici è il rapporto tra la somma di tutti i dati raccolti ed il loro numero.

31 31 Media aritmetica Applicazione della definizione al calcolo della media aritmetica dei voti del primo alunno della tabella: “Agata” Si indicano con n = 10 il numero di discipline (numero di dati) e con x 1, x 2, x 3, x 4, ……., x n i voti delle singole discipline (dati raccolti).

32 32 Media aritmetica La media aritmetica, M, si calcola nel seguente modo: oppure, in modo sintetico, Si legge: Sommatoria di x i, con i che varia da 1 ad n. Il simbolo Σ, sigma lettera greca maiuscola, viene utilizzato in matematica per indicare una somma di molti termini.

33 33 Media aritmetica Sostituendo nella formula i numeri che indicano i voti, si calcola la media dell’alunna “Agata”. Questa operazione deve essere eseguita per tutti gli altri alunni.

34 34 Media aritmetica interra classe

35 35 Media aritmetica con Excel Con Excel la media aritmetica si calcola nel seguente modo: 1.Posizionamento del cursore nella cella N2 (vedere figura nella diapositiva precedente); 2.Digitare: =SOMMA(D2:M2)/10 Con Excel, quando in una cella si immette una qualsiasi formula matematica, la formula viene sempre preceduta dal simbolo di uguaglianza (=). Il significato della formula è il seguente: Sommare tutti i numeri compresi tra le celle D2 e M2 [SOMMA(D2:M2)], e dividere (/) per 10, dove 10 è il numero delle discipline.

36 36 Media aritmetica con Excel Per calcolare le medie aritmetiche degli altri alunni bisognerebbe riscrivere la precedente formula. Con Excel questo procedimento può essere evitato seguendo la seguente procedura: 1.Si posiziona il cursore sulla casella N2. 2.Si posiziona il cursore nella parte bassa a destra della casella; 3.Compare un piccola “croce”; 4.Tenendo premuto il tasto sinistro del mouse, si trascina in verticale il contenuto della cella N2. I numeri che compaiono sono le medie aritmetiche di tutti gli alunni.

37 37 Media aritmetica ponderata Osservando i voti di “Agata” si nota che alcuni voti si ripetono diverse volte. Il voto “7” compare “3” volte; Il voto “8” compare “6” volte; Il voto “9” compare “1” volte; I voti “7”, “8” e “9” rappresentano le modalità. I numeri “3”, “6” e “1”, rispettivamente, rappresentano quante volte si presentano i voti “7”, “8” e “9”. Questi numeri si chiamano “frequenza” o, nel calcolo della media, “peso”.

38 38 Media aritmetica ponderata Pertanto, invece di calcolare la media come fatto in precedenza, che non è conveniente quando si hanno molti numeri, si utilizza il concetto di peso e, quindi, di media pesata. Indicando con x 1, x 2, x 3, …., x i i voti, e con p 1, p 2, p 3, …., p i i rispettivi pesi, o frequenze, la media ponderata risulta:

39 39 Media aritmetica ponderata Elaborando ulteriormente l’espressione della media ponderata, si ottiene: Nel caso dell’alunna “Agata”, la media ponderata risulta:

40 40 Media aritmetica ponderata Ulteriore applicazione della media aritmetica ponderata a tutta la classe. Nella tabella-figura sono indicati i voti ed i corrispondenti pesi. Il peso totale vale 310. questo numero deriva dalla seguente moltiplicazione 10  31=310 Dove: 10 = numero di discipline 31= numero di alunni.

41 41 Media aritmetica ponderata La media aritmetica ponderata della intera classe risulta: Sempre con Excel, la media aritmetica dell’intera classe si ottiene digitando il seguente comando: =SOMMA(D2:M32)/310 Il cui significato è: sommare tutti i numeri compresi nel rettangolo i cui vertici estremi sono le celle D2 e M32, il tutto diviso per 310 (Numero di discipline  numero alunni).

42 42 Media aritmetica con Excel Con Excel la media aritmetica si calcola con la seguente formula predefinita dal software: =MEDIA(D2:M32) Il significato è della formula: Effettuare la media dei numeri compresi in un rettangolo di celle comprese tra D2 e M32.

43 43 Frequenza Per definire il concetto di frequenza, si riconsidera la seguente figura. Voto è il carattere dell’indagine statistica. 6, 7, 8, 9 e 10 sono le modalità con cui si manifestano i caratteri. 62, 89, 87, 66 e 6 sono il numero di volte con cui si presentano le modalità. Questi numeri si chiamano frequenza (oppure peso). L’insieme delle modalità e delle loro frequenze si chiama distribuzione statistica delle frequenze, oppure distribuzione di frequenze.

44 44 Frequenza assoluta Pertanto si ha la seguente definizione di frequenza: La frequenza assoluta di una modalità è il numero che indica quante volte il carattere si è manifestato. La frequenza risulta assoluta perché non tiene conto della totalità delle modalità.

45 45 Frequenza o peso con Excel Con Excel, il peso, o frequenza, relativo al voto “6” si calcola nel seguente modo: =CONTA.SE(D2:M32;”6”) Il comando CONTA.SE è un comando condizionato ed ha il seguente significato: Conta quante volte compare il carattere (voto) “6” in tutte le caselle comprese in un rettangolo (di caselle) i cui vertici opposti sono le celle D2 e M32. Nello stesso rettangolo di celle si calcolano i pesi dei restanti voti.

46 46 Frequenza relativa Se la frequenza viene calcolata facendo riferimento alla totalità delle modalità, si ottiene la frequenza relativa. Pertanto la frequenza relativa di una particolare modalità è il rapporto tra la frequenza della modalità ed il numero totale delle rilevazioni. Indicando con F la frequenza assoluta e con T la totalità delle rilevazioni, allora la frequenza relativa, f, risulta:

47 47 Frequenza relativa percentuale Moltiplicando per 100 la frequenza relativa si ottiene la frequenza percentuale. Esempio: La frequenza relativa percentuale relativa al voto 8 è:

48 48 Frequenza grafici: Torta Per una lettura immediata dei dati presenti nella tabella si eseguono delle rappresentazioni grafiche. Un primo grafico è quello a torta, che fornisce le relazioni percentuali tra le diverse modalità. La torta è in settori separati.

49 49 Frequenza grafici: Torta Un altro tipo di grafico a torta è quello in cui i vari settori non sono separati

50 50 Frequenza grafici: Ortogramma Un altro tipo di grafico è l’ortogramma. In questo tipo di grafico si mettono a confronto le frequenza assolute. Le altezze dei rettangoli hanno la stessa base, mentre le altezze sono in proporzione alle frequenze assolute.

51 51 Classi di frequenze Un ulteriore approfondimento del profitto degli alunni è quello di studiare la media dei loro voti. Osservando le medie, si constata che esse sono diverse tra di loro; allora le medie, ovvero le modalità, vengono raggruppate in classi. Per ognuna di queste classi viene determinata la frequenza sia assoluta che relativa.

52 52 Frequenza: Frequenza assoluta in cui si presenta una certa classe. Frequenza relativa percentuale: Frequenza relativa alla totalità. Classe: Suddivisione delle medie dei voti in intervalli prestabiliti, esempio [6,5 – 7]. Per ogni classe il valore più piccolo viene escluso. Esempio: il valore 6,5 appartiene alla classe [6 – 6,5] e non alla classe [6,5 - 7]. Classi di frequenza Media dei voti, M: oggetto da studiare, modalità. 6,5 < M  6,5 : Esempio di raggruppamento della modalità in classi.

53 53 Classi di frequenza: Istogramma Per rappresentare i dati che sono stati suddivisi in classi, i utilizza l’Istogramma. L’Istogramma è composto da rettangoli la cui area è proporzionale alla frequenza. Se le basi sono tutte uguali, l’altezza dei rettangoli coincidono con le frequenze.

54 54 Indice di posizione centrale La media della classe è M=7,56. la media indica un valore di sintesi, cioè è un valore che riassume una caratteristica di un insieme dei dati (in questo caso la media dei voti di fine anno scolastico.) Questo valore si trova molto vicino alla zona in cui si addensano di più le medie dei voti (Intervallo di medie: 7-7,5; frequenza=7). Quando la media totale, o valore di sintesi, si trova nella zona in cui si addensano i risultati, si chiama indice di posizione centrale. Non sempre la media è un buon indice centrale.

55 55 Mediana Si considerino i valori ottenuti durante un’indagine: 3, 12, 5, 8, 15, 2, 63 La media aritmetica della serie di valori è: Il valore della media è più grande di tutti i numeri, ad eccezione del valore 63. Questo significa che la media calcolata non è un buon indice di posizione centrale, poiché sposta in avanti il valore medio rispetto alla posizione centrale.

56 56 Per trovare un buon indice di posizione centrale, si eseguono le seguenti operazioni: si ordinano in senso crescente i numeri della serie di valori: 2; 3; 5; 8; 12; 15; 63 Si scegli il numero centrale della serie di valori, che corrisponde al numero 8. Questo numero prende il nome di Mediana. È da notare che il numero di valori è dispari (i valori sono 7.) Mediana

57 57 Se il numero di valori della serie di dati è pari, allora, dopo averli ordinati, si prendono i due valori centrali e si esegue la loro media aritmetica. Tale valore è la mediana cercata. Esempio: i dati sono: 12, 3, 23, 17, 32, 15, 45, 27, 52, 31 La serie di dati ordinata è: 3, 12, 15, 17, 23, 27, 31, 32, 45, 52 Il numero di valori è 10, che è un numero pari. I due valori centrali sono il quinto ed il sesto, cioè 23 e 27. La media dei due valori è: Mediana Pertanto la mediana vale 25.

58 58 Definizione di Mediana: Data una sequenza ordinata di N numeri x 1, x 2, x 3, …., x N, la mediana è: Il valore che occupa la posizione centrale, se N è dispari; La media aritmetica dei due valori centrali, se N è dispari. Mediana

59 59 Moda o valore modale Si prendono in considerazione i voti conseguiti dagli alunni in Latino. Osservando i dati riportati, si nota che il voto 6 si ripete con una frequenza, 11, superiore a tutti gli altri voti. Allora come di indice di posizione centrale si preferisce assumere il numero 6. Tale numero prende il nome di moda. Si posizionano in senso orizzontale i voti conseguito in latino: 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 10

60 60 Definizione: Siano dati i numeri x 1, x 2, x 3, x 4, ……, x N, si chiama moda il valore a cui corrisponde la frequenza massima. Moda Se si considerano tutti i voti conseguiti dalla classe, si nota che il 7 è il voto cha una maggiore frequenza. Il numero 7 è la moda della serie di numeri, che coincidono con tutti i voti. Con Excel la moda si calcola utilizzando il seguente comando: =MODA(D2:M32) Significato: Calcola la MODA dei numeri compresi nella matrice rettangolare i cui vertici estremi, ovvero il primo numero e l’ultimo numero, sono D2 e M32

61 61 Se nella distribuzione dei dati vi sono più numeri che hanno la stessa frequenza massima, allora la moda si dice bimodale, se vi sono due massimi, o plurimodale, se vi sono più di due massimi Moda Se la distribuzione dei numeri è suddivisa in classi, come la media dei voti, allora si parla di classe modale.

62 62 Indici di variabilità o di dispersione Non sempre la media e gli indici di posizione centrale sono indicativi dell’andamento di una serie di dati. Cioè non indicano sufficientemente come si distribuiscono tali valori intorno al valore centrale. Il significato di quanto detto lo si può vedere facendo un esempio.

63 63 Indici di variabilità o di dispersione Si consideri la seguente serie di dati: Entrambe le serie di dati hanno la stessa media: M = 18. Come si può osservare, la distribuzione dei valori delle due serie intorno alla media è diversa.

64 64 Indici di variabilità o di dispersione Un primo modo di indicare la differenza tra le due serie è quello di introdurre seguente definizione: Definizione: Si definisce campo di variazione ( o range) di una variabile statistica la differenza tra il suo valore massimo ed il suo valore minimo. Nella prima serie il range è di 9 (24-15=9). Nella seconda serie il range è 37 (40-3=37)

65 65 Indici di variabilità o di dispersione Le due serie di dati pur avendo la stessa media hanno campi di variazioni molto diversi tra di loro. Questo significa che l’informazione che si trae è approssimata. Inoltre non rivela sufficientemente come sono distribuiti i dati all’interno della distribuzione. In statistica per misurare la variabilità o la dispersione dei dati delle due serie si utilizzano degli indici di variabilità. Questi permettono di misurare di quanto variano i dati da analizzare rispetto al centro della distribuzione, ricavandone ulteriori informazioni. Un esempio di indice di variabilità è il campo di variazione (o range).

66 66 Scarto dalla media Un altro indice di variabilità o di dispersione è lo scarto dalla media. Definizione: Si dice scarto dalla media di un valore della distribuzione statistica la differenza il valore stesso e la media. Se M è la media e x i uno dei valori della distribuzione, allora lo scarto dalla media, s i, è: s i = x i - M

67 67 Calcolo degli scarti dalla media, s n. s 1 = 15 – 18 = -3 s 2 = 19 – 18 = 1 s 3 = 24 – 18 = 6 s 4 = 14 – 18 = -4 s 5 = 17 – 18 = -1 s 6 = 16 – 18 = -2 s 7 = 21 – 18 = 3 s 8 = 18 – 18 = 0 Scarto dalla media

68 68 Se si addizionano tutti gli scarti: Si nota che la somma è nulla. Quindi in generale si ha: La somma degli scarti, s i, dalla media, M, di una variabile statistica è uguale a zero. Scarto dalla media s 1 + s 2 + s 3 + s 4 + s 5 + s 6 + s 7 + s 8 = = -3 + 1 + 6 – 4 - 1-2 + 3 + 0 = 0

69 69 Scarto dalla media Su di un sistema di assi cartesiani si possono rappresentare sia la serie di valori si la media dei valori. In questo modo si osservano come si disperdono i valori intorno al media. Il grafico che si ottiene si chiama grafico di dispersione.

70 70 Scarto dalla media La seconda serie di dati ha il seguente grafico di dispersione.

71 71 Scarto dalla media Confronto tra i grafici di dispersione delle due serie di dati. Nel primo grafico la dispersione rispetto alla media è meno accentuata della seconda.

72 72 Scarto assoluto dalla media Poiché la media degli scarti è sempre nulla, essa non fornisce indicazioni accettabili di come variano i dati, allora si introduce una nuova quantità: lo scarto assoluto della media. Pertanto, una volta calcolato lo scarto di un dato della distribuzione statistica, si calcola il suo valore assoluto. Se x i indica un dato ed M indica la media della distribuzione, allora lo scarto assoluto, s i, vale.

73 73 Scarto assoluto dalla media Gli scarti assoluti della prima serie di dati sono:

74 74 Scarto semplice medio Degli scarti assoluti si fa una media. Il valore che si ottiene è lo scarto medio. Definizione: Lo scarto medio semplice, S, di una sequenza di numeri x 1, x 2, x 3, …, x n è la media aritmetica degli scarti assoluti dei numeri stessi dalla loro media aritmetica.

75 75 Applicando la definizione all’esempio precedente si ha: Scarto semplice medio

76 76 Qual è il significato di scarto semplice medio? Cosa significa che lo scarto semplice medio, S, vale 2,5? Risposta: Il valore S=2,5 indica che, in media, i valori della sequenza dei dati si discostano di 2,5 dalla media aritmetica. Ciò che interessa è lo scostamento di un dato dalla media e non se il dato è maggiore o minore del valore medio dei dati. Scarto semplice medio

77 77 Con Excel il calcolo dello scarto medio si esegue utilizzando la seguente funzione matematica: Scarto semplice medio Il significato è il seguente: Calcola la media delle deviazioni assolute dei loro valori rispetto alla media. L’intervallo dei dati è compreso nella matrice i cui vertici opposti di un rettangolo possono essere, ad esempio, M4 e M11.

78 78 Varianza Un altro indice che si utilizza nell’analisi dei dati è la deviazione standard. Per poterla definire si parte dal concetto di varianza, che si indica con  2. Definizione: Data una sequenza di numeri x 1, x 2, x 3, …, x n di una distribuzione statistica, si chiama varianza,  2, la media aritmetica dei quadrati degli scarti assoluti dei dati. Ogni termine |x i - M| 2 si chiama scarto quadratico.

79 79 Un altro modo di calcolare la varianza è il seguente: Varianza

80 80 Con Excel la varianza dell’intera popolazione si calcola utilizzando la seguente funzione matematica: Varianza Con Excel la somma dei quadrati delle deviazioni dalla media si calcola con la seguente funzione statistica:

81 81 Deviazione standard Scarto quadratico medio Definizione: Si chiama deviazione standard, oppure scarto quadratico medio, la radice quadrata della varianza.

82 82 Applicazione di varianza e deviazione standard o scarto quadratico medio alla precedente distribuzione di dati. Deviazione standard Scarto quadratico medio La varianza vale: La deviazione standard o scarto quadratico medio è:

83 83 Con Excel la deviazione standard, o scarto quadratico medio, dell’intera popolazione si calcola applicando la seguente funzione statistica: Deviazione standard Scarto quadratico medio

84 84 Curva gaussiana Nella tabella sono riportati le medie dei voti, suddivise in classi, da un insieme di classi di alunni. Nella prima colonna sono riportati gli intervalli in cui sono state suddivise le medie degli alunni. Nella seconda colonna sono riportate le frequenze delle medie che cadono nell’intervallo indicato.

85 85 Si riporta su di un istogramma le frequenze dei voti in funzione degli intervalli in cui sono state suddivise le medie ottenute dagli alunni al termine di un anno scolastico. Curva gaussiana

86 86 Curva gaussiana

87 87 Si collegano i punti medi delle basi superiori dei rettangoli. Si ottiene una spezzata, che avrebbe una forma a “campana” se la suddivisione in intervalli della distribuzione dei dati fosse in un grande numero. La curva teorica che descrive la campana si chiama gaussiana o curva di Gauss. Karl Friedrich Gauss (1777-1855) è stato uno dei più grandi matematici di sempre. Curva gaussiana

88 88 Curva gaussiana Il grafico riporta una tipica gaussiana teorica. La curva risulta simmetrica rispetto al valore medio, M, della distribuzione dei dati.

89 89 Curva gaussiana Il grafico riporta diverse gaussiane simmetriche tutte rispetto allo stesso valore medio, M. La diversità delle gaussiane consiste nei diversi valori delle deviazioni standard o scarto quadratico medio, .

90 90 Curva gaussiana Dal grafico si nota che se la deviazione standard è piccola, la curva è stretta ed allungata. Ciò significa che i dati si addensano attorno al valore medio, o valore aspettato, M, della distribuzione. Per valori grandi della deviazione standard, la curva si abbassa e si allarga. Ciò significa che i dati si addensano di meno rispetto al valore medio. Ovvero i dati si disperdono di più e si allontanano dal valore medio.

91 91 Curva gaussiana I punti A e C hanno la stessa ascissa, che vale: A = C = M –  I punti B e D hanno la stessa ascissa, vale: B = D = M +  La fascia colorata sotto la curva gaussiana che ha per estremi i punti C e D sta a significare che il 68% dei dati della popolazione indagata si distribuisce tra M-  e M+ .

92 92 Curva gaussiana Se le ascisse dei punti C e D sono: A = C = M –2  B = D = M + 2  allora la fascia colorata sotto la curva gaussiana che ha per estremi i punti C e D indica che il 95% dei dati della popolazione indagata si distribuisce tra M-2  e M+2 .

93 93 Curva gaussiana Se le ascisse dei punti C e D sono: A = C = M –3  B = D = M + 3  allora la fascia colorata sotto la curva gaussiana che ha per estremi i punti C e D indica che il 99% dei dati della popolazione indagata si distribuisce tra M-3  e M+3 . Dal grafico si nota che quasi la totalità dei dati di una popolazione si trova tra M-3  e M+3 .

94 94 Curva gaussiana Confronto tra due gaussiane con valori diversi di deviazione standard. La prima ha una deviazione standard piccola, con forma stretta e allungata, la seconda con valore più grande, forma schiacciata e allargata.

95 95 Altre medie: Geometrica - Quadratica - Armonica Siano x 1, x 2, x 3, ….., x n una serie di numeri positivi. Si definisce media geometrica, M G, la radice n-esima del prodotto di tutti i numeri:

96 96 Media Geometrica Se i numeri x 1, x 2, x 3, ….., x n si ripetono diverse volte, ad ognuno di essi viene associato una frequenza o peso, f. Numero frequenza x 1  f 1 x n  f n La media geometrica ponderata risulta:

97 97 Media Geometrica Esempio: Si abbia la seguente serie di numeri: 2, 5, 7, 12, 13, 17 In totale i numeri sono 6. La media geometrica è: Comando Excel: =MEDIA.GEOMETRICA(A1:A6)

98 98 Media quadratica semplice Siano x 1, x 2, x 3, ….., x n una serie di numeri positivi. Si definisce media quadratica semplice, M Q, la radice quadrata della media aritmetica dei quadrati dei dati.

99 99 Media quadratica semplice Esempio: Si abbia la seguente serie di numeri: 2, 5, 7, 12, 13, 17 In totale i numeri sono 6. La media quadratica semplice è:

100 100 Media quadratica semplice Se i numeri x 1, x 2, x 3, ….., x n si ripetono diverse volte, ad ognuno di essi viene associato una frequenza o peso, f. Numero frequenza x 1  f 1 x n  f n La media quadratica semplice risulta:

101 101 Media armonica semplice Siano x 1, x 2, x 3, ….., x n una serie di numeri positivi. Si definisce media armonica semplice, M A, il reciproco della media aritmetica dei reciproci dei dati.

102 102 Media armonica semplice Esempio: Si abbia la seguente serie di numeri: 2, 5, 7, 12, 13, 17 In totale i numeri sono 6. La media armonica semplice è:

103 103 Media armonica semplice Se i numeri x 1, x 2, x 3, ….., x n si ripetono diverse volte, ad ognuno di essi viene associato una frequenza o peso, f. Numero frequenza x 1  f 1 x n  f n La media armonica semplice risulta:

104 104 Rappresentazioni grafiche Per le distribuzioni di frequenza di dati qualitativi, le rappresentazioni grafiche più frequenti sono - i diagrammi a rettangoli distanziati, - gli ortogrammi, - gli areogrammi (tra cui i diagrammi circolari), - i diagrammi a figure (o diagrammi simbolici).

105 105 I diagrammi a rettangoli distanziati, detti anche grafici a colonne, sono formati da rettangoli con basi uguali ed altezze proporzionali alle intensità (o frequenze) dei vari gruppi considerati. A differenza degli istogrammi, i rettangoli non sono tra loro contigui, ma distaccati; di conseguenza, sull’asse delle ascisse non vengono riportati misure ordinate ma nomi, etichette o simboli, propri delle classificazioni qualitative. Con dati qualitativi o nominali, le basi dei rettangoli sono sempre identiche avendo solo un significato simbolico. Rappresentazioni grafiche

106 106 Diagrammi a rettangoli distanziati Rappresentazioni grafiche

107 107 Rappresentazioni grafiche Gli ortogrammi o grafici a nastri sono uguali ai rettangoli distanziati; l’unica differenza è che gli assi sono scambiati, per una lettura più facile.

108 108 Rappresentazioni grafiche Barre orizzontali

109 109 Rappresentazioni grafiche Gli areogrammi sono grafici in cui le frequenze o le quantità di una variabile qualitativa sono rappresentate da superfici di figure piane, come quadrati, rettangoli o, più frequentemente, cerchi oppure loro parti. La rappresentazione può essere fatta sia con più figure dello stesso tipo, aventi superfici proporzionali alle frequenze o quantità, sia con un'unica figura suddivisa in parti proporzionali. Nel caso dei diagrammi circolari o a torta, si divide un cerchio in parti proporzionali alle classi di frequenza. Gli areogrammi vengono usati soprattutto per rappresentare frequenze percentuali; hanno il vantaggio di fare capire con immediatezza che la somma di tutte le classi è uguale all’unità (1 o 100%); hanno l’inconveniente che evidenziano con estrema difficoltà le differenze che non sono molto marcate. Per differenze piccole, si dimostrano meno efficaci degli ortogrammi.

110 110 Rappresentazioni grafiche Aerogrammi o digrammi circolari

111 111 Rappresentazioni grafiche Con i diagrammi a figure, detti anche diagrammi simbolici o pittogrammi, la frequenza di ogni carattere qualitativo viene rappresentata da una figura, sovente stilizzata, oppure da simboli che ricordano facilmente l'oggetto. E’ una specie di istogramma costruito con figure, dove l’altezza della figura deve essere proporzionale alla frequenza, quando le basi sono uguali. Questi diagrammi a figure hanno tuttavia il grave inconveniente di prestarsi a trarre in inganno con facilità il lettore inesperto di statistica, quando sono stati costruiti con malizia; è pure facile che un ricercatore non sufficientemente esperto li costruisca in modo sbagliato, generando non volutamente il sospetto che egli abbia voluto fornire una impressione di differenza tra i gruppi a confronto non supportata dai dati.

112 112 Rappresentazioni grafiche Diagrammi a figure

113 113 Rappresentazioni grafiche Diagrammi a figure

114 114 Rappresentazioni grafiche Il cartogramma evidenzia distribuzioni territoriali mediante carte geografiche, in cui nelle località interessate sono riportati cerchi proporzionali alle frequenze. E’ il caso delle città segnate su carte geografiche con cerchi di dimensioni proporzionali al numero di abitanti. Questi cerchi spesso sono solo simboli, illustrati nelle didascalie: per cui un solo cerchio bianco spesso indica una quantità di base (es.: 1.000 persone), due cerchi concentrici indicano una quantità maggiore, anche in modo non proporzionale (es.: 20.000 persone), tre cerchi o un cerchio annerito una quantità ancora superiore (es.: 100.000 persone) e così via. E’ importante ricordare che, quando costruiti in modo proporzionale, anche queste rappresentazioni grafiche sono essenzialmente areogrammi e quindi possono trarre in inganno se ad essere proporzionale alle frequenze è il raggio.

115 115 Rappresentazioni grafiche Per dati quantitativi, riferiti a variabili continue misurate su scale ad intervalli o di rapporti, di norma si ricorre a istogrammi o poligoni. Gli istogrammi sono grafici a barre verticali (per questo detti anche diagrammi a rettangoli accostati).

116 116 Rappresentazioni grafiche Istogrammi

117 117 Rappresentazioni grafiche Diagramma cartesiano

118 118 Rappresentazioni grafiche Sequenza di vari tipi di grafici

119 119 Rappresentazioni grafiche Sequenza di vari tipi di grafici

120 120 Rappresentazioni grafiche Sequenza di vari tipi di grafici

121 121 Rappresentazioni grafiche Sequenza di vari tipi di grafici

122 122 Rappresentazioni grafiche Sequenza di vari tipi di grafici

123 123 Rappresentazioni grafiche Sequenza di vari tipi di grafici

124 124 Rappresentazioni grafiche Sequenza di vari tipi di grafici

125 125 Rappresentazioni grafiche Sequenza di vari tipi di grafici

126 126 Rappresentazioni grafiche Sequenza di vari tipi di grafici

127 127 Rappresentazioni grafiche Sequenza di vari tipi di grafici

128 128 Rappresentazioni grafiche Sequenza di vari tipi di grafici

129 129 Rappresentazioni grafiche Sequenza di vari tipi di grafici

130 130 Rappresentazioni grafiche Sequenza di vari tipi di grafici

131 131 Rappresentazioni grafiche Sequenza di vari tipi di grafici

132 132 Rappresentazioni grafiche Sequenza di vari tipi di grafici

133 133 Rappresentazioni grafiche Sequenza di vari tipi di grafici

134 134 Rappresentazioni grafiche Sequenza di vari tipi di grafici

135 135 Rappresentazioni grafiche

136 136 Rappresentazioni grafiche

137 137 Rappresentazioni grafiche

138 138 Rappresentazioni grafiche

139 139 Rappresentazioni grafiche

140 140 Rappresentazioni grafiche

141 141 Rappresentazioni grafiche

142 142 Glossario Statistica: è un campo di studio concernente la raccolta, l’organizzazione, la sintesi e l’analisi dei dati e l’operazione di inferenza (deduzione) su un corpo di dati, quando soltanto una parte di essa è osservata. Statistica descrittiva: descrive il fenomeno sulla base dei risultati contenuti nel campione. Non si vuole estendere i risultati a tutta una popolazione. Pertanto serve a conoscere e rappresentare in maniera sintetica l’andamento delle variabili in una popolazione. La statistica descrittiva opera sulla popolazione o sul campione e consente di organizzare e sintetizzare i dati. Gli strumenti della statistica descrittiva sono: metodi grafici, misure di sintesi, indici.

143 143 Statistica induttiva o inferenziale o deduttiva: cerca di estendere i risultati ottenuti sul campione all’intera popolazione. Per poter estendere i risultati occorre che il campione sia scelto con criterio (casuale). Quindi serve prendere delle decisioni su un gran numero di dati esaminando soltanto una piccola parte di essi. La statistica induttiva consente di prevenire, attraverso l’inferenza statistica, ad una conclusione su una popolazione su una base dell’informazione contenuta in un campione che è stato estratto da quella popolazione. Gli strumenti della statistica inferenziale: stimatori, intervalli di confidenza, verifiche di ipotesi. Probabilità: tecniche connesse al trattamento della casualità e alla descrizione dei modelli teorici. Glossario

144 144 Fenomeno statistico: l’oggetto della nostra indagine. Unità statistica sono gli elementi o casi componenti il fenomeno collettivo, che costituiscono l’oggetto diretto dell’osservazione. Popolazione (o collettivo statistico) è l’insieme di tutte le unità statistiche accomunate da una o più caratteristiche, ovvero l’insieme degli individui portatori della caratteristica di interesse. Censimento: Indagine che viene affettuata sull’intera popolazione Campione: parte rappresentativa della popolazione, ovvero sottogruppo o sottoinsieme della popolazione oggetto dello studio scelto in modo opportuno. Glossario

145 145 Modello: oggetto teorico che descrive le caratteristiche principali e più importanti del fenomeno. Carattere: aspetto, caratteristica, attributo di una unità statistica; esso coincide con il fenomeno oggetto di studio quando questo è direttamente osservabile su ciascuna unità. Modalità: Ogni diversa presentazione del carattere osservato su ciascuna unità statistica. Devono essere esaustive rispetto al carattere e mutuamente esclusive (per ogni unità deve risultare individuabile una sola modalità.) Esempio: il carattere sesso si presenta in due modalità: maschile e femminile. Glossario

146 146 Carattere qualitativo: carattere che viene descritto da attributi (Esempio: sesso, colore, gruppo sanguigno.) Carattere quantitativo: carattere che viene descritto da numeri (Esempio: età, voto, peso.) Carattere discreto: è un carattere che può assumere solo valori specifici o particolari; non ci non vi sono valori intermedi (Esempio: il numero di auto in un garage è un numero intero e non decimale.) Carattere continuo: carattere che non si limitano ad assumere solo determinati valori (Esempio: l’altezza di persone non è un numero fisso o discreto, ma può assumere un valore qualsiasi.) Glossario

147 147 Variabile statistica: caratteristica che assume valori diversi su diverse persone, luoghi, cose. Le variabili statistiche sono tutte quelle caratteristiche che variano al vaiare dei componenti dela popolazione. (Esempio: l’altezza dei ragazzi, il peso di alunni, il voto in una disciplina.) Variabile statistica quantitativa: Sono variabili che possono essere misurate: (Esempio, età, peso, statura, voto.) Variabili statistica qualitative: Sono variabili che non possono essere misurate, ma possono solo essere divise in categorie, cioè possono solo essere classificate (esempio: colore dei capelli, appartenenza ad un gruppo etnico, sesso.) Variabile statistica empirica: Sono variabili sperimentali ricavate in modo diretto attraverso la misurazione dei caratteri del collettivo statistico o ricavate indirettamente da registri o da altre fonti. Glossario

148 148 Variabili statistiche teoriche: Sono variabili ottenute mediante elaborazioni matematiche (Esempio: la media.) Variabile casuale: Variabile i cui valori sono il risultato di fattori casuali, che non possono essere esattamente predetti anticipatamente (Esempio: l’altezza di una persona da adulto, in quanto non si può predire, quando un bambino nasce, quale sia esattamente la sua statura raggiunta da adulto, che dipende da numerosi fattori sia genetici che ambientali.) Variabile continua: La variabile continua è una variabile che può assumere un qualsiasi valore. Glossario

149 149 Frequenza, o frequenza assoluta: La frequenza, o frequenza assoluta, F, è il numero di volte in cui è stata osservata una certa modalità nel campione studiato. Frequenza relativa: la frequenza relativa, f, è il rapporto tra la frequenza assoluta, F, ed il numero totale, N, delle unità statistiche, o delle osservazioni osservate di una certa modalità. Frequenza percentuale: La frequenza percentuale è la frequenza relativa rapportata a 100. Si ottiene moltiplicando la frequenza relativa per 100. Glossario

150 150 Frequenza cumulata: La frequenza cumulata è la somma delle frequenze delle modalità inferiori o uguali ad una data modalità. È il numero di unità statistiche che hanno più modalità. La frequenza cumulata offre informazioni importanti quando si intende stimare il numero totale di osservazioni inferiore (o superiore) ad un valore prefissato. Glossario

151 151 Classe: Suddivisione in intervalli dell’insieme dei valori, che possono assumere le variabili. In generale, la suddivisioni in classi dell’insieme dei valori avviene quando i valori delle osservazioni sono numeri decimali (esempio: le altezze delle persone; la media dei voti conseguiti dagli alunni), oppure quando il numero di osservazioni è elevato. Intervallo: Insieme di valori compresi tra due numeri assegnati (esempio: l’intervallo [7 – 7,5] è l’insieme di tutte le medie degli alunni comprese tra i valori 7 e 7,5. tale intervallo si chiama classe. Frequenza di classe: Numero di osservazioni di una variabile che cadono all’interno di una classe. Glossario

152 152 Valore centrale della classe: Punto o valore medio tra gli estremi di una classe, che si ottiene dividendo per due la somma degli estremi dell’intervallo di una classe. Il valore medio della classe [7 - 7,5] è: Serie statistiche: Tabelle che nella prima colonna riportano le modalità di un carattere qualitativo. Seriazioni statistiche: Tabelle che nella prima colonna riportano un carattere quantitativo. Glossario

153 153 Medie di calcolo: Sono medie che si calcolano tenendo conto di tutti i valori della distribuzione (media aritmetica, media ponderata, media geometrica, media armonica, media quadratica). Medie di posizione: Sono medie che calcolano tenedo conto solo di alcuni valori (mediana, moda). Media aritmetica: Dati n numeri x 1, x 2, x 3, …, x n, la media aritmetica, M, è il quoziente tra la somma di tutti i numeri ed il numero n. Glossario

154 154 Media aritmetica ponderata: Dati i numeri x 1, x 2, x 3, …, x n, e le relative frequenze o pesi F 1, F 2, F 3, …, F n, si chiama media aritmetica ponderata, P, è il quoziente tra la somma dei prodotti tra i numeri e le frequenze e la somma della frequenze. Mediana: Glossario

155 155 Bibliografia Testi scolastici consultati: Bergamini-Trifone-Barozzi: Matematica.verde vol. 1 Acquaviva-Cornelli-Puppo: Matematica Vol. 2 Re Franceschini-Grazzi: Moduli.mat – Statistica e probabilità tomoD Andreini-Manara-Prestipino-Saporiti: Pensare e fare matematica, Algebra 1 Silvestri: Statistica medica – 01 statistica (file internet)

156 156 Testi scolastici consultati: Silvestri: Statistica medica – 02 statistica (file internet) Bibliografia


Scaricare ppt "1 STATISTICA. 2 Perché la Statistica Nei fenomeni collettivi, cioè in quei fenomeni, in senso generale, in cui gli elementi coinvolti sono molti, non."

Presentazioni simili


Annunci Google