La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Presentazione a cura della prof.ssa ANNUNZIATA DI BIASE Dicembre 2014.

Presentazioni simili


Presentazione sul tema: "Presentazione a cura della prof.ssa ANNUNZIATA DI BIASE Dicembre 2014."— Transcript della presentazione:

1 Presentazione a cura della prof.ssa ANNUNZIATA DI BIASE Dicembre 2014

2  Statistica descrittiva e inferenziale  Rappresentazioni grafiche  Indici di sintesi e di dispersione

3 Il termine statistica ha una radice italiana e cioè deriva dalla parola “STATO”. Questa definizione apparve per la prima volta nel 1589 ad opera di Ghislin, che la indicò come “descrizione delle qualità che caratterizzano gli elementi che compongono uno Stato”. Nella sua prima eccezione, quindi, la statistica è principalmente lo studio di informazioni di interesse nazionale. Solo in un secondo momento, questa disciplina cominciò ad allargare i propri confini e ad assumere il significato più generale di analisi quantitativa dei fenomeni collettivi che hanno attitudine a variare.

4 La statistica è lo studio dei fenomeni collettivi (ossia di quei fenomeni che riguardano una pluralità di soggetti), che hanno attitudine a variare. Essa si occupa di raccogliere ed analizzare dati, relativi ad un gruppo di persone (studenti di una scuola, elettori di una regione, abitanti di un quartiere,…) o oggetti (automobili, dischi, libri,…) per trarre conclusioni e fare previsioni.

5 La statistica può essere: descrittiva o inferenziale. La statistica descrittiva: E’ un’ indagine che si occupa della raccolta, dell’elaborazione dei dati e della descrizione dei fenomeni collettivi o di massa. Essa si occupa di descrivere la massa dei dati sperimentali con pochi numeri o grafici significativi. Quindi, per così dire si occupa di fotografare una data situazione e di sintetizzarne le caratteristiche salienti. La statistica inferenziale o induttiva: Studia le modalità con cui è possibile estendere all’intero universo statistico le conclusioni di un’ indagine svolta su di un campione e permette di valutare il grado di attendibilità di tali conclusioni. Essa utilizza i dati statistici, anche opportunamente sintetizzati dalla statistica descrittiva, per fare previsioni di tipo probabilistico su situazioni future o comunque incerte.

6

7

8

9

10 POPOLAZIONE STATISTICA o COLLETTIVITA’: insieme di elementi che presentano una o più caratteristiche comuni. CAMPIONE: gruppo di elementi su cui si compie l’indagine statistica e deve rappresentare la popolazione. UNITA’ STATISTICA: ogni elemento della popolazione. FENOMENI QUALITATIVI:fenomeni rappresentati attraverso le parole. FENOMENI QUANTITATIVI: fenomeni rappresentati attraverso i numeri. CARATTERE: aspetto che si va ad individuare durante un indagine statistica. MODALITA’: modalità di risposta che può essere qualitativo o quantitativo.

11

12 L’INDAGINE STATISTICA E LE SUE FASI 1.IMPOSTAZIONE DELL’INDAGINE STATISTICA 2.RILEVAZIONE DEI DATI 3.SPOGLIO E TRASCRIZIONE DEI DATI DEI DATI 4. ELABORAZIONE DATI Per INDAGINE STATISTICA si intende un’insieme di attività finalizzate ad approfondire la conoscenza di un fenomeno. Le sue FASI sono:

13

14 1) IMPOSTAZIONE DELL’INDAGINE STATISTICA In questa prima fase occorre precisare: LOSCOPO DELLA RICERCA  LO SCOPO DELLA RICERCA GLI OBIETTIVI CHE SI VOGLIONO  GLI OBIETTIVI CHE SI VOGLIONO RAGGIUNGERE RAGGIUNGERE LE UNITÀ STATISTICHE OGGETTO DI INDAGINI  LE UNITÀ STATISTICHE OGGETTO DI INDAGINI

15  NATURA DEI CARATTERI I caratteri (dati raccolti) possono essere di natura QUANTITATIVA oppure QUALITATIVA. I caratteri o dati qualitativi (o mutabili) sono rappresentati da aggettivi (nazionalità, religione, ecc). I caratteri o dati quantitativi (o variabili) sono espressi da numeri (altezza, peso, ecc.).  MODALITA’ DI UN CARATTERE Le modalità sono i diversi aspetti che un carattere può assumere. Esempio: M ed F sono le 2 modalità del carattere sesso. In una rilevazione dei dati i caratteri stanno ad indicare l’ insieme dei fenomeni oggetto di studio riguardanti le caratteristiche che differenziano tra loro le unità statistiche.

16  NATURA DI UNA MODALITA’ Carattere qualitativo Carattere quantitativo può essere Nominale o sconnesso Ordinale o ordinato può essere Discreto o discontinuo Continuo Le modalità NON si possono ordinare secondo una scala di misurazione. Es. credo religioso, malattie, colore degli occhi, … Le modalità si possono ordinare secondo una scala di misurazione. Es. giudizi, titolo di studio, i giorni della settimana,... Le modalità sono numeri INTERI. Es. numero fratelli, figli, le pagine di un libro, i viaggi annuali, … Le modalità sono numeri REALI. Es. età. altezza, peso, reddito, …

17

18 Carattere qualitativo nominale o sconnesso Esempi: 1. Carattere: Sesso - modalità: M, F 2. Carattere: Corso di Laurea – modalità: Med. Ing. Sc.Pol. Giur. Stat. Mat. 3. Carattere: Provincia – modalità: Cz, Mi, Na, Pa, RM 4. Carattere: Religione – modalità: Cat., Mus.,. Ebreo, Indù, Taoista Carattere qualitativo ordinale o ordinato Esempi: 1. Carattere: Giudizio – modalità: Suff. Buono, Ottimo 2. Carattere: Posizione graduatoria:- modalità: I II III IV V 3. Carattere: Classe Soc.- modalità: Bassa, Media, Alta 4. Carattere: Titolo Studio – modalità: Nessuno, Elem., Med.inf., Med.sup., Laurea.

19 Carattere quantitativo discreto o discontinuo Esempi: 1. Carattere: N° componenti famiglia – modalità: Carattere: N° posti letto ospedale – modalità: Carattere: Residenti comune – modalità: Carattere quantitativo continuo Esempi: 1. Carattere: Precipitazioni in pollici a Torino nel mese di aprile (20 giorni) – modalità: Carattere: Altezza maschi Italiani – modalità: 175,3 168,4 187,1 158,4 167, ,

20 2) RILEVAZIONE DEI DATI – CARATTERI Per rilevare dati statistici, è fondamentale sapere esattamente COSA si vuole misurare e COME. In questa fase occorre individuare in modo PRECISO la caratteristica (CARATTERE) della popolazione che vogliamo sottoporre a studio.  TECNICA DI RACCOLTA DEI DATI Tecnicamente, la raccolta dei dati può essere fatta in modi diversi: misurazioni, questionario ecc.., tuttavia la raccolta più seguita è quella dell’ INTERVISTA DIRETTA o INDIRETTA. L’intervista diretta prevede domande poste direttamente dall’intervistatore. L’intervista indiretta prevede il riempimento di un questionario a risposte aperte o chiuse che l’intervistato deve riempire in tutte le sue parti come il censimento (in Italia il censimento si effettua ogni dieci anni (anni in cui l’ultima cifra è 1, come l’ultimo che è stato rilevato nel 2011, i precedenti 2001,1991,…,1861 (anno dell’unità d’Italia)) il prossimo sarà nel 2021).

21  METODI DI RILEVAZIONE DEI DATI La rilevazione dei dati può essere effettuata su tutta la popolazione oggetto di studio, cioè su tutto l’UNIVERSO, oppure su una porzione di esso, cioè su un CAMPIONE. Gli elementi della popolazione studiata prendono il nome di UNITA’ STATISTICHE.

22

23 Questionario sull’impiego del tempo libero Esempio di intervista indiretta: Dati generali 1 Cittadinanza Sesso M F 3 Età Peso Altezza Dati specifici 6 Pratichi uno sport SI NO 8 Ascolti la musica SI NO 9 Suoni qualche strumento SI NO 11 Guardi la televisione SI NO 12 Frequenti discoteche SI NO 13 Vai al cinema SI NO 14 Ti dedichi alla lettura SI NO 15 Coltivi qualche hobby Si NO 16 Pratichi volontariato SI NO

24 Una distribuzione statistica serve ordinare e classificare i soggetti secondo un certo criterio. Le distribuzioni statistiche derivano dall’operazione di classificazione delle unità considerate secondo le modalità di uno o più caratteri. Se si riferisce ad un solo carattere la distribuzione statistica si definisce SEMPLICE. Se si riferisce a 2, 3,….N caratteri allora la distribuzione statistica si definisce DOPPIA, TRIPLA,…MULTIPLA. Se il carattere considerato è qualitativo la distribuzione statistica si chiama anche SERIE STATISTICA. Se il carattere è quantitativo allora si parla di SERIAZIONE STATISTICA. DISTRIBUZIONE STATISTICHE DISTRIBUZIONE STATISTICHE

25  ORGANI PREPOSTI ALLA RACCOLTA DEI DATI La raccolta dei dati può essere fatta da CHIUNQUE abbia interesse a fare una ricerca statistica. In Italia l’organo più importante che si occupa della raccolta dei dati e della loro successiva elaborazione è L’ISTITUTO CENTRALE DI STATISTICA (sigla ISTAT)

26 SCHEMA RIASSUNTIVO La statistica è lo studio quantitativo di un fenomeno collettivo: si studia individuando il collettivo statistico o popolazione statistica che è l’insieme delle unità statistiche: i singoli casi rispetto ai quali il fenomeno si manifesta le caratteristiche, dette caratteri, delle unità statistiche che ci sembrano rilevanti per la descrizione del fenomeno stesso Il modo in cui ogni carattere si manifesta nelle unità statistiche viene descritto attraverso delle modalità Un carattere può essere di tipo Qualitativo se le modalità si esprimono tramite aggettivi e sostantivi e possono essere Quantitativo se le modalità si esprimono tramite numeri e possono essere Ordinale o ordinate se si può stabilire un ordine Discrete o discontinue se vengono descritte da numeri interi continue se vengono descritte da numeri reali Nominale o sconnesse: se non possono essere ordinate

27 3) SPOGLIO E TRASCRIZIONE DEI DATI 3) SPOGLIO E TRASCRIZIONE DEI DATI Per lo spoglio dei dati occorre utilizzare un’operazione semplice, ma fondamentale che è il CONTEGGIO. Infatti dopo la rilevazione dei dati occorre contare quante volte una modalità di un carattere si è ripetuta cioè con che frequenza si è ripetuta. Dopo aver contato i dati, vengono scritti in tabelle (rappresentazione numerica) che possono essere semplici o composte. Una TABELLA SEMPLICE è formata da DUE COLONNE e consente la classificazione dei dati rispetto ad un SOLO CARATTERE. Una TABELLA COMPOSTA è formata da PIÙ COLONNE, e consente la classificazione dei dati rispetto a PIÙ CARATTERI

28 1) TABELLA SEMPLICE Orario (h) Temperatura (°C) ESEMPIO: Riportiamo in una TABELLA SEMPLICE i DATI riguardanti le TEMPERATURE registrate durante una giornata autunnale ad intervalli di sei ore: 1) h=0; T=2°C; 2) h=6;T=2°C; 3) h=12;T=11°C; 4) h=18;T=8°C; 5) h=24;T=4°C dati tabella semplice

29 2) TABELLA COMPOSTA ESEMPIO: Riportiamo in una TABELLA COMPOSTA i DATI riguardanti le ALTEZZE (h) ed i PESI (P) di una famiglia di quattro persone: 1) Padre; h = 175 cm; p = 80 kg; 2) Madre: h = 170 cm; p = 64 kg; 3) Figlio h = 180 cm; p = 74 kg; 4) Figlia h = 173 cm; p = 60 kg dati tabella composta Componente nucleo altezza h = cm peso P = kg Padre17580 Madre17064 Figlio18074 Figlia17360

30 4) ELABORAZIONE DEI DATI 4) ELABORAZIONE DEI DATI In questa fase i dati vengono sottoposti ad una elaborazione matematica il cui scopo è quello di esprimere i risultati dell’indagine in modo sintetico, mediante: 2. rappresentazione grafica dei dati 3. Indici di centralità 1. rappresentazione numerica dei dati e relative frequenze

31 RAPPRESENTAZIONE DEI DATI STATISTICI Rappresentazione numerica dei dati: Rappresentazione grafica dei dati: La rappresentazione dei dati può essere NUMERICA e GRAFICA TABELLE SEMPLICI 1) TABELLE SEMPLICI 2) TABELLE COMPOSTE DIAGRAMMI CARTESIANI 1) DIAGRAMMI CARTESIANI 2) ISTOGRAMMI 3) IDEOGRAMMI 4) DIAGRAMMI A TORTA

32 FREQUENZE ASSOLUTE La FREQUENZA ASSOLUTA indica quante volte la MODALITÀ di un CARATTERE si ripete. Colore capelli (carattere) N° persone (frequenza assoluta) Neri 10 Castani 6 Rossi 1 Biondi 5 totale 22 Frequenze assolute carattere modalità

33 FREQUENZE RELATIVE La frequenza relativa di una certa modalità è data dal rapporto tra la frequenza assoluta di tale modalità ed il numero totale dei casi. Spesso si esprime la frequenza relativa in forma percentuale. Le FREQUENZE ASSOLUTE, di due distribuzioni di dati, anche della stessa specie, non sono confrontabili in quanto si riferiscono, in generale, ad un diverso numero di casi complessivi. Questo inconveniente viene superato introducendo il concetto di FREQUENZA RELATIVA Frequenza relativa = frequenza assoluta / totale casi

34 Colore capelli (carattere) N° persone (frequenza assoluta) Frequenza Relativa (f.a./totale) Neri100,46 Castani60,28 Rossi10,02 Biondi5 24 totale221 Frequenze relative Esempio:

35 FREQUENZE RELATIVE PERCENTUALI La frequenza relativa percentuale di una certa modalità è data dalla frequenza relativa moltiplicata per 100. Frequenza relativa percentuale = frequenza relativa per 100

36 Colore capelli (carattere) N° persone (frequenza assoluta) Frequenza Relativa (f.a./totale) Frequenza Relativa % Neri100,454545,45 Castani60,272727,27 Rossi10,04554,55 Biondi50,227222,72 totale Esempio: Frequenze percentuali

37 Consideriamo un carattere le cui modalità siano ordinate. Si chiama frequenza cumulata (assoluta o relativa) della modalità x la somma delle frequenze (assolute o relative) della modalità x e di tutte quelle modalità che precedono la x. Si chiama frequenza retrocumulata (assoluta o relativa) della modalità x la somma delle frequenze (assolute o relative) della modalità x e di tutte quelle modalità che seguono la x. FREQUENZA CUMULATA E RETROCUMULATA

38 Colore capelli (carattere) N° persone (frequenza assoluta) Frequenza. Cum assoluta Frequenza Retrocumulata assoluta Rossi11+0= = 44 Biondi55+1= =43 Castani66+5+1= =38 Neri = =32 totale = =22 Esempio:

39 SCHEMA RIASSUNTIVO Lo spoglio dei questionari o delle schede di rilevazione porta alla costruzione della tabella o matrice dei dati grezzi: tabella in cui a ogni unità statistica compete una riga nella quale sono specificate le modalità che la descrivono in riferimento ai caratteri studiati; da essa si ottengono le tabelle di frequenza la frequenza di una modalità può essere assoluta: numero delle modalità da esso descritte relativa: rapporto tra la frequenza assoluta e la numerosità del collettivo considerato può anche essere espressa in forma percentuale. Essa serve a confrontare due collettivi distinti e a valutare il “ peso” di una modalità rispetto alla totalità del collettivo per ogni modalità contengono la frequenza corrispondente cumulata: somma delle frequenze di tutte le modalità minori o uguali alla modalità considerata retrocumulata: somma delle frequenze di tutte le modalità maggiori o uguali alla modalità considerata

40 In una tabella di frequenza a ogni modalità di un carattere è associato un numero che rappresenta la frequenza di quella modalità. Non è difficile riconoscere che ci troviamo di fronte a una funzione. Si chiama distribuzione di frequenza la funzione che associa a ogni modalità ad un dato carattere la sua frequenza. Il dominio di una distribuzione di frequenza è l’insieme delle modalità di un carattere. DISTRIBUZIONE DI FREQUENZA

41 CLASSI DI FREQUENZE Si definisce ampiezza di una classe la differenza tra l’estremo superiore e l’estremo inferiore della stessa. Le classi possono essere: 1.di pari ampiezza (equi- ampie) 2.di pari frequenza (equi- frequenti ). Se in una DISTRIBUZIONE i dati sono molto NUMEROSI, allora i valori dei caratteri possono essere raggruppati in classi; nel caso di caratteri quantitativi le classi sono sovente intervalli di valori, i cui valori estremi siano compresi in uno e un solo intervallo (estremo inferiore escluso, superiore incluso). La suddivisione in classi consente di determinare le frequenze assolute e relative delle classi in luogo delle singole modalità.

42 Le regole fondamentali per la suddivisione in classi dei valori del carattere rilevati sono le seguenti: 1.Le classi devono essere esaustive: ogni valore deve appartenere ad almeno una classe; 2. le classi devono essere a due a due disgiunte, quindi ogni valore deve appartenere ad una sola classe (in modo da evitare che esso sia considerato due volte e quindi siano contate due volte le unità statistiche che hanno come determinazione del carattere quel valore ); 3.le classi devono essere ordinate in modo che i valori della prima precedono tutti quelli della seconda classe e quelli della seconda precedono quelli della terza classe e cosi via. REGOLE PER LA COSTRUZIONE DELLE CLASSI

43 I raggruppamenti delle classi possono essere operati in modo diverso, ma devono essere ordinate in ordine crescente. Di ogni classe si calcola: l’ampiezza, la densità di frequenza (se le ampiezze delle classi sono diverse) e il valore centrale. Ampiezza = differenza tra l’estremo superiore e l’estremo inferiore. Densità di frequenza = rapporto tra la frequenza relativa e l’ampiezza. Valore centrale = media aritmetica tra l’estremo inferiore e l’estremo superiore.

44 TRASCRIZIONE DEI DATI PER CLASSI La rappresentazione di una DISTRIBUZIONE DI DATI PER CLASSI, si presenta VANTAGGIOSA quando i dati sono molto NUMEROSI. Rappresentazione numerica Rappresentazione per classi di peso CLASSI DI PESO (termini) N° STUDENTI (frequenze) 50 – 60 Kg4 60 – 70 Kg7 70 – 80 Kg3 totale14 L’ informazione, diviene meno precisa nel caso di una distribuzione per classi, tuttavia la visione della distribuzione diventa più semplice e rapida PESO (Kg) (termini) N° STUDENTI (frequenze) TOTALE14 ESEMPIOESEMPIO

45 RAPPRESENTAZIONI GRAFICHE dei dati statistici I GRAFICI possono essere di diverso tipo : Le INFORMAZIONI che derivano da una raccolta dati sono più evidenti se sono visualizzate attraverso GRAFICI Rappresentazioni grafiche dei dati: 1)DIAGRAMMI CARTESIANI 2)ORTOGRAMMI - ISTOGRAMMI 3) DIAGRAMMI A TORTA 4)IDEOGRAMMI

46 Le rappresentazioni grafiche hanno l’obiettivo di illustrare, mediante: -figure, -linee o segmenti, -superfici o aree, -solidi, -simboli convenzionali -ecc. una distribuzione di frequenze o delle modalità di uno o più caratteri.

47 Per massimizzare l’efficacia di un grafico l’attenzione deve essere concentrata sui dati. Pertanto le componenti di supporto: Devono essere presenti solo se necessarie: titoli degli assi, legende e etichette in alcuni casi possono essere essenziali per la comprensione del grafico, ma in altri possono essere del tutto inutili. Devono essere lievi: è preferibile usare linee più leggere per gli assi e per la griglia e linee più marcate per i dati. Gli effetti decorativi non devono allontanare l’attenzione del lettore dai dati.

48 Il grafico a destra è più facile da leggere. Il ricorso a poche componenti di supporto permette di concentrare l’attenzione sui dati. Nel grafico tutte le componenti hanno il massimo impatto. Il risultato è un grafico confuso, difficile da leggere anche se sono presenti solo 3 valori.

49 1.Diagrammi cartesiani 2.Diagrammi cartesiani a segmenti 3. Istogrammi 3. Poligono di frequenza

50 DIAGRAMMA CARTESIANO Esempio: Riportiamo su di un DIAGRAMMA CARTESIANO le TEMPERATURE registrare ogni sei ore, durante una giornata autunnale : 1) h=0; T=2°c2) h=6;T=2°C 3) h=12;T=11°C 4) h=18;T=6°C 5) h=24;T=4°C dati Grafico T (°C) Un DIAGRAMMA CARTESIANO è formato da due RETTE (assi) perpendicolari tra loro, l’asse ORIZZONTALE si chiama ASCISSA (asse X), l’asse VERTICALE si chiama ORDINATA (asse Y). Su di essi vengono riportati i dati statistici, viene usato per rappresentare le SERIE STORICHE h (ore) DIAGRAMMA CARTESIANO Y X (0;2)(0;2) (6;2)(6;2) (12;11) (18;6) (24;4) Basta riportare sull’ asse X il Tempo e sull’ asse Y le Temperature

51 Esempio: Riportiamo in un ISTOGRAMMA le marche di cellulari più in uso fra i giovani : NOKIA (300), SIEMENS (240), SAMSUG (120), PANASONIC (80), MOTOROLA (50) L’ISTOGRAMMA è un grafico a colonne: le colonne (rettangoli) hanno basi uguali e possono essere disegnate una vicino all’altra. L’altezza è proporzionale alla frequenza di ciascun dato. Vien usato nei caratteri quantitativi CONTINUI. 320_ 280_ 240_ 200_ 160_ 120_ 180_ 140_ Noki Siem Sams Pana Moto ISTOGRAMMA

52 Gli istogrammi si impiegano per rappresentare graficamente distribuzioni di frequenza di caratteri quantitativi le cui modalità sono costituite da classi di valori. A tal fine occorre distinguere due casi, ovvero: 1.Le classi di valori hanno uguale ampiezza. In questo caso avremo tanti rettangoli contigui, ciascuno avente base uguale all’ampiezza della classe e altezza uguale o proporzionale alla frequenza (assoluta o relativa) assunta nell’insieme delle unità della classe.

53 2. Le classi di valori hanno diversa ampiezza. In quest’altro caso avremo una serie di rettangoli aventi basi diverse uguali all’ampiezza delle classi e altezze da calcolarsi, in modo che le frequenze siano proporzionali alle aree dei rispettivi rettangoli. In ordinata, pertanto, avremo le cosiddette densità di frequenza date dal rapporto tra la frequenza (assoluta o relativa) di ciascuna classe e la relativa ampiezza.

54 Esempio: La classe (0 ; 2) indica un intervallo chiuso con l’estremo inferiore uguale a zero e l’estremo superiore uguale a 2. Tutte le altre classi indicano degli intervalli aperti all’estremo inferiore e chiusi all’estremo superiore.

55

56 Il poligono di frequenza è una spezzata che unisce i punti aventi per ascissa i punti centrali delle classi e per ordinata la relativa frequenza. In un istogramma, il poligono delle frequenze unisce i punti medi dei lati superiori dei rettangoli; la spezzata deve essere chiusa e deve toccare l’asse delle ascisse all’esterno delle classi estreme, in modo che l’area all’interno del poligono di frequenza equivalga a quella dell’istogramma. Ogni vertice del poligono delle frequenze corrisponde al valore centrale di una classe. Il termine “poligono” è usato impropriamente perché indica una spezzata aperta (e non chiusa). Se le classi hanno la stessa ampiezza, (di solito si considerano come vertici della spezzata anche i punti corrispondenti ai valori centrali delle classi immediatamente precedenti e immediatamente successive a quelle per le quali la frequenza è diversa da zero. Queste classi hanno frequenza zero. Si può verificare che in tal modo la somma delle aree dei rettangoli dell’istogramma è uguale all’area delimitata dall’asse orizzontale e dal poligono delle frequenze. La somma delle aree dei rettangoli di un istogramma è uguale all’area sottostante il poligono delle frequenze.

57

58 Sono impiegati per rappresentare graficamente caratteri quantitativi DISCRETI, non divisi in classi, e possono configurarsi a segmenti verticali. Esempio. Numero dei componenti per famiglia, numero delle stanze delle abitazioni, numero di unità locali delle aziende e così via. Essi si costruiscono come gli usuali diagrammi cartesiani aventi due assi perpendicolari: l’asse delle ascisse (x) e l’asse delle ordinate (y), aventi origine comune in zero. Ogni coppia ordinata di valori (x i,y i ) determinerà un punto nel piano e l’insieme di tutte le coppie (x i = modalità quantitativa i-esima, y i = frequenza della modalità i-esima) determinerà l’insieme dei punti nel piano che costituiscono la rappresentazione grafica della distribuzione considerata. Per rendere maggiormente visibili tali punti, si tracciano dei segmenti verticali congiungenti l’ascissa (x i ) con il punto del piano corrispondente all’ordinata (y i ).

59 E’ da notare che in questo caso è scorretto costruire il poligono o spezzata di frequenza congiungendo tra loro i punti poiché il carattere considerato è discreto e quindi, per sua natura, non possiede i valori intermedi a quelli indicati dalle modalità quantitative. Una spezzata di frequenza che unisse tra loro le modalità, infatti, attribuirebbe anche valori intermedi alle modalità stesse.

60 1.Grafici a barre: ortogrammi o a nastri 2.Diagrammi circolari 3.Ideogrammi 4.Cartogrammi, mappe tematiche

61 I grafici a barre sono impiegati per rappresentare graficamente caratteri con modalità qualitative, serie sconnesse o rettilinee e possono essere di due tipi: 1.A colonne se sono costituiti da una successione di colonne, segmenti verticali o rettangoli (a base uguale) equidistanti, in numero pari alle modalità del carattere, e hanno altezza uguale o proporzionale alla frequenza (assoluta o relativa). Sull’asse delle ascisse (orizzontale) si riportano le modalità, sull’asse delle ordinate (verticale) si riportano le frequenze. 2.A nastri, se sono costituiti da tanti nastri (segmenti orizzontali, rettangoli) sovrapposti ed equidistanti, in numero pari alle modalità del carattere, e hanno lunghezza uguale o proporzionale alla frequenza (assoluta o relativa). Sull’asse delle ascisse (orizzontale) si riportano le frequenze, sull’asse delle ordinate (verticale) si riportano le modalità.

62 Se la rappresentazione grafica riguarda una serie sconnessa, l’ordine in cui saranno poste le modalità è arbitrario; se si tratta invece di una serie rettilinea (es. titolo di studio), le modalità saranno poste nell’ordine naturale che esse presentano nella serie. Ortogramma a colonne Ortogramma a nastri

63 Maschi(in migliaia) Femmine(in migliaia) Agricoltura Industria Altre attività In cerca di Occupazione Esempio di ortogramma: popolazione per condizione, settore di attività economica degli occupati e sesso in Italia nel 1981.

64 Gli ortogrammi si utilizzano anche per rappresentare contemporaneamente dati di segno opposto come entrate e uscite, importazioni ed esportazioni. Un esempio di ortogramma per la rappresentazione contemporanea di dati positivi e negativi è quello riportato sotto.

65 Carattere qualitativo nominale a barre verticali: ORTOGRAMMA N.B. E’ possibile costruire il diagramma a barre riportando in ordinata le frequenze assolute OPPURE le frequenze relative, la forma della rappresentazione risulta invariata.

66 principali cause di morte nell'uomo nei Paesi industrializzati (fonte: WHO)

67 Nel grafico precedente, la scala delle ascisse indica i tassi di mortalità per persone e per anno (cioè il numero di morti ogni persone in 1 anno per ogni causa considerata). In particolare, le barre verdi forniscono i valori osservati nel 1900, quelle gialle i valori del Ora, confrontando le differenze fra le barre verdi e le gialle per tutte le cause riportate nel grafico, saltano agli occhi gli enormi progressi ottenuti per le malattie infettive tubercolosi, influenza, polmonite ecc.) alcune delle quali risultano oggi pressoché scomparse nei Paesi industrializzati a cui il grafico si riferisce. La facilità con cui abbiamo acquisito informazioni dal grafico, è una conseguenza della loro visualizzazione in forma di grafico a barre: questa rappresentazione consente di cogliere le caratteristiche salienti della rilevazione statistica e di effettuare raffronti con notevole immediatezza rispetto ai soli dati numerici. Per contro, a questa maggior immediatezza di sintesi può far riscontro una diminuzione del senso critico nel valutare i dati.

68 In tal caso si traccia una CIRCONFERENZA e si procede alla sua divisione in parti proporzionali alle intensità delle componenti del fenomeno statistico. Esempio Un collezionista si ritrova con francobolli di cui: sono della Città del Vaticano, della Repubblica di S Marino e Italiani. Rappresentare il fenomeno statistico mediante un diagramma a torta. DIAGRAMMI CIRCOLARI O AEROGRAMMA L’AREOGRAMMA è un tipo di rappresentazione grafica alla quale si ricorre quando si vogliono rappresentare le parti che compongono un fenomeno statistico, usato nei caratteri qualitativi SCONNESSI. 59% 22% 19% percentuali ampiezza settori circolari AEROGRAMMA o diagramma a torta

69 I diagrammi circolari (o aereogrammi) per la loro forma circolare, sono comunemente noti come ‘‘diagrammi a torta’’. Sono particolarmente adatti alle serie sconnesse o rettilinee. Sono efficaci per mettere in evidenza l’importanza relativa delle singole modalità rispetto al totale.

70 IDEOAGRAMMA L’IDEOGRAMMA è un tipo di rappresentazione grafica nel quale il fenomeno statistico viene rappresentato mediante l’impiego di FIGURE che richiamano idealmente il contenuto del fenomeno e dove la sua frequenza è proporzionale alle DIMENSIONI oppure al NUMERO delle figure impiegate. Esempio Rappresentare mediante un ideogramma le popolazioni di due cittadine formate da e abitanti. Quando il fenomeno da rappresentare non si può rappresentare con una figura intera allora si ricorre ad una FRAZIONE di essa. Unità di riferimento = abitanti abitanti abitanti

71 I cartogrammi sono grafici utili per rappresentare serie territoriali o geografiche. Per costruire un cartogramma occorre disporre di una carta geografica o topografica in cui siano chiaramente delimitate le diverse zone, regioni, circoscrizioni (geografiche, politiche, amministrative) rispetto alle quali viene analizzata l’intensità o la frequenza di uno o più caratteri (es. nati, morti, reddito pro capite, secondo le Regioni, Province, Comuni).

72 I cartodiagrammi non sono altro che dei cartogrammi in cui, anziché delle serie territoriali semplici, vengono rappresentate delle serie territoriali di due o più caratteri. Esempio: I nati vivi e i morti per abitanti nelle 20 Regioni italiane nel 1986.

73 SCHEMA RIASSUNTIVO Caratteri qualitativi sconnessi Serie storiche Caratteri quantitativi discreti Caratteri quantitativi continui Diagramma a torta Diagramma a colonne: istogramma Diagramma a nastri o a barre Diagramma a segmento Caratteri qualitativi ordinati Serie geografiche Diagramma a colonne Diagramma a nastri Diagramma ad aste o segmenti Diagramma a colonne:istogrammi Diagramma cartesiano Diagramma a colonne: ortogrammi Cartogramma

74 La scelta della rappresentazione grafica Questi 2 grafici rappresentano la stessa distribuzione. Qual è più chiaro? Quale settore del diagramma circolare è maggiore?

75 La scelta della rappresentazione grafica Per la maggior parte delle persone è più facile confrontare segmenti piuttosto che angoli. Nel diagramma circolare i settori numero 1 e 4 sembrano identici, mentre nel diagramma a barre è evidente la differenza. E’ opportuno rappresentare la stessa distribuzione con più grafici per individuare quello che meglio rappresenta il messaggio che si vuole veicolare.

76 I grafici finora analizzati ci danno informazioni qualitative; possiamo quantificarle ricorrendo ai seguenti indici. di calcolo MEDIE ( semplici e ponderate) ( tengono conto di TUTTI i valori della distribuzione) di sintesi valori della distribuzione) di posizione MEDIANA (si calcolano tenendo (si calcolano tenendo MODA conto solo di ALCUNI valori) conto solo di ALCUNI valori) INDICI CAMPO DI VARIAZIONE O RANGE di dispersione VARIANZA SCARTO QUADRATICO MEDIO COEFFICIENTE DI VARIAZIONE

77 MEDIA ARITMETICA SEMPLICE Consideriamo una distribuzione di DATI DIVERSI UNO DALL’ALTRO: La MEDIA ARITMETICA SEMPLICE è uguale alla somma dei dati divisa per n, cioè: Le medie sono adatte a rappresentare distribuzioni di caratteri quantitativi

78 COMPITOVOTO N° 17 N° 28 N° 36 TOTALE21 Un alunno nei tre compiti di matematica ha riportato i voti presenti in tabella. Calcolare la MEDIA ARITMETICA dei voti. Dove: 21 = somma dei voti 3 = numero dei voti 7 = MEDIA ARITMETICA dei voti MEDIA ARITMETICA SEMPLICE Esempio di calcolo

79 MEDIA ARITMETICA PONDERATA Se i dati si presentano con una certa FREQUENZA o PESO allora il calcolo della media deve essere effettuato sommando ogni termine tante volte quante indica la sua frequenza. Supponiamo che: Il termine a 1 si presenta con frequenza p 1 Il termine a 2 si presenta con frequenza p 2 ………………………………………………………………………… Il termine a n si presenta con frequenza p n Il calcolo della MEDIA PONDERATA si effettua con la relazione:

80 MEDIA ARITMETICA PONDERATA Esempio di calcolo 20 Studenti di una classe, hanno ottenuti in matematica i voti riportati in tabella. Calcolare la MEDIA PONDERATA dei voti. Dove: 122 = somma dei voti 20 = numero di studenti 6,1 = MEDIA PONDERATA dei voti Voto in Matematica Numero studenti totale20

81 MEDIA PONDERATA NEL CASO DI UNA DISTIBUZIONE DI DATI PER CLASSI In questo caso ad ogni classe, viene sostituito il TERMINE CENTRALE, calcolato mediante la semisomma dei termini estremi della classe (X1-X2). I termini centrali cosi ottenuti costituiscono i termini a 1 ; a 2 ; a 3 ; ecc. della distribuzione. classefrequenza X 1 -X 2 p1p1 X 2 -X 3 p2p2 X 3 -X 4 p3p3 ecc. Termine centrale frequenze a1a1 p1p1 a2a2 p2p2 a3a3 p3p3 ecc. SEMISOMME Infine la media ponderata si calcola con la relazione

82 MEDIA PONDERATA DI UNA DISTIBUZIONE DI DATI PER CLASSI Esempio di calcolo Si fa riferimento ai dati della tabella 1 Classi di età (anni) n° persone (Frequenze) totale40 termini central i n° persone (Frequenz e) a 1 = 10 P 1 = 35 a 2 = 30P 2 = 4 a 3 = 50P 3 = 1 totale40 CALCOLO valori centrali Calcolo della media ponderata Età media = 13 anni

83 Si definisce MODA di una distribuzione di dati il termine corrispondente alla MASSIMA FREQUENZA assoluta o relativa. MODA ESEMPIO : Determinare la MODA della seguente distribuzione di voti: VOTOFREQUENZA Il termine che corrisponde alla massima frequenza (8) è il 6, pertanto: MODA = 6 La moda è particolarmente adatta a rappresentare distribuzioni di caratteri qualitativi

84 Le distribuzioni di frequenza possono essere: zeromodali: nessuna modalità ha una frequenza più elevata degli altricioè fanno tutti frequenza uguale ad 1. Esempio A = {1, 2, 3, 4, 5, 6} unimodali : c’è una sola modalità con una frequenza più elevata degli altri. Esempio: A = {1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6, 6, 7, 8} bimodali : ci sono due modalità con una frequenza più elevata degli altri. Esempio: A = {1, 2, 2, 3, 3, 3, 3, 5, 6, 6, 6, 6, 7, 7, 8, 8 } trimodali, ecc : ci sono tre,…, modalità con una frequenza più elevata degli altri. Esempio: A = {1, 2, 3, 3, 3, 3, 5, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8}. plurimodali: tutte le modalità della distribuzione hanno la stessa frequenza diversa da uno.

85 Nel caso di caratteri continui e per distribuzioni fornite per classi equi-ampie il calcolo della moda avviene mediante l’individuazione della classe modale, cioè quella caratterizzata dalla massima frequenza. Se le classi non sono equi - ampie è bene dividere la frequenza assoluta di ogni classe per l’ampiezza dell’intervallo ottenendo la cosiddetta “densità di frequenza”. La classe modale è quella con la densità di frequenza più alta. Per la determinazione della classe modale è opportuno ricorrere all'istogramma, individuando l'intervallo di altezza massima, ovvero il punto di massimo della curva. La classe con la maggiore densità media (che corrisponde all'altezza dell'istogramma) è quella modale.istogramma CLASSE MODALE

86 MEDIANA Si definisce MEDIANA il termine che occupa il POSTO CENTRALE di una distribuzione di dati ordinati in modo crescenti. La mediana è adatta a rappresentare distribuzioni di caratteri quantitativi. ESEMPIO : Determinare la MEDIANA della seguente distribuzione di voti: VOTOFREQUENZA Il TERMINE CENTRALE è il 6, infatti è quello che lascia alla sua destra e alla sua sinistra un eguale numero di termini, pertanto si ha: MEDIANA = 6 Si ordinano i dati in maniera crescente

87 87 Per caratteri quantitativi discreti: Si dispongono i valori in una serie ordinata in modo crescente o decrescente e si conta il numero totale n di dati: se n è dispari, la mediana corrisponde al valore numerico del dato che occupa la posizione (n+1)/2; se n è pari, la mediana è calcolata come la media aritmetica dei valori che occupano le posizioni (n/2) e (n/2)+1. Per caratteri quantitativi continui: Il raggruppamento in classi delle modalità consente al più di determinare la classe mediana nella quale ricade l’unità statistica che bipartisce la distribuzione ordinata delle modalità.

88 Quando i dati sono distribuiti uniformemente su entrambi i lati del picco la distribuzione è simmetrica. Quando i dati non sono distribuiti uniformemente su entrambi i lati del picco la distribuzione è asimmetrica. In una distribuzione unimodale valgono le seguenti relazioni:  media=mediana=moda ( simmetria)  moda

89

90

91 RICAPITOLANDO I principali indicatori della statistica descrittiva sono: 1.media: è la somma di tutte le N osservazioni divisa per N. Per es., per i valori [1, 2, 4, 4, 5, 7, 9, 11], la media è 43/8 2. moda: è il numero di osservazioni che compare con maggior frequenza. Per es., per i valori [1, 2, 4, 4, 5, 7, 9, 11], la moda è 4. In alcune distribuzioni, la moda può mancare, oppure essere presente per più di un valore; in questo caso, si hanno distribuzioni bimodali (due mode), trimodali (tre mode), plurimodali. 3. mediana: è il numero che compare al centro dei valori osservati, se questi sono dispari; se sono pari, è la media fra i due valori centrali. Per es., per i valori [1, 2, 4, 4, 5, 7, 9, 11], la mediana è (4 + 5)/2

92 92 Calcolare la media e la mediana di una serie di 6 dati (10,1; 10,8; 13,1; 13,9; 14,2; 14,5; ) e rappresentarle graficamente. la media è 12,85 la mediana, essendo n pari, è data dalla media aritmetica dei valori che occupano le posizioni 3 e 4 quindi sarà:

93 esempio: Disegnato l'istogramma delle frequenze (v. fig. a destra) calcolare le stime campionarie per un paziente del quale è stato registrato il seguente numero di battiti cardiaci al minuto in un periodo di 10 giorni: -[73, 72, 73, 74, 70, 76, 72, 74, 74, 73] Le stime campionarie sono: la media è data dalle osservazioni/N = ( )/10 = 73,1 la mediana, trattandosi di un insieme costituito da osservazioni in numero pari, è data dalla media dei valori centrali: 70, 72, 72, 73, 73, 73, 74, 74, 74, 76 ( )/2 = 73 la moda è bimodale, ed è costituita dai due valori più frequenti: 73 e 74

94 Prova tu ……… Esercizio Lanciando due dadi, si sono registrati i seguenti punteggi totali: 10 – 9 – 8 – 11 – 5 – 4 – 10 – 4 – 7 – 7 – 9 – 10 – 4 – 6 – 8 – 9 – 6 – 5 – 6 – 8 – 7 – 10 – 9 – 5 – 6 – 3 – 8 – 7 – 5 – 7 – organizza i dati in una tabella di frequenza 2.qual è il dato con la maggior frequenza 3. sono usciti più frequentemente risultati dispari o pari? 4. sono usciti più frequentemente risultati maggiori o minori di 7? 5. qual è la frequenza percentuale del punteggio 6? 6. Determina la MODA e la MEDIANA

95 La caratteristica dei valori misurati per un certa osservazione a distribuirsi attorno ad un valore medio è chiamato dispersione. Per misurare la dispersione o variabilità dei valori, si utilizzano indicatori statistici detti di dispersione. Il campo di variazione o range di una raccolta di dati è la differenza tra il massimo ed il minimo valore osservati: R = xmax − xmin Il campo di variazione è poco usato perchè: trascura la maggior parte dell’informazione disponibile risente eccessivamente dei valori estremi. INDICATORI DI DISPERSIONE CAMPO DI VARIAZIONE (RANGE)

96 VARIANZA (σ 2 ) La VARIANZA serve per valutare la VARIABILITÀ di un fenomeno statistico. 1)La VARIANZA è sempre POSITIVA: infatti i termini (a- M) 2 sono tutti positivi 2)La VARIANZA è uguale a ZERO se la VARIABILITÀ è nulla 3)La VARIANZA è tanto più ALTA quanto più alta è la VARIABILITÀ La VARIANZA è la media aritmetica degli scarti al quadrato, si indica con il simbolo σ 2 ( si legge sigma al quadrato ) e si calcola con la relazione:

97 Per comprendere cos’è la VARIABILITA’ di un fenomeno statistico consideriamo la tabella che segue, nella quale vengono indicati quanti televisori sono stati venduti da un commerciante nei primi tre mesi del 2003 e 2004 VARIABILITA’ DI UN FENOMENO STATISTICO Gennaio3040 febbraio3020 marzo30 totale 90 mese Si ha VARIABILITA’ quando i dati relativi ad un fenomeno statistico non sono tutti uguali. Dalla tabella si nota che nel 2003 la vendita mensile dei televisori risulta COSTANTE ( ), mentre nel 2004 essa subisce una VARIAZIONE ( ) Pertanto: 2) SI HA VARIABILITÀ nelle vendite del )NON SI HA VARIABILITÀ nelle Vendite del 2003

98 CALCOLO DELLA VARIANZA giorno1 Kg di Ciliegie 1 Kg di Angurie Scarto ciliegie Scarto al quadrato Scarto angurie Scarto al quadrato Lunedì€ 5,00€ 1,00- 0,250, ,250,0625 Martedì€ 5,10€ 1,00- 0,150, ,250,0625 Mercoledì€ 5,20€ 0,80- 0,050, ,050,0025 Giovedì€ 5,30€ 0,70+ 0,050, ,050,0025 Venerdì€ 5,40€ 0,50+ 0,150, ,250,0625 Sabato€ 5,50€ 0,50+ 0,250, ,250,0625 MEDIA€ 5,25€ 0,7500,17500,225 Essendo la VARIANZA delle angurie (0,04), maggiore della VARIANZA delle ciliegie (0,03), il prezzo delle angurie ha subito una variazione maggiore rispetto al prezzo delle ciliegie Per le ciliegie si ha: M = 5,25 e σ 2 = 0,175/6 = 0,03 Per le angurie si ha: M = 0,75 e σ 2 = 0,225/6 = 0,04 I prezzi di CILIEGIE ed ANGURIE, in una settimana, variano secondo i dati riportati in tabella. Stabilire in base al calcolo della VARIANZA quale dei due prodotti ha subito una maggiore variazione di prezzo.

99 SCARTO QUADRATICO MEDIO (σ) o deviazione standard A volte per misurare il grado di VARIABILITÀ di una distribuzione di dati, si preferisce ricorrere allo SCARTO QUADRATICO MEDIO cioè alla RADICE QUADRATA della VARIANZA. La deviazione standard, scarto tipo o scarto quadratico medio è un indice di dispersione statistico, vale a dire una stima della variabilità di una popolazione di dati o di una variabile casuale. La deviazione standard è data dalla RADICE QUADRATA della VARIANZA.indice di dispersionestatisticopopolazionevariabile casuale L’IMPORTANZA dello scarto quadratico medio risiede nel fatto che esso permette di giungere al concetto di NORMALITA’ nel campo statistico.

100 Il coefficiente di variazione, definito dal rapporto fra deviazione standard e la media aritmetica dei dati, V = σ/ m (m = media aritmetica dei dati, con m diverso da zero) fornisce una indicazione della variabilità delle osservazioni rilevate. In particolare, se: V = 1, allora σ = m e la media non è un indice corretto; V = 0, allora σ = 0 e la media è un indice perfetto; V > 0.5, la media non è un indice corretto; V ≤ 0.5, la media è un indice corretto. COEFFICIENTE DI VARIAZIONE

101 NELLA NORMA Un CARATTERE su cui si indaga si dice compreso NELLA NORMA quando esso non differisce dal CARATTERE MEDIO di più o di meno tre volte lo SCARTO QUADRATICO MEDIO. Esempio: Se una popolazione evidenzia un’ALTEZZA MEDIA H = 175 cm con uno SCARTO QUADRATICO MEDIO σ = 5 cm, possiamo dire che: Un’ALTEZZA rientra NELLA NORMA se compresa tra: H – 3 x σ = 175 – 3 x 5 = 160 cm H + 3 x σ = x 5 = 190 cm ALTEZZE fuori da tale intervallo (160;190cm) sono FUORI NORMA NORMA e FUORI NORMA FUORI NORMA. Un CARATTERE che va fuori tali limiti si dice FUORI NORMA.

102 esempio 1: studiare la curva di distribuzione i cui valori sono: 95, 96, 97, 98, 99, 101, 102, 103, 104, 105 il campo di variazione è: = 10 la media è: 100 e non corrisponde ad alcun valore realmente osservato; la mediana è: 100 ed è uguale alla media; ciò indica una distribuzione simmetrica la moda è mancante (zeromodale) la deviazione standard o scarto quadratico è: 3.3 ed indica che la media fornisce una stima adeguata delle misure osservate. Infatti, nell'intervallo ( ); ( ) cadono 6 valori su 10 il coefficiente di variazione è: 3,3/ 100 = 0.033, un valore molto basso e quindi la media è un indicatore corretto. ESEMPI

103 esempio 2: Studiare la curva di distribuzione i cui valori sono: 95, 95, 95, 95, 95, 105, 105, 105, 105, 105 il campo di variazione è: = 10 la media è: 100 e non corrisponde ad alcun valore realmente osservato; la mediana è: 100 ed è uguale alla media; ciò indica una distribuzione simmetrica la moda è: bimodale, con i valori 95 e 105. Questo è l'indicatore più appropriato per la distribuzione in oggetto. la deviazione standard è: 5 ed indica che la media fornisce una stima adeguata delle misure osservate. Infatti, nell'intervallo ( ); ( ) cadono 10 valori su 10 il coefficiente di variazione è: 5/ 100 = 0.05, un valore basso. Inoltre, anche senza osservare il grafico, si può intuire che i valori osservati sono concentrati agli estremi. La media, in questo caso, è un indice corretto.

104 esempio 3: studiare la curva di distribuzione i cui valori sono: 0, 0, 50, 50, 100, 100, 150,150, 200, 200 il campo di variazione è: = 200 la media è: 100 corrisponde a due valori realmente osservati; la mediana è: 100 ed è uguale alla media; ciò indica una distribuzione simmetrica la moda è: plurimodale la deviazione standard è: 70,7 ed indica che la media fornisce una stima adeguata delle misure osservate. Nell'intervallo ( ,7); ( ,7) cadono 6 valori su 10 e l'intervallo in cui cadono i dati è coperto al 50% il coefficiente di variazione è: 70.7/ 100 = 0.7 un valore alto, e quindi l'indicatore più adatto è la moda in quanto la distribuzione è multimodale.

105 esempio 4: studiare la curva di distribuzione i cui valori sono: 20, 40, 50, 60, 70, 80, 90, 90, 100, 200, 200, 200 il campo di variazione è: = 180 la media è: 100 e corrisponde ad un valore realmente osservato; la mediana è: 85 ed è differente dalla media; ciò indica una distribuzione asimmetrica la moda è 200. Questo è l'indicatore più appropriato per la distribuzione in oggetto. la deviazione standard è: 61.6 e la media fornisce una stima adeguata delle misure osservate. il coefficiente di variazione è: 61.6/ 100 = 0.62 un valore elevato, infatti i valori osservati sono piuttosto distribuiti. La presenza di un valore estremo (200) provoca una distorsione sugli indici di variabilità e toglie significato rappresentativo alla media. Questo è un caso piuttosto frequente in campo medico (per es., i valori degli esami del sangue) ed in altri settori applicativi. In questo caso, il valore della media è troppo spostato a destra rispetto alla maggior parte dei valori della distribuzione di frequenza. L'indicatore migliore è pertanto la mediana, che risente meno dei valori estremi.

106 …e adesso… buon lavoro! FINE PRESENTAZIONE


Scaricare ppt "Presentazione a cura della prof.ssa ANNUNZIATA DI BIASE Dicembre 2014."

Presentazioni simili


Annunci Google