Rappresentazioni grafiche di serie di frequenza … etc … etc

Slides:



Advertisements
Presentazioni simili
Elementi di Statistica e Probabilità
Advertisements

I dati Qualsiasi contenuto dell’esperienza.
Le rappresentazioni grafiche
QUANTILI.
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
STATISTICA DESCRITTIVA
La divulgazione della statistica
“Teoria e metodi della ricerca sociale e organizzativa”
Flavio Waldner - Dipt.di Fisica - UDINE - Italy 32 I grafici di funzioni Oltre al sistema di coordinate cartesiane... X da sinistra a destra Pensate ad.
Variabili casuali a più dimensioni
Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita.
LA STATISTICA By prof. Pietro Rossi.
Lez. 3 - Gli Indici di VARIABILITA’
Elementi di STATISTICA DESCRITTIVA
Analisi preliminari dei dati
Descrizione dei dati Metodi di descrizione dei dati
Progetto Pilota 2 Lettura e interpretazione dei risultati
Elementi di STATISTICA DESCRITTIVA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia l’analisi statistica.
Statistica descrittiva
LIBRO – BIOSTATISTICA [Pagano-Gauvreau]
STATISTICA DESCRITTIVA
DISTRIBUZIONE CAMPIONARIA CONGIUNTA DI DUE VARIABILI (1)
Campionamento casuale semplice
Obiettivi del corso di Statistica Medica.
DIFFERENZA TRA LE MEDIE
COSA VUOL DIRE FARE STATISTICA
Canale A. Prof.Ciapetti AA2003/04
Progetto di statistica “SIAMO TUTTI STATISTICI”
G.M. - Informatica B-Automazione 2002/03 Funzione Indica una relazione o corrispondenza tra due o più insiemi che soddisfa ad alcune proprietà. Il dominio.
STATISTICA a.a DISTRIBUZIONI DI FREQUENZE
Esercizi x1=m-ts x2=m+ts
VARIABILI E DISTRIBUZIONI DI FREQUENZA
Misurazione Le osservazioni si esprimono in forma di misurazioni
Parte I (introduzione) Taratura degli strumenti (cfr: UNI 4546) Si parla di taratura in regime statico se lo strumento verrà utilizzato soltanto per misurare.
Le scale di proporzione
DATI E PREVISIONI Marzo 2011.
ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE.
Statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
I principali tipi di grafici
Le rappresentazioni grafiche
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Distribuzioni di frequenza
STATISTICA La statistica è la scienza che ha come fine lo studio quantitativo e qualitativo di un "collettivo". Studia i modi (descritti attraverso formule.
Tabelle Pivot Istogrammi e frequenze Diagramma box-plot
Indici di posizione Francesco Michele Mortati - Istat.
Gli indici di dispersione
Le rappresentazioni grafiche
La statistica.
Esercizi Due gruppi di studenti effettuano la misura della densità di un oggetto, trovando rispettivamente i valori 13.7 ± 0.9 g/cm3 e ± 1300 kg/m3.
Statistica Descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
ORIENTAMENTO CONSAPEVOLE
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Intervalli di confidenza
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
Il diagramma cartesiano
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
La funzione CASUALE. Gli istogrammi.
1 VARIABILI CASUALI. 2 definizione Una variabile casuale è una variabile che assume determinati valori in modo casuale (non deterministico). Esempi l’esito.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
ARGOMENTI DELLA LEZIONE  Le distribuzioni di frequenza in classi  Le distribuzioni di frequenza in classi  Le tabelle di frequenza  La rappresentazione.
Gli Indici di VARIABILITA’
Transcript della presentazione:

Rappresentazioni grafiche di serie di frequenza … etc … etc Diagrammi a barre Torte Diagrammi ad aghi Istogrammi di frequenza Istogrammi di densità Box plots Diagrammi a gambo e foglia I modelli matematici Diagrammi a linee continue

Rappresentazione tabulare di una serie qualitativa UNA SERIE DI FREQUENZA Una serie statistica è la successione delle frequenze che corrispondono alle modalità di un carattere qualitativo. Esempio: Si consideri la variabile esito di un esperimento di ototossicità condotto su 120 cavie trattate, per due settimane consecutive, con un antibiotico che ha sia ototossicità sia tossicità generale. L'insieme delle coppie "modalità, frequenza di comparsa" viene anche indicato con il nome di distribuzione della variabile esito. FREQUENZE MODALITÀ  assolute relative morte nella 1a settimana 18 0.15 morte nella 2a settimana 12 0.10 sopravvissute e otolese 36 0.30 sopravvissute e non otolese 54 0.45 Rappresentazione tabulare di una serie qualitativa Distribuzione degli esiti di un esperimento di ototossicità. Nota: una frequenza relativa è il rapporto tra la frequenza assoluta con cui si manifesta una modalità e la numerosità totale del campione

GRAFICI PER SERIE QUALITATIVE Diagramma a barre orizzontali Diagramma areolare (o a torta)

SERIE STATISTICHE QUANTITATIVE Anche la successione delle frequenze che corrispondono alla comparsa di un carattere quantitativo discreto costituisce una serie statistica. Rappresentazione tabulare di una serie quantitativa Morti per calcio di cavallo in 200 reggimenti di cavalleria prussiani. (Bortkiewicz. 1898) numero di morti frequenze semplici frequenze cumulate in un reggimento assolute relative 109 54,5 1 65 32,5 174 87,0 2 22 11,0 196 98,0 3 1,5 199 99,5 4 0,5 200 100,0 5+ Nota: la frequenza cumulata assoluta in corrispondenza di un valore x* indica il numero di volte che la variabile x ha assunto valori pari o inferiori a x*. Ad esempio, la frequenza cumulata assoluta per il valore 2 è data dalla somma 109+65+22= 196: ben 196 dei 200 reggimenti (pari al 98%, frequenza cumulata relativa) hanno presentato un numero morti per calcio di cavallo inferiore oppure uguale a due.

RAPPRESENTAZIONE GRAFICA DI SERIE QUANTITATIVE Diagramma ad aghi per frequenze semplici Diagramma a gradini per frequenze cumulate Diagramma areolare

RAPPRESENTAZIONE GRAFICA DI SERIAZIONE DI FREQUENZA La distribuzione di variabili continue espresse in scala quantitativa si rappresenta in modo analogo: tuttavia, la frequenza non è riferita ad una modalità o ad un singolo valore, ma ad intervalli (o classi) di valori, ognuno dei quali include un'infinità di possibili valori (almeno virtualmente). Esempio: Un'indagine condotta da un gruppo di neonatologi ha rilevato i valori di lunghezza supina (cm) in un campione di 60 neonati. Le misurazioni, eseguite con l'infantometro Harpenden, sono riportate nella tabella. 51.0 49.4 49.0 52.5 51.5 51.8 46.5 47.8 49.7 44.5 49.8 53.0 48.7 50.0 52.9 50.8 46.2 48.9 54.5 48.2 51.2 49.5 56.3 46.0 52.2 47.0 51.1 54.7 52.3 55.0 50.2 50.3 47.7 48.5 53.8 53.4 47.4 50.5 51.7 44.4 49.2 54.0 50.9 51.6 52.7

Come costruire una seriazione di frequenza. valore frequenza limiti di classe centrale assoluta cumulata ( 44.3 - 45.7 ] 45.0 2 ( 45.7 - 47.3 ] 46.5 5 7 ( 47.3 - 48.7 ] 48.0 14 ( 48.7 - 50.3 ] 49.5 28 ( 50.3 - 51.7 ] 51.0 16 44 ( 51.7 - 53.3 ] 52.5 9 53 ( 53.3 - 54.7 ] 54.0 58 ( 54.7 - 56.3 ] 55.5 1 59 ( 56.3 - 57.7 ] 57.0 60 Il numero di classi può oscillare tra 8 e 20, a seconda della numerosità dell'insieme di dati. Il centro della classe deve coincidere con un valore misurabile (es.: 46.5 va bene perchè è misurabile; mentre 44.48 non lo è, con l'infantometro) e di uso comune (es.: 46.5 è da preferirsi a 45.2).

Come costruire una seriazione di frequenza. Il centro di classe deve coincidere con la media degli estremi di classe. I valori misurabili non devono coincidere con gli estremi di classe. limiti apparenti valore Frequenza Frequenza relativa di classe Centrale Assoluta Cumulata Semplice 44.25 - 45.75 45.0 2 0.033 45.75 - 47.25 46.5 5 7 0.083 0.117 47.25 - 48.75 48.0 14 0.233 48.75 - 50.25 49.5 28 0.467 50.25 - 51.75 51.0 16 44 0.267 0.733 51.75 - 53.25 52.5 9 53 0.150 0.883 53.25 - 54.75 54.0 58 0.967 54.75 - 56.25 55.5 1 59 0.017 0.983 56.25 - 57.75 57.0 60 1.000

Istogramma (o diagramma a canne d'organo)

Ogiva di Galton per le frequenze cumulate

ISTOGRAMMI DI DENSITÀ DI FREQUENZA Negli istogrammi e nei poligoni di “densità” le frequenze sono proporzionali all'area (delimitata dalla spezzata che li costituisce e inclusa tra due valori reali sull'asse orizzontale), e non all'altezza della figura. Ovviamente, quando le classi hanno tutte la stessa ampiezza, l'area è propor-zionale anche all'altezza. I valori riportati sull'asse verticale indicano la densità di frequenza per una prefissata ampiezza di classe. Modificazione della forma degli istogrammi in funzione dell'ampiezza delle classi.

FUNZIONE DENSITÀ Lunghezza supina (cm) in un campione di 60 neonati. Valori della funzione densità nel caso di tre classi di ampiezza identica = 4.5 cm. Limiti valore frequenze Semplici Frequenze cumulate densità di classe centrale n %   44.3-48.7 47.5 14 0.233 0.0518518 48.8-53.2 51.5 39 0.650 53 0.883 0.1444444 53.3-57.7 55.5 7 0.116 60 1.000 0.0258259 La densità si calcola dividendo la frequenza relativa per l'ampiezza della classe. La densità è una nuova poligonale L'area compresa tra la poligonale e l'asse delle ascisse è uguale ad 1.0 La somma 0.0518518  4.5+ 0.1444444  4.5+0.0258259  4.5 = 1.00 ( 0.233) + ( 0.650) + (0.116 ) = 1.00 NB: Anche se le ampiezze di classe sono diverse tra loro, la densità ha le stesse proprietà

ISTOGRAMMI DI DENSITÀ DI FREQUENZA

Un grafico complesso: age of life tree

Censimento USA anno 2000 agegrp white black Indian asian island Male Fem indian Under 5 12859892 2804786 213052 670406 33391 6597764 1424275 108659 337149 17254 6262128 1380511 104393 333257 16137 5 to 9 13944882 3205512 239007 680536 36503 7159656 1627475 120954 348856 18702 6785226 1578037 118053 331680 17801 10 to 14 14322638 3121530 245677 684525 35772 7361650 1584518 125260 352071 18376 6960988 1537012 120417 332454 17396 15 to 19 14167148 2929553 232351 746511 37328 7288058 1482765 119350 380560 19394 6879090 1446788 113001 365951 17934 20 to 24 13064891 2628752 198010 816452 38693 6675922 1280628 102116 407865 20243 6388969 1348124 95894 408587 18450 25 to 29 13501773 2548968 186689 986222 35224 6846202 1211753 95441 484136 18385 6655571 1337215 91248 502086 16839 30 to 34 14818786 2618602 186072 949418 33129 7490728 1239755 94245 461712 16883 7328058 1378847 91827 487706 16246 35 to 39 17031492 2826361 202013 909439 33031 8544270 1328309 99900 439179 16638 8487223 1498052 102113 470260 16393 40 to 44 17265996 2700418 189201 846118 28760 8631912 1267177 92141 398480 14660 8634083 1433241 97060 447638 14100 45 to 49 15810626 2275191 159422 749777 23675 7855623 1056143 77577 345873 11717 7955003 1219048 81845 403904 11958 50 to 54 14213875 1805457 128303 626255 18938 7023516 831065 62799 288810 9479 7190359 974392 65504 337445 9459 55 to 59 11107247 1306641 90531 433749 13428 5415680 588262 43962 203331 6642 5691567 718379 46569 230418 6786 60 to 64 8945842 1063469 67189 342795 10142 4292670 468895 32324 160314 4908 4653172 594574 34865 182481 5234 65 to 69 8040225 881786 49463 274085 7698 3753923 374464 22837 119499 3747 4286302 507322 26626 154586 3951 70 to 74 7648193 731386 36434 220066 5529 3407201 291976 16163 92669 2462 4240992 439410 20271 127397 3067 75 to 79 6530019 550024 25608 155965 3614 2696297 206915 10701 67074 1537 3833722 343109 14907 88891 2077 80 to 84 4408597 346465 14646 88183 2155 1643745 116030 5488 36339 907 2764852 230435 9158 51844 1248

DIAGRAMMA A GAMBO E FOGLIA (1) Una utile rappresentazione di un numero limitato di dati è il grafico a “gambo-e-foglia”: Esso … ha una forte somiglianza con l'istogramma ed ha lo stesso scopo fornisce informazioni riguardanti il range dell'insieme dei dati, mostra la posizione della concentrazione delle misure più elevate, mette in evidenza la presenza o l'assenza di simmetria, mantiene l'informazione contenuta nelle misure individuali. elimina il passo intermedio di preparazione di una tabella ordinata. Per la sua costruzione dividiamo ciascun valore numerico in due parti: la prima parte è chiamata gambo e la seconda parte foglia. il gambo è costituito da una o più cifre iniziali del valore numerico e la foglia è formata da una o più delle rimanenti cifre. Tutti i numeri suddivisi vengono riportati insieme in un singolo grafico; i gambi formano una colonna ordinata con il più piccolo gambo all'inizio ed il più grande alla fine della colonna.

DIAGRAMMA A GAMBO E FOGLIA (2) Il seguente esempio illustra la costruzione di un grafico gambo-e-foglia.   Le righe del grafico contengono le foglie, ordinate ed elencate a destra dei rispettivi gambi. Quando le foglie sono formate da più di una cifra, tutte le cifre dopo la prima possono essere eliminate. Stem-and-leaf plot for altezza Altezza rounded to nearest Multiple of.1 Plot in units of .1 44* | 45 45* | 46* | 0255 47* | 0478 48* | 225799 49* | 02455578 50* | 002235558889 51* | 012255678 52* | 2355799 53* | 048 54* | 057 55* | 0 56* | 3

(BOXPLOT) Boxplot della Lunghezza supina (cm) in un campione di 60 neonati La linea orizzontale entro la scatola è indica il valore della mediana della distribuzione delle Lunghezze supine. I bordi superiore ed inferiore della scatola sono le soglie superiore ed inferiore (ovvero i quartili) della distribuzione delle Lunghezze supine. Le linee verticali agli estremi della box connettono i punti estremi delle rispettive soglie.

Calories in three types of hot dogs, 20 campioni esaminati per tipo

Esempio di Box Plot Distanza in miglia con un litro di benzina per automobili “Mini”.

Guinea pig survival data

Babe Ruth “Home Run” data

Esempio: asimmetria a destra

Histogram Example

il problema della “piscina" Per esempio, si potrebbe richiedere a voi di spiegare il numero di mattonelle che saranno necessarie a fare i bordi intorno ad una piscina di varie lunghezza e larghezza, come nella figura 2. Voi potreste sviluppare varie formule per esprimere questi rapporto in base ad una tabella di datie e il loro rapporto nella situazione in esame;

costruiamo un “modello” "avete bisogno di L + 2 mattonelle nella parte superiore e lo stesso numero nella parte inferiore. Ed avete bisogno di W mattonelle alla sinistra ed alla destra. Così in totale, il numero necessario di mattonelle è T = 2(L + 2) + 2W." W L

I modelli costruiscono i “valori attesi” Ora è chiaro che non dobbiamo conoscere il valore di L ed il valore di W e non interessa. Quando ci troveremo in una situazione concreta utilizzeremo il “modello” T = 2(L + 2) + 2W per definire un valore atteso “T” il quella situazione particolare

Diagrammi a linee continue

Diagrammi a linee continue