G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Rappresentazione dei dati con istogrammi Giovanni Filatrella (

Slides:



Advertisements
Presentazioni simili
- le Medie la Moda la Mediana
Advertisements

I dati Qualsiasi contenuto dell’esperienza.
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Caduta non guidata di un corpo rettangolare in un serbatoio Velocità e rotazione.
Le distribuzioni di probabilità discrete
Le distribuzioni di probabilità continue
1 MeDeC - Centro Demoscopico Metropolitano Provincia di Bologna - per Valutazione su alcuni servizi erogati nel.
II° Circolo Orta Nova (FG)
____________________
1 Pregnana Milanese Assessorato alle Risorse Economiche Bilancio Preventivo P R O P O S T A.
Agenda Statistica Andamento e struttura della popolazione di Bolzano e dei suoi quartieri e dei suoi quartieri maggio 2008 Ufficio Statistica e.
Andamento e struttura della popolazione di Bolzano e dei suoi quartieri e dei suoi quartieri 11 maggio 2010 Ufficio Statistica e Tempi della Città
Frontespizio Economia Monetaria Anno Accademico
Dossier Statistico Immigrazione Caritas/Migrantes 2010 Veneto. Cittadini stranieri residenti – Con residenti, diventa la 3^ regione italiana.
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
Numerazione in base tre Prof. Lariccia Giovanni Gruppo: Roberta Spicciariello, Roberta Accaria e Maria Elisa Graziano.
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita.
Lez. 3 - Gli Indici di VARIABILITA’
Elementi di STATISTICA DESCRITTIVA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia l’analisi statistica.
Dipartimento di Ricerca Sociale - Università del Piemonte Orientale 1 Castelli Aperti giugno 2005 Castello di Camino (AL) IL PUBBLICO DI CASTELLI.
Statistica descrittiva
L’elasticità della domanda rispetto al “proprio prezzo”
Obiettivi del corso di Statistica Medica.
ALBERI DECISIONALI terza parte
A.S.E.5.1 ARCHITETTURA DEI SISTEMI ELETTRONICI LEZIONE N° 5 Rappresentazione di numeri con segnoRappresentazione di numeri con segno –Modulo e segno (MS)
ELEZIONI REGIONALI 2010 PRIMI RISULTATI E SCENARI 14 aprile 2010.
Canale A. Prof.Ciapetti AA2003/04
Indagine trimestrale sulla industria manifatturiera in provincia di Ravenna I trimestre 2003 Ravenna, 5 giugno 2003 Associazione degli Industriali della.
Indagine trimestrale sulla industria manifatturiera in provincia di Ravenna - Imprese con oltre 10 addetti - IV trimestre e consuntivo 2003 Ravenna, 19.
Ufficio Studi UNIONCAMERE TOSCANA 1 Presentazione di Riccardo Perugi Ufficio Studi UNIONCAMERE TOSCANA Firenze, 19 dicembre 2000.
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
Esercizi x1=m-ts x2=m+ts
NCI Cancer Mortality Atlas Electronic version of book Dynamic, accessible graphs Interactive maps Downloadable data Cervix uteri cancer mortality, white.
Valutazione della stima: gli intervalli di confidenza
Misure di posizione Giovanni Filatrella
Il Teorema del Limite Centrale
Misure di dispersione Giovanni Filatrella
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Simulazione di un esperimento di laboratorio: Caduta di un corpo quadrato in.
Cos’è un problema?.
CALCIO SKY 2007 – 2008 PROFILO DI ASCOLTO. 2 INDICE DEGLI ARGOMENTI Profilo di ascolto CALCIO SERIE A 2007 – 2008 Totale campionato (tutte le partite)……………………………………………….
Nobodys Unpredictable Presentazione dei risultati Il PD, il Nord e il federalismo Giugno 2010.
Velocità ed accelerazione
Esercitazione 1: Rispetto al test di ansia (Media=25; σ=5), calcolare:
Q UESTIONI ETICHE E BIOETICHE DELLA DIFESA DELLA VITA NELL AGIRE SANITARIO 1 Casa di Cura Villa San Giuseppe Ascoli Piceno 12 e 13 dicembre 2011.
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE.
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
Statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
ISTITUTO COMPRENSIVO “G. BATTAGLINI” MARTINA FRANCA (TA)
I principali tipi di grafici
Rapporto socio-demografico della provincia di Lecco 2004/2008
LE SAI LE TABELLINE? Mettiti alla prova!.
Tassi e trend di mortalità dei tumori della mammella in Emilia-Romagna
Un trucchetto di Moltiplicazione per il calcolo mentale
1101 = x 10 x 10 x x 10 x = CORRISPONDENZE
Estratto per la relazione del Dott. Trevisanato 30 maggio 2008.
Andamento e struttura della popolazione di Bolzano e dei suoi quartieri e dei suoi quartieri 21 maggio 2009 Ufficio Statistica e Tempi della Città
Sviluppare un programma in C che, dato un array da 100 elementi interi caricato con numeri casuali compresi tra [10,100], sia in grado di cercare il valore.
NO WASTE Progetto continuità scuola primaria scuola secondaria Salorno a.s. 2013_
Numeri Interi senza segno
Minimo comune multiplo
Mercato del lavoro e condizione giovanile: la crisi si acuisce
Informazione su alcuni aspetti della situazione sociale dell’Arcidiocesi Demografia Famiglia Religione Istruzione Economia Ufficio Problemi sociali E.
DIRETTIVI UNITARI SPI-CGI – FNP-CISL - UILP-UIL TERRITORIO LODIGIANO Lunedì 23 marzo 2015 dalle ore 9,00 alle ore 13,00 Presso la sala Conferenze Confartigianato.
1 Ministero dell’Istruzione, dell’Università e della Ricerca Dipartimento per la Programmazione e la Gestione delle risorse umane, finanziarie e strumentali.
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
Transcript della presentazione:

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Rappresentazione dei dati con istogrammi Giovanni Filatrella ( ) Elaborazione Statistica dei Dati Sperimentali Elaborazione Statistica dei Dati Sperimentali Facoltà di Scienze MM FF e NN, Università Sannio

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 2 Dati grezzi I dati sperimentali si presentano in genere sotto forma di tabelle: Tasso di fecondità totale per donne in età per regione di residenza - Anni Table 10.1 continue - Total fertility rate per women aged by region of residence - Years REGIONI E RIPARTIZIONI (a) Piemonte Valle d'Aosta Lombardia Trentino-Alto Adige Veneto Friuli-Venezia Giulia Liguria Emilia-Romagna Toscana Umbria Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Sardegna Nord Centro Sud ITALIA (a) Dati provvisori. (a) Provisional data. Fonte: ISTAT - Servizio "Popolazione e cultura". Source: ISTAT - Unit "Popolazione e cultura".

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 3 Analisi dei dati I dati così raccolti devono essere elaborati per rispondere a delle domande: 1.Il tasso di fertilità è stato maggiore nel 1992 o nel 1993? 2.Le variazioni da una regione allaltra sono grandi? 3.Quale potrebbe essere stato sulla base di questi dati il tasso nel 1998?

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 4 Come si risponde in presenza di variabilità: Il tasso di fertilità è stato maggiore nel 1992 o nel 1993? I valori sottolineati sono quelli maggiori, e non sempre appartengono allo stesso anno Lanalisi statistica di questi dati dovrebbe dare una risposta quantitativa

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 5 Importante In presenza di variabilità la domanda qual è più grande potrebbe dipendere da molti fattori – in seguito vedremo quindi vari approcci che potrebbero quindi dare risultati diversi per lo stesso insieme di dati.

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 6 Definizioni Individui: i soggetti delle misure Variabile casuale: Una grandezza misurabile che assume valori in principio diversi per i diversi individui Ex: nella tabella (1) se si seleziona una regione un individuo è un anno. La variabile casuale è il tasso di fertilità.

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 7 Applicazione del concetto diindividuo e variabile casuale Val d'Aosta In corrispondenza di ogni anno (ovvero di ogni individuo) si misura una quantità: il numero di figli nati in quellanno per 1000 donne (la variabile casuale). Nellanalisi di qualsiasi tipo di dati è essenziale innanzitutto comprendere quali siano gli individui e quale sia la variabile casuale.

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 8 Nomenclatura dei diversi tipi di variabili casuali Una grandezza misurabile, cioè una variabile casuale, può comunque appartenere a diverse categorie: 1)Continua: può assumere un qualsiasi valore fra i numeri reali; 2)Discreta: può assumere un qualsiasi valore fra i numeri interi; 3)Nominale: può assumere diversi valori, ma fra questi non vi è nessun ovvio ordinamento.

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 9 Esempi di variabile continua: 1.Misurare laltezza di coloro che seguono questo corso; 2.Misurare il peso di coloro che seguono questo corso; 3.Misurare la distanza che percorre ognuno di coloro che seguono questo corso per raggiungere la Facoltà.

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 10 Esempi di variabile discreta: 1.Misurare lanno di nascita di coloro che seguono questo corso; 2.Misurare il numero di fratelli e sorelle di coloro che seguono questo corso; 3.Misurare il numero di crediti già conseguiti da coloro che seguono questo corso.

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 11 Esempi di variabile nominale: 1.Misurare il luogo di nascita di coloro che seguono questo corso; 2.Misurare la scuola di provenienza di coloro che seguono questo corso; 3.Misurare il Codice di Avviamento Postale della residenza di coloro che seguono questo corso.

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 12 Applicazione alla tabella sul tasso di fertilità: REGIONI E RIPARTIZIONI Valle d'Aosta Lombardia Trentino-Alto Adige Veneto Friuli-Venezia Giulia Liguria Emilia-Romagna Toscana Umbria Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Sardegna Per le tre variabili casuali: x 1 {Il tasso di fertilità per il 1991 nelle varie regioni} x 2 {Lanno in cui ogni regione ha mostrato il minimo tasso di fertilità} x 3 {La regione che ogni anno ha mostrato il massimo tasso di fertilità} stabilire di quale tipo si tratti

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 13 Risposte 1.x 1 {Il tasso di fertilità per il 1991 nelle varie regioni} continua 2.x 2 {Lanno in cui ogni regione ha mostrato il minimo tasso di fertilità} discreta 3.x 3 {La regione che ogni anno ha mostrato il massimo tasso di fertilità} nominale

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 14 Problema Il tasso di fertilità è il numero di figli, quindi dovrebbe essere un intero. Perché invece asseriamo che può assumere un qualsiasi valore e quindi è una variabile continua? Rispondere a casa scrivendo la motivazione.

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 15 Importanza dellelaborazione dei dati Es.: per le variabili x 2 e x 3, anche se la tabella contiene sicuramente linformazione, non è ovvio sapere cosa succede.

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 16 x 1 {Il tasso di fertilità misurato nel 1991} OSSERVAZIONI Gli individui sono le regioni La variabile casuale è continua Ma aver isolato i dati non basta a darci unidea di cosa succeda ,1241,1601,1241,4101,1151,0241,0071,0071,052 1,1621,2071,2331,3531,4061,8101,6011,5571,668 1,7751,291

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 17 Ordinare i dati dal più piccolo al più grande è utile: 1,007 1,024 1,052 1,115 1,124 1,160 1,162 1,207 1,233 1,291 1,353 1,406 1,410 1,557 1,601 1,668 1,775 1,810 1,007 1,024 1,052 1,115 1,124 individui per i quali la variabile 1,124 compresa fra 1 ed 1,2 1,160 1,162 1,207 1,233 individui per i quali la variabile è 1,291 compresa fra 1,2 ed 1,4 1,353 1,406 1,410 individui per i quali la variabile è 1,557 compresa fra 1,4 ed 1,6 1,601 1,668 individui per i quali la variabile è 1,775 compresa fra 1,6 ed 1,8 1,810i ndividui per i quali la variabile è compresa fra 1,8 e 2 Questa prima elaborazione aiuta a comprendere cosa succede. D: cosa si nota dalla tabella ordinata?

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 18 Suddivisione in Classi Gli intervalli della slide precedente si dicono classi: I classe: 1 b 1.2 II classe: 1.2 b 1.4 III classe: 1.4 b 1.6 IV classe: 1.6 b 1.8 V classe: 2 b b {tasso di natalità} Il numero di individui in una classe è lafrequenza assoluta : N i {frequenza assoluta}

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 19 Definizioni Si dice Classe un intervallo di valori della variabile casuale cui un individuo può appartenere o no. Il numero di classi in cui suddividere dei dati grezzi dipende da come risulta più efficace la rappresentazione. Lintervallo della variabile casuale compreso in una classe si dice Ampiezza della classe. Anche le ampiezze delle classi non possono essere decise a priori. Ove possibile, è preferibile che siano tutte uguali.

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 20 Rappresentazione efficace della suddivisione in Classi La freq. assoluta può essere espressa in percentuali: 45% 20% 15% 5% una percentuale {f i X 100} La freq. assoluta diviso il totale N di individui è la frequenza relativa: f i =N i /N {frequenza relativa}

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 21 Tabella riassuntiva NobClassefrequenza frequenzafrequenza assolutarelativarelativa % 11, % 21,007 31,024 41,052 51,115 61,124 71,124 81,160 91, , % 111, , , , % 151, , , % 181, , , % Totali % Una tabella dei dati ordinati contiene gli elementi essenziali per rappresentare le misure:

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Frequenza rel b (variabile casuale) Alcune regole: 1.Chiarire cosa cè sugli assi; 2.Indicare solo pochi valori a distanze uniformi; 3.Scegliere dimensioni tali che simboli e numeri siano facilmente leggibili. Rappresentazione grafica: lIstogramma

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 23 La scelta delle classi influenza laspetto degli istogrammi Può capitare che i dati siano distribuiti in modo tale che la divisione in classi ne influenzi molto laspetto: S (%) 1 Piemonte0,34 2 Valle D'Aosta0,45 3 Lombardia0,27 4 Trentino - Alto Adige0,04 5 Veneto0,27 6 Friuli - Venezia Giulia0,20 7 Liguria2,34 8 Emilia - Romagna0,12 9 Toscana0,64 10 Umbria0,74 11 Marche0,93 12 Lazio2,27 13 Abruzzo0,73 14 Molise1,48 15 Campania4,91 16 Puglia3,63 17 Basilicata1,52 18 Calabria2,43 19 Sicilia0,87 20 Sardegna1,75 Percentuale di boschi andati a fuoco nel 1985 nelle varie regioni italiane (Fonte: ISTAT).

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 24 Tabella distribuzione superficie incendi 1985 NoS(%)Classefrequenza frequenzafrequenza assolutarelativarelativa % 1 0,04 2 0,12 3 0,20 4 0,27 5 0,27 6 0,34 7 0,45 170,35 35% 8 0,64 9 0, , , ,93 250,25 25% 13 1,48 310,05 5% 14 1, ,75 420,10 10% 16 2, , ,43 530,15 15% 600,00 0% 700,00 0% 19 3,63 810,05 5% 900,00 0% 204, ,05 5% Totali 201,00 100% E difficile rappresentare i dati in questa forma perché molte classi risultano vuote.

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Frequenza rel % Superficie incendiata I problemi che sono sorti: 1.I valori per piccole superfici cadono tutti nella stessa classe 2.I singoli valori per grandi superfici sembrano costituire dei picchi con un significato Istogrammi di dati distribuiti in modo anomalo Ampiezza: 0.5%

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Frequenza rel % Superficie incendiata Molte regioni sono afflitte da piccoli incendi In poche regioni gli incendi sono devastanti Rimane il problema che il 60% è appiattito in una sola classe. Un diverso tipo di suddivisione in classi Ampiezza: 1%

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 27 Istogrammi di dati non uniformemente separati Per ovviare a questi inconvenienti a volte la soluzione è scegliere classi di ampiezza non uniforme.

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 28 II elab NoS(%)ClasseAreaaltezzafreq.freq.Freq. del rett.assolutarelativarelativa % 1 0,04 2 0,12 3 0, % 0,63 0,1515% 4 0,27 5 0,27 6 0,34 7 0,45 20,25%0,840,2 20% 8 0,64 9 0, , , ,93 30,5%0,550,25 25% 131, , ,75 41%0,1530,15 15% 16 2, , ,43 51%0,1530,15 15% 19 3,63 61%0,0510,05 5% 204,91 71%0,0510,05 5% Totali 201,00 100% Si sono scelte classi di ampiezza diversa

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Densità di frequenza % Superficie incendiata Si riescono a distinguere i dati anche vicino allo 0% Però: 1.La frequenza è prop. allarea dei rettangoli 2.Lasse verticale è una densità di frequenza Istogrammi con ampiezza delle classi non uniforme Ampiezza variabile