Applicazioni del foglio elettronico Statistica elementare a cura del prof. Giovanni Raho Informatica e statistica 2003 Prof. Giovanni Raho
La statistica Un insieme di procedure fondate sulla matematica che permettono di analizzare gli eventi e trarne Leggi di collegamento tra eventi Leggi di previsione Modelli in cui le relazioni siano precisate attraverso metodi matematici. Informatica e statistica 2003 Prof. Giovanni Raho
Problema ed informazione Definire il problema Individuare gli eventi che intervengono nel problema. Caratterizzare gli eventi attraverso la definizione dei concetti. Collegare i concetti per costruire une teoria. La teoria ben formata: relazioni non contraddittorie tra concetti. Informatica e statistica 2003 Prof. Giovanni Raho
Gli strumenti di verifica Variabili e misure: I concetti sono definiti attraverso le variabili. Le variabili sono specificate attraverso le misure. Le misure sono di diverso tipo Metriche Rapporti ed intervalli. Ordinali Nominali Informatica e statistica 2003 Prof. Giovanni Raho
Uso delle misure Eseguire operazioni tra le misure Il termine operazioni va considerato in senso lato. Sono operazioni: Unione Separazione Operazioni aritmetiche Operazioni razionali e irrazionali. Informatica e statistica 2003 Prof. Giovanni Raho
Operazioni con le misure Dipendono dal diverso tipo di misura Scale di Misura Addizione Unione Sottrazione separazione Moltiplicazione e divisione Si introduce tra le misure un operatore che le trasformi in modo da poter esser adattate alle nostre esigenze. Informatica e statistica 2003 Prof. Giovanni Raho
Operazioni di sintesi Media aritmetica Va valutata con un opportuno parametro: Deviazione standard (dev ST in Excel) La Deviazione standard misura l’attendibilità della media a. Mediana (divide un gruppo ordinato in due parti) Valutazione attraverso la differenza tra quartili (quattro parti) Moda Valutazione valore minimo e massimo Si vedano gli esempi applicativi col foglio elettronico. Informatica e statistica 2003 Prof. Giovanni Raho
Scale di misura e sintesi Scala metrica Media aritmetica, Deviazione Standard Scala ordinale Mediana, quartili Scala Nominale Conteggio delle frequenze Uso della MODA. Informatica e statistica 2003 Prof. Giovanni Raho
La percentuale Si tratta di una particolare misura usata per confrontare gruppi numericamente diversi. Permette di cogliere le differenze con maggior immediatezza. Analogia grafica: TORTA 75% Informatica e statistica 2003 Prof. Giovanni Raho
I grafici Permettono un confronto immediato di gruppi numericamente diversi A lato un grafico a colonne o istogramma. 20 volte 40 volte Informatica e statistica 2003 Prof. Giovanni Raho
Vari tipi di grafici per vari usi Torta Rappresentazione di una variabile secondo le percentuali Barre – Istogrammi Rappresentazione di due o più variabili secondo la frequenza dei loro valori. (vedi esempio precedente diapositive) Barre impilate Rappresentazione di due o più variabili secondo i valori di una terza. Vedi nel libro di informatica analisi multivariata Informatica e statistica 2003 Prof. Giovanni Raho
STATISTICA DESCRITTIVA I procedimenti sin qui descritti fanno parte della statistica descrittiva. Essa si occupa della presentazione di dati ed aiuta nella loro interpretazione. … Spesso si rinuncia al dettaglio per avere una visione generale del fenomeno … Informatica e statistica 2003 Prof. Giovanni Raho
Grafici lineari Oltre ai grafici areali descritti in precedenza in cui le occorrenze (frequenze) dei valori di una variabile sono presentate da aree di rettangoli o di settori circolari I grafici lineari rappresentano l’andamento di un fenomeno (spesso rispetto al tempo) Ricordare assi cartesiani Informatica e statistica 2003 Prof. Giovanni Raho
Grafici lineari e sviluppo nel tempo Variazione pendenza Informatica e statistica 2003 Prof. Giovanni Raho
Il grafico lineare Il grafico lineare rappresenta l’andamento dei valori di una variabile. Come tale può ricavare valori indirettamente e può introdurre alla previsione futura. Informatica e statistica 2003 Prof. Giovanni Raho
Grafico lineare e linee di tendenza Si noti il collega,emto tra l’anda,mento della retta ed il coeff. angolare Informatica e statistica 2003 Prof. Giovanni Raho
La linea di tendenza Se nello studio di un fenomeno ci si accorge che le variabili degli eventi successivi hanno misure con uno sviluppo regolare e … se si può supporre che le cause non siano modificate nel tempo … possiamo prolungare la linea che unisce i successivi momenti oltre le misure già effettuate. Informatica e statistica 2003 Prof. Giovanni Raho
La linea di tendenza IL prolungamento del fenomeno nel tempo è favorito da alcuni algoritmi matematici che tengono conto delle oscillazioni di una variabile intorno a valori medi. La retta di regressione è l’esempio più noto di tale metodo di previsione. Informatica e statistica 2003 Prof. Giovanni Raho
Linee di tendenza Si possono costruire con metodi matematici più o meno complessi linee di forma diversa … La cui forma è individuata dal grado dell’equazione rappresentativa La scelta della linea di tendenza che si avvicina di più ai valori rilevati può essere fatta col parametro R2. Informatica e statistica 2003 Prof. Giovanni Raho
Linee di tendenza y=5x+3 l’andamento del fenomeno è crescente Nel caso di linea di tendenza lineare è possobile associare ad una successione di eventi il coefficiente angolare della retta come elemento di sintesi. Esempio: y=5x+3 l’andamento del fenomeno è crescente y = -6x + 3 l’andamento del fenomeno e decrescente y = -10x + 3 il fenomeno decresce più rapidamente della precedente Informatica e statistica 2003 Prof. Giovanni Raho
Linea di tendenza ed R2 R2 varia da 0 nessuna aderenza a 1 completa aderenza ai valori rilevarti Informatica e statistica 2003 Prof. Giovanni Raho
L’andamento di una popolazione Informatica e statistica 2003 Prof. Giovanni Raho
Grafico dell’andamento della popolazione linea di tendenza lineare ossia di 1° grado. RETTA detta anche retta di regressione Informatica e statistica 2003 Prof. Giovanni Raho
Andamento della popolazione tendenza di grado superiore al 1° Informatica e statistica 2003 Prof. Giovanni Raho
La statistica e la probabilità Esame delle differenze e della causalità Nell’analisi di un fenomeno si usa spesso considerare contemporaneamente i valori di due o più variabili. Il metodo più semplice per valutare le possibili relazioni tra variabili è … Informatica e statistica 2003 Prof. Giovanni Raho
L’uso ed il confronto delle frequenze di un evento Opinione Frequenza Favorevole 78 Contrario 59 Totale 137 Opinione Frequenza Favorevole 120 Contrario 100 Totale 220 Informatica e statistica 2003 Prof. Giovanni Raho
Grafico Riunendo le due tabelle si può utilizzare un grafico a colonne per valutare i due fenomeni. Informatica e statistica 2003 Prof. Giovanni Raho
Incrocio tra i valori di due o più variabili Informatica e statistica 2003 Prof. Giovanni Raho
Lettura di una tabella 23 anziani hanno un’istruzione superiore 12 giovani hanno un’istruzione elementare Informatica e statistica 2003 Prof. Giovanni Raho
Confronti tra frequenze in due variabili Informatica e statistica 2003 Prof. Giovanni Raho
Andamenti di valori di una o più variabili Informatica e statistica 2003 Prof. Giovanni Raho
Esercizio Si costruisca con EXCEL il grafico dei dati riprodotti in precedenza Grafico a colonne Informatica e statistica 2003 Prof. Giovanni Raho
Grafico a colonne impilate Permette un’analisi all’interno di diverse categorie della distribuzione delle frequenze dei livelli di istruzione. Informatica e statistica 2003 Prof. Giovanni Raho
Grafico a colonne impilate Categorie Informatica e statistica 2003 Prof. Giovanni Raho
Analisi multivarata Si tratta di un’analisi dei valori di due variabili in cui interviene una terza variabile discriminante per valutare gruppi di caratteristiche diverse. Es. Il livello di istruzione rispetto all’età, può essere diverso se si considerano gruppi il cui reddito familiare (terza variabile discriminante) sia diverso Informatica e statistica 2003 Prof. Giovanni Raho
Analisi multivariata Reddito alto Il diverso reddito introduce una variazione nella composizione dei gruppi Reddito basso Informatica e statistica 2003 Prof. Giovanni Raho
Analisi multivariata Si veda nel testo Lezioni di Informatica … Il paragrafo 7.7.5 pag. 131 L’uso dei grafici per l’analisi multivariata. L’esercizio n. 2 a pag. 106: Le tabelle dell’analisi multivarata. Informatica e statistica 2003 Prof. Giovanni Raho
Metodi matematici Oltre ai metodi grafici EXCEL permette l’uso di metodi matematici quali: Calcolo del chi2 Valuta la indipendenza tra i valori di due variabili attraverso la valutazione delle occorrenze contemporanee dei valori di due variabili Può essere calcolato spezzando la formula in vari passaggi Informatica e statistica 2003 Prof. Giovanni Raho
chi2 Si applica da una tabella a due entrate Attraverso i totali di riga, colonna e complessivi calcola le frequenze teoriche e le confronta con le frequenze osservate. Risulta un parametro che va confrontato con parametri tabulati che permettono di valutare la probabilità di indipendenza tra due variabili. Informatica e statistica 2003 Prof. Giovanni Raho
Normalizzazione dei dati Si possono trasformare i dati grezzi di una ricerca prendendo come unità di misura la deviazione standard e punto di origine la media aritmetica dei dati grezzi. Ciò risulta facile col foglio elettronico utilizzando la procedura copia Informatica e statistica 2003 Prof. Giovanni Raho
Metodi matematici Oltre ai metodi grafici EXCEL permette l’uso di metodi matematici quali: Calcolo del coefficiente di Pearson Valuta la relazione tra due variabili attraverso la valutazione delle occorrenze contemporanee dei valori delle due variabili. Informatica e statistica 2003 Prof. Giovanni Raho
Elaborazione dei dati Si veda anche le diapositive nella parte introduttiva al programma S. P. S. S.. ( diapositive 5 – 11) Informatica e statistica 2003 Prof. Giovanni Raho