Strumenti statistici in Excell

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
LA VARIABILITA’ IV lezione di Statistica Medica.
Distribuzione Normale o Curva di Gauss
Intervalli di confidenza
Proprietà degli stimatori
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Variabili casuali a più dimensioni
Lez. 3 - Gli Indici di VARIABILITA’
Analisi dei dati per i disegni ad un fattore
Analisi preliminari dei dati
Descrizione dei dati Metodi di descrizione dei dati
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Statistica descrittiva
Inferenza statistica per un singolo campione
Valutazione delle ipotesi
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
DIFFERENZA TRA LE MEDIE
Analisi della varianza (a una via)
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 9: test di Student
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 6: la funzione c2
Corso di biomatematica lezione 7-2: Test di significatività
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
Valutazione della stima: gli intervalli di confidenza
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Popolazione campione Y - variabile casuale y - valori argomentali Frequenza relativa: Estrazione Densità della classe i-esima: Lezione 1.
Il test di ipotesi Cuore della statistica inferenziale!
Statistica Descrittiva
Le distribuzioni campionarie
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
COSA VUOL DIRE FARE STATISTICA
La verifica d’ipotesi Docente Dott. Nappo Daniela
Lezione B.10 Regressione e inferenza: il modello lineare
Martina Serafini Martina Prandi
La statistica F Permette di confrontare due varianze, per stabilire se sono o no uguali. Simile al valore t di Student o al chi quadrato, l’F di Fisher.
3 June Biostatistica Biostatitistica= Statistica per scienze Biostatitistica= Statistica per scienze biologiche e sanitarie. biologiche e sanitarie.
Test basati su due campioni Test Chi - quadro
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Intervalli di confidenza
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Elaborazione statistica di dati
Accenni di analisi monovariata e bivariata
ANALISI E INTERPRETAZIONE DATI
STATISTICHE DESCRITTIVE
TRATTAMENTO STATISTICO DEI DATI ANALITICI
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
Distribuzioni limite La distribuzione normale Si consideri una variabile casuale rappresentata mediante una combinazione lineare di altre variabili casuali.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Implementazione.
Transcript della presentazione:

Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell

Pacchetto “Analisi di dati” Strumenti di analisi: Analisi varianza: ad un fattore Analisi varianza: a due fattori con replica Analisi varianza: a due fattori senza replica Correlazione Covarianza Statistica descrittiva Smorzamento esponenziale Test F a due campioni per varianze Analisi di Fourier Istogramma Media mobile Generazione di un numero casuale Rango e percentile Regressione Campionamento Test t: due campioni accoppiati per le medie Test t: due campioni assumendo uguale varianza Test t: due campioni assumendo varianze diverse Test z: due campioni accoppiati per le medie

strumento: Statistica descrittiva (cenni) Media: si ottiene dividendo la somma dei valori di una variabile per il numero dei dati n. Errore standard (della media): misura dell’incertezza sulla stima della media (dipende da n) Mediana: valore che divide a metà i dati dell’insieme Moda: valore che si presenta con maggiore frequenza Deviazione standard: misura di variabilità, è la radice quadrata della varianza Varianza campionaria: misura di variabilità; media degli scarti (differenza tra ogni valore della variabile e la media) elevati al quadrato Curtosi: misura la “pesantezza” delle code delle distribuzioni simmetriche di freq./probabilità. Se le code sono più pesanti della Gaussiana, allora la curtosi è positiva. Code “leggere” = curtosi negativa. Asimmetria: identifica la mancanza di simmetria in una distribuzione di freq./prob. L'asimmetria positiva indica una distribuzione con una coda asimmetrica che si estende verso i valori più positivi. L'asimmetria negativa indica una distribuzione con una coda asimmetrica che si estende verso i valori più negativi. Intervallo: differenza tra valore max e min. Minimo: valore minimo Massimo: valore massimo Somma: somma di tutti i valori della variabile Conteggio: numero dei valori della variabile Più grande(k): k-esimo valore più grande Più piccolo(k): k-esimo valore più piccolo Livello di confidenza(95,0%): misura dell’affidabilità della stima della media

Strumento: Istogramma Consente di calcolare le frequenze individuali e cumulative per un intervallo di celle e di classi di dati. Permette di avere una prima indicazione della distribuzione di frequenza/probabilità di una serie di dati. La distribuzione delle frequenze è dipendente dalle classi scelte. Opzioni della finestra di dialogo Istogramma: •intervallo di classe (facoltativo): immettere un intervallo di celle contenente un insieme di valori limite che definiscano gli intervalli delle classi

Strumento: test T per il confronto tra due campioni (cenni!) Tale strumento permette di confrontare le medie di due popolazioni rappresentate da due campioni. I test si basano sull’ipotesi che: - le popolazioni seguano una distribuzione di probabilità gaussiana - i campioni siano casuali e indipendenti - le varianze delle popolazioni siano uguali 5 5

Strumento: test T per il confronto tra due campioni (cenni!) Per svolgere il test è necessario fissare una ipotesi (chiamata ipotesi nulla) che afferma l’uguaglianza dei due campioni (test a due code). Il valore del test T permette di rifiutare o non rifiutare tale ipotesi. l’excel fornisce il valore del test “stat t” e il “valore critico di t”, quest’ultimo utilizzato per arrivare alla decisione statistica. Se stat t < t critico allora non rifiuto l’ipotesi nulla (i due campioni sono uguali) Se stat t > t critico allora rifiuto l’ipotesi nulla (i due campioni sono diversi) 6 6

Strumento:Correlazione (cenni) Il coefficiente di correlazione r misura la forza e il tipo di relazione lineare tra due variabili. L’excel può fornire anche una matrice di coefficienti di correlazione (basta inserire nell’intervallo di input più di due variabili) Se r= -1 => perfetta relazione negativa Se r=1=> perfetta relazione positiva. Se r=0 => relazione nulla 7 7

Strumento:Regressione (cenni) 8 8

REGRESSIONE (cenni) L’obiettivo della R.L.S. è: trovare un’equazione lineare che descriva la relazione tra due variabili X e Y. La relazione tra X e Y, ovvero il modello di regressione lineare semplice, è descritto da: y = β0 + β1x + ε ε: variabile casuale, detta errore. I coefficienti b0 e b1 vengono stimati dall’excell con il metodo dei minimi quadrati ordinari (OLS) E’ possibile considerare più variabili x (regressione multivariata)

REGRESSIONE (cenni) I risultati di una regressione devono essere giudicati essenzialmente in due livelli: “bontà di adattamento del modello”: misurabile mediante il valore di R2 (coefficiente di determinazione lineare) che deve tendere al valore 1. valore del test t di Student che dovrebbe assumere un valore pari circa a due.