STATISTICA 6.0: REGRESSIONE LINEARE Obiettivi della lezione: A Introduzione alla regressione lineare con il software STATISTICA (Versione 6.0) B Passi principali per l’esecuzione della procedura C Esempi
A Regressione lineare: retta di regressione Considereremo soltanto il caso di regressione semplice (non multipla), ma STATISTICA consente di trattare agevolmente anche il caso di più variabili indipendenti. Si vuole cercare la relazione lineare tra due variabili x e y. Date n osservazioni congiunte di 2 variabili cerco due coefficienti a e b tali che y=ax+b passi il più possibile vicino a questi punti. Cerco a e b tali che sia minima (Metodo dei minimi quadrati)
B Procedura: inserimento dati e opzioni Statistiche -----> Regressione Multipla Variabile dipendente Variabile indipendente Tipo di file in input (di dati) Modalità di trattamento dei casi mancanti Il grafico lo ottengo seguendo la seguente sintassi: Grafici -----> Scatterplot
Richiami Precisazioni
C Esempio1 Variabile indipendente Variabile dipendente Riepilogo: risultati della regressione da salvare in un Registro Altre analisi statistiche
B Procedura: risultati Dipendenti: ricorda il nome della variabile dipendente N. di casi: dipende dall’opzione scelta per i Missing Cases R2: esprime la proporzione di variazione della variabile dipendente y spiegata dal modello. E’ il quadrato del coefficiente di correlazione stimato. Se è ~1 il modello è buono (i valori stimati e quelli osservati sono fortemente correlati) Se è ~0 il modello non è adeguato R: coefficiente di correlazione stimato Se è ~1 ho dipendenza lineare diretta tra le 2 variabili Se è ~ -1 ho dipendenza lineare inversa tra le 2 variabili Se è ~0 non esiste relazione tra le variabili. Errore standard di stima: dispersione dei valori osservati intorno alla retta di regressione Intercetta: valore di b Err. Std: errore standard sull’intercetta p: p-value si sottopone a test l’ipotesi che l’intercetta sia nulla Se Var1 Beta è evidenziato in rosso, significa che non posso rifiutare l’ipotesi di dipendenza lineare tra le due variabili
Risultati Regressione Andamento di tipo lineare Due coefficienti della retta di regressione Test di ipotesi: H0: i coefficienti della retta sono nulli Scatterplot
Risultato dell’analisi C Esempio 2 Risultato dell’analisi Il coeff. di correlazione R è significativo ed è negativo La dipendenza è lineare inversamente proporzionale Variabile indipendente Variabile dipendente
Test di ipotesi:H0: i coefficienti della retta sono nulli Regression summary Test di ipotesi:H0: i coefficienti della retta sono nulli test sull’intercetta: non posso rifiutare H0 test sull coefficiente angolare: rifiuto H0
Esercizio Un materiale utilizzato per la produzione di una fibra sintetica è immagazzinato in un locale privo di controllo del livello di umidità. Al variare della percentuale di umidità nel locale si registrano i seguenti stati igrometrici nel materiale (espressi in percentuale) % umidità magazzino % umidità materiale 46 12 53 14 37 11 42 13 34 10 29 8 60 17 44 41 48 15 33 9 40
Determinare la retta di regressione di Y=“% umidità nel materiale” rispetto a X=“% umidità nel magazzino”. Stimare il contenuto percentuale di umidità nel materiale quando la percentuale di umidità nel magazzino risulta del 38%.