Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Slides:



Advertisements
Presentazioni simili
Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Advertisements

Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Come organizzare i dati per un'analisi statistica al computer?
METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Presupposti alla lezione
Variabili casuali a più dimensioni
Analisi dei dati per i disegni ad un fattore
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
CLUSTER ANALYSIS Insieme di tecniche con l’obiettivo di unire le unità di un insieme statistico in un numero finito di classi o gruppi i quali devono.
ANALISI DELLA COVARIANZA
Gli errori nell’analisi statistica
La natura delle ipotesi
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
Apprendimento Non Supervisionato
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
ANALISI DEI GRUPPI seconda parte
ALBERI DECISIONALI prima parte
Analisi della varianza (a una via)
Introduzione alla statistica per la ricerca Lezione I
Appunti di inferenza per farmacisti
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Alcune domande agli autori Lo studio affronta un argomento scientifico e/o clinico importante? Lo studio è originale? Lo studio è volto a provare le ipotesi.
Metodi di ricerca in Psicologia
Metodi della ricerca in Psicologia
CORSO DI MODELLI DI SISTEMI BIOLOGICI LAUREA IN INGEGNERIA CLINICA E BIOMEDICA.
Analisi delle corrispondenze
Analisi dei gruppi – Cluster Analisys
Complementi al Corso di Ecologia - Approfondimenti di statistica
Propagazione degli errori
Verifica delle ipotesi su due campioni di osservazioni
Regressione Logistica
Le distribuzioni campionarie
ANALISI FATTORIALE. Cosè lanalisi fattoriale? Statistica descrittiva Rappresentazione delle variabili in studio. Statistica confermativa vs Confermare,
La ricerca delle relazioni tra fenomeni
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
MODELLI NON PARAMETRICI
Statistica La statistica è
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Strumenti statistici in Excell
Altri coefficienti di correlazione
Martina Serafini Martina Prandi
IL CAMPIONE.
Analisi Multivariata dei Dati
3 June Biostatistica Biostatitistica= Statistica per scienze Biostatitistica= Statistica per scienze biologiche e sanitarie. biologiche e sanitarie.
Analisi discriminante lineare - contesto
ANALISI DEI GRUPPI I. La Cluster analysis è uno strumento di classificazione capace di scomporre una realtà complessa di osservazioni plurime in tipologie.
REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta.
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Correlazione e regressione lineare
EPG di Metodologia della ricerca e Tecniche Multivariate dei dati A.A
Accademia europea dei pazienti sull'innovazione terapeutica Lo scopo e i fondamenti della statistica negli studi clinici.
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.
L’analisidei dati L’analisi dei dati Analisi mutlidimensionali: Analisi delle corrispondenze multiple Cluster Analysis.
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno attraverso il modello di riferimento

Tecniche descrittive Metodo: il modello è creato ad hoc sui dati sperimentali Diversi livelli di complessità del modello a seconda del fenomeno in studio Esempi: distribuzioni di probabilità, analisi fattoriale, analisi discriminante, cluster analysis

Tecniche descrittive Applicazioni: Indagini esplorative sui dati sperimentali per la successiva formulazione di idee Verifica della validità interna e esterna di test psicometrici

Analisi Discriminante Fine: suddividere il campione in gruppi Metodo Fase di addestramento Fase di analisi

Analisi Discriminante Assunti: I fattori predittivi devono avere distribuzione gaussiana I fattori devono essere scarsamente correlati fra loro Le correlazioni devono essere costanti all’interno dei gruppi Le medie e deviazioni standard dei fattori non devono essere correlate fra loro

Analisi Discriminante La fase di addestramento utilizza un campione di soggetti, di cui si conosce l’appartenenza a uno dei gruppi considerati, per calcolare i parametri necessari alla classificazione di un nuovo soggetto

Analisi Discriminante I valori prodotti dalla funzione discriminante hanno media = zero, varianza = 1 e garantiscano la massima differenza possibile fra le medie di gruppo

Analisi Discriminante La fase di analisi applica i parametri calcolati per la classificazione di nuovi soggetti in una delle classi possibili La classificazione si basa sul calcolo di una funzione in grado di fornire un valore soglia opportunamente determinato che discrimini i gruppi

Analisi Discriminante Funzione ottenuta come combinazione lineare dei parametri misurati, cioè come somma dei parametri moltiplicati per opportuni coefficienti dik= b0k+bjkxi1+…bpkxip dik è il valore della k funzione discriminante relativa al soggetto i bjk è il valore del coefficiente j per la funzione k p è il numero dei fattori predittivi xij è il valore dovuto al fattore j per il soggetto i

Analisi Discriminante Parametri determinati in modo che: i valori prodotti dalla funzione discriminante abbiano media zero, varianza unitaria garantiscano la massima differenza possibile fra le medie di gruppo

Analisi Discriminante Per ogni soggetto viene calcolata la probabilità di appartenere a ciascun gruppo e si procede all’assegnazione del soggetto al gruppo per cui è maggiore la probabilità di appartenenza

Analisi Discriminante 2 gruppi: la soglia che divide i due gruppi è situata nel punto di mezzo delle due medie di gruppo Più di 2 gruppi: le funzioni utilizzate sono tante quante il numero dei gruppi meno uno (non è possibile usare una sola soglia ma occorre calcolare la probabilità di appartenenza del soggetto al gruppo)

Analisi Discriminante Al termine della fase di apprendimento è possibile riassegnare i soggetti ai gruppi di appartenenza utilizzando le funzioni discriminanti calcolate Questa operazione permette di valutare l’efficienza del sistema di classificazione

Analisi Discriminante Successo dipende: dall’efficienza con cui abbiamo creato le funzioni di classificazione dalle ipotesi che abbiamo formulato dai parametri che abbiamo conseguentemente considerato

Analisi Discriminante Utilizzo: Sistema di classificazione in grado di classificare ogni nuovo soggetto senza conoscere realmente a quale gruppo appartiene Individuare quali fattori incidono maggiormente nella discriminazione fra più gruppi

Cluster Analysis Scopo: individuare la miglior suddivisione in gruppi del campione in esame Cluster: addensamento attorno a un valore centrale in uno spazio a n dimensioni

Cluster Analysis Assunti: Variabili che determinano la suddivisione possono essere a distribuzione gaussiana o categoriche Individua i gruppi in modo che siano massimamente omogenei al loro interno e eterogenei fra loro

Cluster Analysis La funzione dell’analisi dei cluster è quella di classificare i casi in un certo numero di gruppi senza che venga richiesta una preliminare identificazione dei gruppi. Questi gruppi possono essere utilizzati in ulteriori analisi statistiche per la verifica di ipotesi riguardanti nuove variabili non utilizzate nella classificazione

Cluster Analysis Analisi Cluster gerarchica: generano suddivisioni gerarchicamente ordinate (n-1 possibili cluster) Analisi Cluster non gerarchica: generano un’unica suddivisione (numero prefissato di gruppi); riservati a dati quantitativi, basati sulle distanze euclidee dai centroidi.

Cluster Analysis Analisi Cluster gerarchica Identificazione delle variabili Selezione del tipo di distanza Selezione di una tecnica di raggruppamento Identificazione del numero dei gruppi Valutazione e interpretazione della soluzione

Cluster Analysis Si parte da un algoritmo che inizialmente prevede tanti gruppi quanti sono i casi e in seguito unisce i gruppi tra loro a due a due fino ad ottenere un unico cluster. Le misure delle distanze sono generate dalla matrice di prossimità A seconda del tipo di scala si sceglie il metodo per il calcolo delle distanze più appropriato

Cluster Analysis Quanti gruppi scegliere rimane un problema! dai coefficienti di agglomerazione, si sceglie il livello precedente al livello con coefficiente più alto Dal dendrogramma che delinea le relazioni, si sceglie la soluzione che prevede una certa similarità degli elementi del cluster e che sia parsimoniosa

Cluster Analysis Valutazione e interpretazione dei risultati Statistica descrittiva Relativa alle variabili di partenza Relativa ai cluster e ai punteggi prodotti dai cluster Statistica inferenziale

*quantitative gaussiane Cluster Analysis Analisi Cluster non gerarchica (k-medie) Identificazione delle variabili* Identificazione del numero dei gruppi Identificazione dei semi della ripartizione Valutazione e interpretazione della soluzione *quantitative gaussiane

Cluster Analysis La distanza fra i gruppi viene calcolata sulle medie dei gruppi che devono essere il più diverse possibili Si individua il centroide ovvero il punto che ha come coordinate le variabili considerate Si assegnano gli oggetti ai gruppi in modo da minimizzare le distanze Si ridefiniscono (iterative method) i centroidi in modo da rendere minima la varianza interna e massima la varianza tra i cluster Il processo termina fino a quando non c’è più un decremento significativo della funzione da minimizzare@ Metodo per creare la distanza (k-medie): Distanza euclidea: la somma dei quadrati delle differenze di tutte le variabili utilizzate (trasformate in variabili z)

Cluster Analysis Il numero dei gruppi è stabilito dal ricercatore in base alle considerazioni teoriche sul fenomeno in studio Le distanze sono calcolate tra i casi

MISURA della CORRELAZIONE

Correlazione fra più variabili di uno stesso campione Analisi della correlazione Analisi della regressione Analisi della covarianza Analisi della correlazione parziale

Analisi della Correlazione Scopo: analizzare la relazione fra variabili quantitative (a distribuzione gaussiana o non gaussiana) Fornisce sia il senso della relazione che la significatività

Analisi della Correlazione Correlazioni parametriche: r di Pearson Correlazioni non parametriche: Tau di Kendall Rho di Spearman

Analisi della Correlazione r di Pearson Misura dell’associazione lineare fa due variabili. I valori del coefficiente vanno da -1 a 1. Il segno del coefficiente indica una relazione positiva o negativa. Il suo valore assoluto indica la forza della relazione. Dipende dalla numerosità campionaria quindi va associato alla significatività

Analisi della Correlazione Tau di Kendall Rho di Spearman Entrambi misura dell’associazione non parametrica basata su dati o ordinali o a ranghi. I valori di entrambi i coefficienti vanno da -1 a 1. Il segno del coefficiente indica una relazione positiva o negativa. Il suo valore assoluto indica la forza della relazione. Dipendono dalla numerosità campionaria quindi va associato alla significatività Esempio

Analisi della Correlazione Utilizzi Misura dell’associazione fra variabili Verifica dell’attendibilità e della validità di questionari

Relazione fra risultati prodotti da diverse ricerche Misura dell’effect-size Meta analisi Review

Effect size o forza dell’effetto Grado con cui il fenomeno è presente nella popolazione Intensità della relazione fra fattore e variabile dipendente Confronto fra variabilità dovuta ai fattori e la variabilità totale Variabilità misurata come varianza spiegata Diversi indici a seconda dei dati e dei test utilizzati

Meta Analisi Scopo: permette di confrontare i risultati di diverse ricerche riguardanti uno stesso argomento nonostante siano basate su numerosità campionaria diverse e diversi test statistici utilizzati Finalità: comprendere il funzionamento del fenomeno da studi diversi a volte discordanti

Meta Analisi Per evitare di fare confronti inutili occorre specificare ovvero delimitare l’ambito di analisi in modo da semplificare il problema e quindi l’interpretazione dei risultati Limitare le variabili in studio e eventualmente applicare più di una metanalisi ES. Studio dell’effetto dell’ansia sulle prestazioni cognitive: quali indici di ansia considerare?

Raccolta e codifica degli studi Meta Analisi Procedimento: Raccolta e codifica degli studi Calcolo degli indici di confronto Sintesi: calcolo dell’effetto medio Interpretazione dei risultati

Meta Analisi: 1. Raccolta e codifica Gli studi raccolti devono essere adeguati e di ampia numerosità per evitare l’errore dovuto alle pubblicazioni (pubblication bias) e all’errore di campionamento Definire l’ipotesi di riferimento che specifica le variabili da utilizzare (fattori o predittori, covariate o moderatori) Pesare gli studi in base alla correttezza metodologica (es attraverso intention to treat analysis)

Meta Analisi: 2. Calcolo degli indici di confronto Valutazione delle differenze fra le medie rapportate alla deviazione standard casuale Tale valutazione, nel caso di due gruppi indipendenti, può essere calcolata dalla formula

Meta Analisi: 2. Calcolo degli indici di confronto Nel caso conosciamo solo la numerosità dei gruppi e il valore del parametro t possiamo ottenere lo stesso indice dalla formula

Meta Analisi: 3. Calcolo dell’effetto medio Effetto medio: media degli effetti nelle diverse ricerche effettuate Permette di ottenere una valutazione complessiva dei risultati

Meta Analisi: 4. Interpretazione Permette di trasformare le descrizioni delle ricerche effettuate su un particolare argomento in una valutazione obiettiva dei risultati ottenuti Tuttavia necessitano di una interpretazione dettagliata e motivata dell’analisi Inoltre considera solo le ricerche pubblicate