Alcune metodiche Relazione tra consanguineità ed isonimia (Crow & Mange, 1965) F = I / 4 Metodo delle coppie ripetute (Lasker & Kaplan, 1985) Indici di.

Slides:



Advertisements
Presentazioni simili
LA MEDIA STATISTICA di Zappa Giacomo.
Advertisements

Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento.
Analisi Fattoriale Esplorativa
Il concetto di misura.
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
ANALISI DELLA COVARIANZA
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Popolazione, campione, parametri e stimatori
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
Teoria e Tecniche del Riconoscimento
Analisi trivariata Lavorando con due variabili è possibile descrivere la relazione che fra queste esiste e formulare una congettura circa il tipo di legame.
Analisi della varianza (a una via)
Processi Aleatori : Introduzione – Parte I
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Alcune domande agli autori Lo studio affronta un argomento scientifico e/o clinico importante? Lo studio è originale? Lo studio è volto a provare le ipotesi.
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
Analisi delle corrispondenze
Test della differenza tra le medie di due popolazioni
Analisi della varianza
Verifica delle ipotesi su due campioni di osservazioni
Statistica Descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Corso di POPOLAZIONE TERRITORIO E SOCIETA’ 1 AA
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
ANALISI FATTORIALE. Cosè lanalisi fattoriale? Statistica descrittiva Rappresentazione delle variabili in studio. Statistica confermativa vs Confermare,
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
Simone Mosca & Daniele Zucchini 4Bi.
Scomposizione della devianza
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Regressione Lineare parte 2 Corso di Misure Meccaniche e Termiche David Vetturi.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6 Analisi Fattoriale: le ipotesi del modello e il metodo delle component principali.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9 Regressione lineare multipla: la stima del modello e la sua valutazione, metodi automatici.
Due esempi con dati reali
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Strumenti statistici in Excell
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
IL CAMPIONE.
Corso di Laurea in Scienze e Tecniche psicologiche
Analisi Multivariata dei Dati
Riassumendo: ipotesi per OLS 1.Modello lineare 2.X e Y sono frutto di osservazioni indipendenti 3.X è di rango pieno 4.I residui hanno media = 0 5.I residui.
Metodi Quantitativi per Economia, Finanza e Management Lezioni n°7-8.
Analisi discriminante lineare - contesto
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Tecniche di analisi matematica. Gli studi di autenticazione e di tracciabilità sugli alimenti sono generalmente effettuati individuando variabili chimico-fisiche.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Elaborazione statistica di dati
Corso di Laurea in Scienze e tecniche psicologiche
Correlazione e regressione lineare
Coefficienti di inbreeding per alcune popolazioni umane Canada cattolico Stati Uniti Cattolici Hutterites 0.02 Dunkers 0.03.
La covarianza.
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Riduzione dei Dati. Nelle scienze sociali ci si trova molto spesso di fronte a ricerche in cui vi è una sovrabbondanza di misurazioni nel tentativo di.
Distribuzioni limite La distribuzione normale Si consideri una variabile casuale rappresentata mediante una combinazione lineare di altre variabili casuali.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
L’analisidei dati L’analisi dei dati Analisi mutlidimensionali: Analisi delle corrispondenze multiple Cluster Analysis.
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
Transcript della presentazione:

Alcune metodiche Relazione tra consanguineità ed isonimia (Crow & Mange, 1965) F = I / 4 Metodo delle coppie ripetute (Lasker & Kaplan, 1985) Indici di similarità in cognomi (Lasker, 1977)

Analisi in Componenti Principali E’ una tecnica statistica il cui scopo principale è quello di ridurre il contenuto e la ridondanza informativa di un set di dati. L’analisi in componenti principali è dunque indicata quando ogni osservazione di un insieme o di un campione è rappresentata da misure relative a più variabili. Tali variabili descrivono il punto nello spazio multidimensionale nel quale ogni osservazione si viene a trovare rispetto alle altre osservazioni. Lo scopo è dunque quello di ridurre lo spazio multidimensionale, difficilmente interpretabile e rappresentabile graficamente, ad uno spazio bidimensionale (cartesiano), nel quale sia il più possibile sintetizzato il contenuto informativo dei dati originali.

La matrice di correlazione/ 1 Se si suppone che il contenuto informativo di un dataset sia ridondante ciò significa che le variabili che lo compongono siano tra loro in parte correlate, vale a dire che alcune di esse spiegano, almeno in parte, il medesimo aspetto del fenomeno studiato. Il coefficiente di correlazione tra due variabili è dato da: r è un numero che varia da -1 a +1, valori ai quali si raggiunge la massima correlazione, negativa nel primo caso, positiva nel secondo. r = 0 identifica al contrario l’assenza di correlazione.

La matrice di correlazione/ 2 Variabile Omicidi Stupri Rapine Aggress. Furti Truffe Furti auto 1.00 0.35 0.44 0.21 0.56 0.76 0.53 0.23 0.46 0.27 0.42 -0.07 0.49 0.26 0.34 0.05 0.36 0.38 0.31

Cosa sono le “Componenti Principali”? Le Componenti Principali di un set di dati sono la combinazione lineare delle variabili originali opportunamente pesate. Si basano sul concetto di score. Lo score è il valore di ogni osservazione rispetto ad ogni nuova singola componente principale. Si definisce come Dove c1 = score dell’osservazione 1 sulla componente 1 b1p = peso della variabile originaria p nella creazione della componente principale 1 Xp = il valore osservato della variabile p per l’osservazione 1

Caratteristiche delle Componenti Principali Si possono estrarre tante componenti principali quante sono le variabili originarie La varianza totale spiegata dalle componenti principali è uguale a quella spiegata dalle variabili originarie La prima CP spiega la quota massima di variabilità complessiva delle variabili originarie, la seconda CP spiega il massimo della variabilità residua, ecc. Le CP sono incorrelate tra loro. Ciò significa che sono completamente indipendenti una dall’altra e che i loro coefficienti di correlazione sono pari a 0

Determinazione del numero di componenti da ritenere CP Autovalori Proporzione Cumulativa 1 149233.2 0.69 2 30871.4 0.14 0.83 3 19232.9 0.09 0.92 4 12679.2 0.06 0.98 5 4254.0 0.02 100.0 6 44.2 0.00 7 10.5

Scores delle osservazioni sulle due prime CP Città Score CP1 Score CP2 Atlanta -1.164 1.056 Boston -2.084 -0.085 Chicago -0.896 2.167 Dallas 1.184 1.085 Denver 1.064 -1.563 Detroit 1.842 0.249 Hartford -3.283 -0.297 Honolulu -2.100 -1.901 Houston -0.034 1.266 Kansas City 1.060 0.133 Los Angeles 3.199 -1.265 New Orleans 0.814 0.645 New York 1.985 -0.530 Portland -0.728 -1.594 Tucson -2.031 -0.162 Washington 1.171 0.796

Rappresentazione grafica delle osservazioni sulle nuove CP Persona Tipo di reato Proprietà Bassa Alta Intensità di delinquenza

Qualità della vita – Capoluoghi di regione 2011 Affari e lavoro Ordine pubblico Popolazione Servizi, Ambiente e Salute Tempo libero Tenore di vita

Determinazione del numero di CP da ritenere Autovalori Proporzione Cumulativa 1 3.70 0.617 2 1.37 0.229 0.846 3 0.42 0.069 0.915 4 0.26 0.043 0.958 5 0.16 0.026 0.984 6 0.09 0.015 100.0

Pesi delle variabili originarie sulle prime 2 CP Prima componente Seconda componente

Grafico delle prime 2 CP