ANALISI DEI DATI STATISTICI

Slides:



Advertisements
Presentazioni simili
- le Medie la Moda la Mediana
Advertisements

8) GLI INTERVALLI DI CONFIDENZA
Le distribuzioni di probabilità continue
Come organizzare i dati per un'analisi statistica al computer?
STATISTICA A – K (60 ore) Esercizi di riepilogo al corso
PROVA B: ESERCIZIO 1 Risolvere il sistema lineare (4 equazioni in 5 incognite):
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
Capitolo 8 Sistemi lineari.
L’Analisi Fattoriale (PCA) con SPSS
“Teoria e metodi della ricerca sociale e organizzativa”
Fondamenti della Misurazione
CLUSTER ANALYSIS Insieme di tecniche con l’obiettivo di unire le unità di un insieme statistico in un numero finito di classi o gruppi i quali devono.
ANALISI DELLA COVARIANZA
Elementi di STATISTICA DESCRITTIVA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Ripasso (dallanalisi univariata allanalisi fattoriale) Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°7.
Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia l’analisi statistica.
Inferenza statistica per un singolo campione
Esperienza di laboratorio sull’elasticità
CAPITOLO 5 Elasticità.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
U V U V (a) |cfc|=2 prima e dopo (b) |cfc|=2 prima e |cfc|=1 dopo
ANALISI DEI GRUPPI seconda parte
ALBERI DECISIONALI prima parte
COSA VUOL DIRE FARE STATISTICA
PROGETTI DI SISTEMI INFORMATIVI DIREZIONALI
EQUAZIONI PER IL MOTO DEI FLUSSI GEOFISICI
Analisi dei gruppi – Cluster Analisys
Misurazione Le osservazioni si esprimono in forma di misurazioni
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
METODI E CONTROLLI STATISTICI DI PROCESSO
MOLTIPLICAZIONE COMBINATORIA
Dalle potenze ai numeri binari
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
Analisi Univariata e bivariata Esercizi
MEDIE STATISTICHE.
Le distribuzioni campionarie
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
STATISTICA PER LE DECISIONI DI MARKETING
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Classificazione (aka Cluster Analysis)
Metodi matematici per economia e finanza. Prof. F. Gozzi
LABORATORIO DI ANALISI AVANZATA DEI DATI Andrea Cerioli Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Frontespizio Economia Politica Anno accademico
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Lez.13: Unsupervised classification: clustering gerarchico
Esame di Analisi Multivariata dei Dati
COSA VUOL DIRE FARE STATISTICA
PROGETTO E REALIZZAZIONE DI UN COMPONENTE SOFTWARE PROGRAMMABILE PER LA PIANIFICAZIONE DI COMMISSIONI DI LAUREA FACOLTA’ DI INGEGNERIA Corso di Laurea.
Il residuo nella predizione
Martina Serafini Martina Prandi
Marta Pinto Stefania Serra Valentina Paravidino
Tecniche di analisi matematica. Gli studi di autenticazione e di tracciabilità sugli alimenti sono generalmente effettuati individuando variabili chimico-fisiche.
ECONOMIA POLITICA E-I ESERCITAZIONI. 2 Richiami di matematica – Funzioni Funzioni FUNZIONE: ogni regola matematica che permette di calcolare il valore.
Esercizio Alberi di classificazione DATI Un’azienda vuole valutare l’efficacia di una promozione effettuata attraverso buoni acquisto. Per questo motivo.
DATA MINING PER IL MARKETING Andrea Cerioli Sito web del corso GLI ALBERI DI CLASSIFICAZIONE Introduzione alla metodologia Zani-Cerioli,
A.A STATISTICA E CALCOLO DELLE PROBABILITA’ Docenti: Stefania Mignani Maurizio Brizzi.
Dalmine, 26 Maggio 2004 Esercitazioni di Statistica con Matlab Dott. Orietta Nicolis fttp:\ingegneria.unibg.it.
Le funzioni.
ANALISI E INTERPRETAZIONE DATI
Statistica – L33 (prof. Pellegrini)
Divisione tra un polinomio ed un binomio Regola di Ruffini
Lezioni di Ricerca Operativa Corso di Laurea in Informatica
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
L’Acl nel caso America’s Cup Napoli UNIVERSITÀ DEGLI STUDI DI NAPOLI “FEDERICO II” Dipartimento di Scienze Sociali Corso di Laurea Magistrale in Comunicazione.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Transcript della presentazione:

ANALISI DEI DATI STATISTICI ESERCITAZIONE CAPITOLI 8 E 9 ANALISI DEI DATI STATISTICI DOTT.SSA LARA BERZIERI

ESERCIZIO 1 Considerata la seguente matrice dei dati avente 5 unità e 3 variabili: si calcolino la matrice delle distanze euclidee e quella della città a blocchi sugli scostamenti standardizzati;

ESERCIZIO 1 le variabili sono espresse in unità di misura diverse calcolo scostamenti standardizzati zi = (xi –M)/ s

ESERCIZIO 1 CALCOLO DISTANZA EUCLIDEA TRA MAGNUM E LIUK =2,254

ESERCIZIO 1

ESERCIZIO 1 CALCOLO DISTANZA CITY-BLOCK TRA MAGNUM E LIUK

ESERCIZIO 1

ESERCIZIO 1 si verifichi se tra le suddette matrici esiste una relazione monotona GRADI NELLE MATRICI IDENTICI ρ = 1

ESERCIZIO 2 Si è calcolata la matrice delle distanze della città a blocchi standardizzate tra 5 ipermercati con riferimento ai prezzi di 20 tipi di ortaggi e frutta.

ESERCIZIO 2 Si costruisca il corrispondente dendrogramma con il metodo del legame singolo Si proponga un opportuno “taglio” di tale dendrogramma, se ne illustrino le informazioni e si descrivano le ulteriori elaborazioni statistiche che occorrerebbero effettuare per poter valutare quali sono i gruppi di ipermercati più convenienti per il consumatore.

ESERCIZIO 2 ANALISI DEI GRUPPI METODO DI FORMAZIONE DEI GRUPPI: NON GERARCHICO K-MEDIE GERARCHICO forniscono una “famiglia” di partizioni partendo da quella banale in cui tutti gli elementi sono distinti (g=n) sino a quella in cui tutte unità sono riunite in un unico gruppo (g=1)

ESERCIZIO 2 I diversi metodi gerarchici differiscono per il CRITERIO DI CALCOLO DELLA DISTANZA TRA DUE GRUPPI Legame singolo (single linkage): Distanza = MINIMO delle distanze tra gli elementi di un gruppo e quelli dell’altro

ESERCIZIO 2 Si è calcolata la matrice delle distanze della città a blocchi standardizzate tra 5 ipermercati con riferimento ai prezzi di 20 tipi di ortaggi e frutta.

ESERCIZIO 2

ESERCIZIO 2 DENDROGRAMMA E’ un diagramma ad albero, verticale o orizzontale (SPSS), per la rappresentazione della successione di partizioni Le “radici” dell’albero sono le unità iniziali A livelli crescenti di distanza si uniscono i gruppi (elementi) tra loro In SPSS le distanze sono riscalate nell’intervallo 0 - 25 per rendere comparabili i dendrogrammi ottenuti con metodi diversi

ESERCIZIO 2 CLUSTER DI APPARTENENZA- SOLUZIONE CON 3 GRUPPI CALCOLO MEDIE DI GRUPPO PER CIASCUNA VARIABILE

ESERCIZIO 3 Si sono classificate 10 aziende in base a 4 indicatori di bilancio standardizzati, utilizzando il legame medio. Spss ha fornito il seguente “programma di agglomerazione” (1 Coca-cola; 2 Microsoft; 3 IBM; 4 Intel; 5 Nokia; 6 HP; 7 American Exp; 8 Sony; 9 Samsung; 10 Pepsi)- Si commenti il significato delle quantità che compaiono nella tabella. Si costruisca il corrispondente dendrogramma e se ne illustrino le informazioni.

ESERCIZIO 3

ESERCIZIO 3 Interpretazione del “programma di agglomerazione” di SPSS Stadio = passo della classificazione gerarchica Cluster accorpati = “gruppi” (elementi) che si uniscono Stadio di formazione del cluster: se =0 indica che il “gruppo” è costituito da una singola unità; se =1, 2, 3, …indica un gruppo di più elementi che si è formato in precedenza, al passo corrispondente Stadio successivo = indica il passo in cui il gruppo ottenuto si riunirà ad altri gruppi

ESERCIZIO 3 TRADE-OFF TRA OMOGENEITA’ INTERNA E SINTESI DELLA PARTIZIONE 2 SOLUZIONE RAGIONEVOLI: CON 3 GRUPPI (CON 4 GRUPPI) PRESENZA OUTLIER: AMERICAN EXPRESS

ESERCIZIO 4 Il dendrogramma riportato di seguito visualizza la classificazione di 7 notebook, ottenuta con il metodo del legame completo in base a 6 variabili standardizzate. Sapendo che il valore massimo delle distanze è uguale a 5,9, si ricostruisca la corrispondente tabella chiamata “Programma di agglomerazione” in Spss e si illustrino tutte le informazioni che essa fornisce.

DENDROGRAMMA

ESERCIZIO 4 DENDROGRAMMA CON LIVELLI DI DISTANZA RISCALATI NELL’INTERVALLO 0-25 CALCOLO LIVELLI ORIGINARI APPROSSIMATIVI TRAMITE PROPORZIONE ESEMPIO CALCOLO COFFICIENTE STADIO 5 5,9:25=X:18

ESERCIZIO 4

ESERCIZIO 5 – ACP e cluster Si è applicata l’analisi delle componenti principali a 260 regioni europee, considerando 16 indicatori di benessere su vari aspetti economici e sociali. Estraendo le prime due componenti principali si è ottenuto il relativo biplot: si commentino le informazioni da esso desumibili.

20% ESERCIZIO 5 37%

COMMENTO AL BIPLOT La percentuale di varianza totale delle 16 variabili spiegata dalle prime 2 CP estratte è pari al 57% e supera il valore soglia, che è uguale a 0,44. ANALISI COMPLESSIVAMENTE VALIDA

COMMENTO AL BIPLOT Poiché n>100, si è applicata l’analisi dei gruppi NON GERARCHICA, scegliendo K=5 e assegnando un simbolo diverso a ciascun cluster; Gruppi di regioni con benessere superiore alla media: quarto e secondo; Gruppi di regioni con benessere inferiore alla media: terzo e primo.