Esempio di data set su foglio elettronico.

Slides:



Advertisements
Presentazioni simili
RILEVAZIONE E RACCOLTA DATI
Advertisements

Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
DB - Modello relazionale dei dati
UNIVERSITA DEGLI STUDI DI FIRENZE Comune di Castiglion Fiorentino La costruzione di indicatori della qualit à della vita soggettiva. Un esperienza nel.
ALTRE RAPPRESENRTAZIONI GRAFICHE 2
1 Progettazione logica: Il modello relazionale Eugenio Di Sciascio.
LA STATISTICA By prof. Pietro Rossi.
Gli errori nell’analisi statistica
Elementi di STATISTICA DESCRITTIVA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Questionario Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°2.
Ll Questionario Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°1.
Questionario - Analisi Univariata e Bivariata
Percorso: la rappresentazione dei dati
I questionari di rilevazione: le principali caratteristiche 15° Censimento generale della popolazione e delle abitazioni Giornate formative per gli UPC.
DIFFICOLTA’ DEL LINGUAGGIO
Corso di Fondamenti di programmazione a.a.2009/2010
Prof.ssa Chiara Petrioli -- corso di programmazione 1, a.a. 2006/2007 Corso di Programmazione 1 a.a.2006/2007 Prof.ssa Chiara Petrioli Corso di Laurea.
LE RILEVAZIONI NEL SETTORE AGRICOLO (Loretta Lolli)
La matrice dei dati E’ possibile organizzare i dati in forma di matrice se: l’unità di analisi è unica (ad esempio non si possono includere individui e.
CONCETTO DI FUNZIONE Una funzione f da X in Y consiste in:
Cap. 2 Definizioni e notazione (simboli) di base
Analisi delle corrispondenze
Statistica sociale Modulo A
Indicatori di efficienza dellanagrafe vaccinale Piano Nazionale di eliminazione del morbillo e della rosolia congenita
Modello Relazionale Definisce tipi attraverso il costruttore relazione, che organizza i dati secondo record a struttura fissa, rappresentabili attraverso.
Modello E-R Generalizzazioni
Relazioni Relazione : concetto mutuato dalla definizione di relazione matematica della teoria degli insiemi, come sottoinsieme del prodotto cartesiano.
Modello E-R Generalizzazioni
Modello Relazionale Proposto agli inizi degli anni ‘70 da Codd
Cai Lin Lin Michela & Guidetti Emanuela presentano:
Ll Questionario Introduzione al software SAS (Parte 2) Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°2.
Un buon latinista è anche un bravo matematico? I.S. Artemisia Gentileschi - NAPOLI Convegno finale Progetto Lauree Scientifiche – Matematica Università
Array a un dimensione : vettori
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
ACCESS Introduzione Una delle necessità più importanti in informatica è la gestione di grandi quantità di dati. I dati possono essere memorizzati.
Progettare un database
I principali tipi di grafici
Le rappresentazioni grafiche
UNIVERSITÀ DI PISA FACOLTÀ DI SCIENZE MATEMATICHE FISICHE E NATURALI CORSO DI LAUREA IN INFORMATICA Realizzazione completa di un’interfaccia grafica in.
Lindagine statistica (prima parte) 05/05/2014Prof.ssa Alessandra Sia.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Statistica La statistica è
Modulo 5 - Database. Contenuti della lezione 5.1.1Concetti Fondamentali 5.1.2Organizzazione di un Database 5.1.3Relazioni 5.2.1Lavorare con i database.
Variabili temporali Analisi statistica
Le rappresentazioni grafiche
La statistica.
Qualche (poche) definizioni preliminari sui data base in una versione per statistici: 1.TABELLA (table) : è la “nostra” matrice dei dati, una riga per.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Nucleo: Dati e previsioni
Il modello relazionale. Modello logico dei dati basato su concetti relazione e tabella Relazione: da teoria degli insiemi Tabella: rappresentazione grafica.
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
ORIENTAMENTO CONSAPEVOLE
Progettazione di una base di dati Ciclo di vita di un sistema informativo Studio di fattibilità definisce le varie alternative possibili, i relativi costi.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Domanda 1 In una recente trasmissione televisiva è stato detto che le separazioni avvenute nel corso del 2004 sono pari a circa il 50% dei matrimoni celebrati.
Istituto Comprensivo Rignano-Incisa Tirocinante TFA: G. Giuliani
Esercizio 1. Quesiti esercizio 1 Distribuzione congiunta: dalla definizione di distribuzione condizionale.
1 Esami Esame scritto: Tra 21 e 25 domande: 20 domande chiuse (20 punti),  5 domande aperte (10 punti) 1½ ore Esame orale/applicativo: Esercizi usando.
NORMALIZZAZIONE ESERCIZI. INTRODUZIONE La modellazione E-R ci ha consentito di descrivere schemi relazionali Lo strumento base per la modellizzazione.
Linguaggi per basi di dati Linguaggi di definizione dei dati Utilizzati per definire gli schemi e le autorizzazioni per l’accesso Linguaggi di manipolazione.
EPG di Metodologia della ricerca e Tecniche Multivariate dei dati A.A
Il modello relazionale. Modello Relazionale 2 Dal modello concettuale a quello logico Una volta stabilita la rappresentazione concettuale della realtà.
Cos’è la ricerca sociale? La raccolta di informazioni relative ad una realtà, ad un fenomeno sociale secondo obiettivi specifici:
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
AUTOVALUTAZIONE DI ISTITUTO Analisi dei dati e ri-progettazione dell’offerta formativa Analisi e uso dei dati con riferimento alle indagini sugli apprendimenti.
Linguaggio SQL. Linguaggi per database La diffusione del modello relazionale ha favorito l’uso prevalente di linguaggi non procedurali: in questo modo.
RAPPRESENTAZIONE DATI LA RAPPRESENTAZIONE PUÒ ESSERE UTILIZZATA A SCOPO DI ANALISI, INTERPRETAZIONI E COMUNICAZIONI. PER RAGGIUNGERE QUESTI OBIETTIVI È.
Roma, 6 dicembre Valeria Stancati “L’indagine sul Trasporto marittimo - Caratteristiche dell’indagine e innovazioni in corso” Innovazione nelle indagini.
Analisi delle osservazioni
Transcript della presentazione:

Esempio di data set su foglio elettronico. Variabili e dati sul Piano integrato Territoriale (PIT) “Serre vibonesi” N=24, m=13

Esempio di data set su pacchetto applicativo. STATISTICA Caratteristiche di alcune automobili: m=5 variabili per n=22 unità.

Modello relazionale dei dati Deriva dal concetto matematico di RELAZIONE Noti gli insiemi coincidenti ognuno con un dominio "d" è una RELAZIONE se si configura come una "m-tupla" ordinata di valori tali che E' evidente che "d" coincide con una osservazione “d” è un elemento del prodotto cartesiano di insiemi Che costituisce lo SPAZIO DEI DATI

Lo spazio dei dati Su ogni unità si rilevano "m" variabili Ogni variabile ha un suo dominio Si possono analizzare in tutto "N" unità (ma N può essere molto grande) P è la popolazione (o universo) formata da tutte e solo le unità di interesse di una ricerca Su ogni unità è possibile rilevare un insieme di "m" informazioni detto vettore della osservazione

La matrice dei dati Una rilevazione consiste nella osservazione delle variabili sulle unità Le osservazioni sono i vettori I cui valori formano la MATRICE DEI DATI ESEMPIO Lo staff tecnico di una organizzazione è composto da 6 persone: Donne o uomini, laureate o no, residenti, vicini, fuori sede. SPAZIO DEI DATI MATRICE DEI DATI Ciò che era possibile osservare Ciò che si è effettivamente osservato

Le dimensioni della matrice dei dati La matrice dei dati ha dimensioni n      è il numero di righe dove ogni riga (record) corrisponde ad una unità m è il numero di colonne dove ognuna corrispondente ad una variabile indagine sul self-service di una biblioteca meta-dato Matrice dei dati = data set Insieme strutturato di informazioni n=20 m=5

I dati mancanti I cosiddetti missing values sono quelli dovuti a mancate rilevazioni insanabili. Derivano anche da mancate risposte o rilevazioni manifestamente sbagliate o illogiche. L'elaborazione dei dati non consente vuoti nelle celle. Se mancano i dati si adotta un codice convenzionale Rilevazione dei dati ESEMPIO Numero di permessi sindacali concessi da ammininistrazioni pubbliche. Le sedi che non hanno risposto sono indicate con "-99" E' anche interessante capire il perché dei "missing values"

Analisi univariata e multivariata Ogni problema è una ragnatela: se si tocca un filo tutti gli altri vibrano. Lo stesso succede per le variabili. Lo studio univariato ha solo scopo didattico. Nella pratica i dati sono sempre multivariati ESEMPIO: dove vanno gli studenti La lettura di una tabella a più variabili non è difficile. Lo è la generalizzazione dei risultati

I metadati Sono codici che identificano in modo sintetico e senza ambiguità le unità Esempi: Se si tratta di persone il record include nome e cognome e altre informazioni età, sesso, professione Nel caso di imprese: settore produttivo, forma societaria, dipendenti, sede degli stabilimenti. Per dati territoriali è inserito il riferimento geografico delle unità. I metadati sono dei dati per accedere ad altri dati. Sono il mezzo di contatto tra rilevazioni diverse sulle stesse unità

La codifica Le denominazioni delle modalità sono talvolta lunghe o espresse con termini scomodi che complicano il ragionamento. Si stabiliscono abbreviazioni (codifica) per facilitarne la trattazione informatica e saranno poi queste a comparire nella matrice dei dati. ESEMPIO: In una indagine internazionale sulla distribuzione dei redditi, il grado di copertura della popolazione venne rilevato con il dominio S={NL, URB, NAG, RRL, AG} che sono abbreviazioni di {national, urban, nonagricultural, rural, agricultural} La codifica è utile per sveltire le operazioni di trasferimento dei dati dai moduli con cui sono acquisite (questionari, schede di richiesta, fogli di controllo, etc.) e per limitare le sviste nella trascrizione.