STATISTICA descrittiva
Le origini della statistica e della probabilità risalgono alla metà del XVIII secolo, quando si iniziarono ad affrontare con metodo scientifico le osservazioni relative alle caratteristiche demografiche delle popolazioni umane e ai giochi d‘azzardo.
Statistica e probabilità hanno un‘origine piü recente delle tradizionali discipline matematiche; Esse sono collegate alla variabilità ed all‘incertezza dei fenomeni della realtà e si propongono di introdurre tecniche rigorose per prendere decisioni razionali laddove la complessità o la natura stessa delle situazioni sembrano rendere imprevedibile e caotico il susseguirsi degli eventi.
Con il progresso scientifico, sociale ed economico emerse con forza l‘utilità di acquisire sempre piu' numerosi dati statistici sui quali i politici, gli economisti e gli scienziati in genere potessero basare e confrontare le loro decisioni e le loro teorie. Il termine statistica deriva da stato, infatti è nato per indicare la scienza dello stato
Raccolta dati La statistica nasce dalla necessità di conoscere l‘andamento di un certo fenomeno per poter fare previsioni sulla sua evoluzione o per prendere decisioni riguardanti lo stesso fenomeno. Mediante la raccolta di dati si ottengono informazioni utili per elaborare un prospetto o un grafico che schematizza e illustra in modo immediato lo stato del fenomeno.
Le sue applicazioni I settori dove la statistica trova maggiore applicazione sono: La ricerca scientifica Le scienze demografiche e attuariali Le scienze economiche Le scienze sociali Le scienze per la programmazione economica e territoriale La ricerca operativa
Definizioni Statistica: la scienza che ha come scopo lo studio dei fenomeni collettivi Unità statistica: la minima unità di cui si raccolgono i dati (singoli alunni) Popolazione (o universo): l‘insieme delle u.s. (alunni della classe) Caratteri: sono le proprietà che sono oggetto della rilevazione della popolazione (voto, statura, ecc.)
Definizioni Modalità: sono i modi in cui si presenta il carattere I caratteri possono essere Qualitativi, indicati con espressioni verbali –sostantivi o aggettivi(colore occhi) Quantitativi, esprimibili con numeri;Questi ultimi possono essere: discreti (possono assumero solo determinati valori, di solito interi, es: n° nati, produz. auto) continui (assumono qualsiasi valore all‘interno di un dato intervallo, es: la temperatura, il prezzo di un prodotto)
Le Modalità dei caratteri qualitativi possono essere ordinate o non ordinate. Esempi: Modalità ordinate -L‘ordine di nascita dei fratelli, il titolo di studio, il mese di nascita. Modalità non ordinate – la nazionalità, la professione, il colore dei capelli
Tipi di statistica L‘indagine statistica può seguire due procedimenti: Nel caso di rilevazione totale si ha la statistica descrittiva, che si occupa della raccolta, del riordino, nonchè della presentazione e dell‘analisi dei dati ottenuti dallo studio del fenomeno collettivo; Nel caso di rilevazione campionaria si ha la statistica inferenziale, che si occupa di estendere i risultati ottenuti con la statistica descrittiva ad insiemi più numerosi di quelli studiati fornendo strumenti analitici per trarre conclusioni e conseguenti decisioni.
Universo statistico Si può distinguere in: Universo finito, cioò formato da un numero limitato di unità statistiche (le rilevazioni possono essere totali o campionarie) Universo infinito, cioè costituito da un numero illimitato o molto grande di unità statistiche ( le rilevazioni sono sempre campionarie)
Rilevazione dei dati I dati possono essere raccolti mediante: Intervista diretta alle unità statistiche; Compilazione di un questionario: Rilevazione per mezzo di esperimenti; Utilizzo di dati già predisposti da enti che si occupano di rilevazioni statistiche. Esempio: il censimento si effettua con una rilevazione totale mediante questionario. In Italia l‘organo ufficiale che si occupa di rilevazioni statistiche è l‘ISTAT attivo dal 1926.
Costruzione di un questionario I questionari sono dei modelli di rilevazione per acquisire dati statistici e sono costituiti da un insieme di domande a risposta chiusa o aperta; nel primo caso l‘intervistato deve scegliere la risposta tra quelle indicate, nel secondo caso può esprimersi liberamente.
Spoglio dei dati Una volta raccolti i dati è necessario riordinarli e sintetizzarli per poterne poi trarre qualche conclusione. Per far questo per prima cosa si effettua lo spoglio dei dati che consiste nel leggere e classificare le risposte alle domande. Dallo spoglio si ricavano le frequenze assolute delle modalità. Def: La frequenza assoluta è il valore associato a una certa modalità di un carattere, cioè il n° di unità statistiche corrispondenti a quella modalità.
Tabelle Le tabelle che riportano le frequenze assolute costituiscono una distribuzione statistica e possono essere: Tabelle semplici; Tabelle composte; Tabelle a doppia entrata.
Tabelle semplici Una tabella semplice si presenta come un prospetto a due colonne: nella prima sono riportate le modalità, qualitative o quantitative, nella seconda l‘intensità cioè la frequenza con la quale la modalità si presenta Voto Frequenza 4 2 5 1 6 7 8 9 10
Tabelle composte Una tabella composta è a più colonne. Nella prima colonna sono riportate le modalità di un carattere, nelle altre le intensità riferite a casi diversi. Voto alunni classe 1-3 4-6 7-9 10 IVA Ginnasio 8 5 1 VA Ginnasio 6 IC scientifico 2 IIE scientifico 14
Tabelle a doppia entrata Sono tabelle a più colonne, dove vengono raccolti i dati relativi a 2 caratteri: nella prima colonna vi sono le modalità del primo carattere, nella prima riga le modalità del secondo carattere. Colore capelli biondi neri rossi castani Colore occhi verdi 1 2 azzurri 4 5
Rappresentazioni grafiche Non aggiungono nuove informazioni, ma consentono una visione immediata e complessiva del fenomeno considerato. Diagrammi a coordinate cartesiane Grafici a nastri o a colonne Istogrammi Diagrammi a torta
Diagrammi in coordinate cartesiane Sono significativi quando una grandezza è funzione dell‘altra, ed entrambe variano con continuità. Spesso la variabile indipendente è costituita dal tempo, in funzione del quale si studia l‘andamento dell‘altra grandezza.
Grafici a nastri o a colonne Sono rappresentazioni grafiche molto usate per modalità qualitative dove vengono disegnate per ogni modalità del fenomeno studiato, rettangoli di uguale larghezza e di lunghezza proporzionale alle frequenze delle modalità.
Istogrammi Sono utilizzati prevalentemente per rappresentare fenomeni aventi modalità quantitative espresse con intervalli di valori. Sono costituite da rettangoli aventi come base l‘ampiezza dell‘intervallo e come altezza la frequenza.
Diagrammi a torta Sono significativi per rappresentare come una popolazione viene suddivisa, rispetto ad un determinato carattere L‘ampiezza x dei settori si calcola risolvendo la proporzione seguente: x:360°=f:T ove f=frequenza T=totale della popolazione
Media La media è un numero che ne sintetizza molti e consente di averne una visione unitaria. la media è un valore opportunamente scelto e compreso tra il minimo e il massimo dei dati.
Medie mobili o ferme Moda e mediana sono medie mobili, cioè sono quelle medie per la cui determinazione non si usano tutti i dati. media aritmetica, quadratica, geometrica, armonica sono medie ferme, per il cui calcolo si conteggiano tutti i dati disponibili
Moda Si dice moda il carattere o il valore cui corrisponde la massima frequenza. La serie dei numeri 5,6,8,8,8,12,12,14 ha moda 8 La serie 5,6,8,8,8,12,12,14,14,14 ha due mode: 8 e 14
Mediana Si dice mediana il valore che occupa il posto di mezzo, quando i dati sono disposti in ordine crescente. La serie dei numeri 5,6,8,8,8,12,12,14 ha mediana (8+8)/2 La serie 5,6,8,8,8,12,12,14,14 ha mediana 8
Medie mobili o ferme Contrariamente alle medie ferme, la Mediana e moda possono essere determinate anche quando i dati non hanno carattere numerico: suff, buono, buono
Medie mobili o ferme Può accadere che cambiando alcuni dei dati, anche in modo vistoso, moda e mediana non cambino; ciò fa perdere di significato alle grandezze. Ecco perchè si introducono le medie ferme