Facoltà di Ingegneria dell’Informazione, Informatica e Statistica Dip. di Informatica e Sistemistica A. Ruberti Dip. di Ing. Dell’Informazione, Elettronica e Telecomunicazioni Dipartimento di Informatica Dipartimento di Scienze Statistiche Paolo Franciosa paolo.franciosa@uniroma1.it 1
Sai ched'è la statistica Sai ched'è la statistica? E' 'na cosa che serve pe' fa' un conto in generale de la gente che nasce, che sta male, che more, che va in carcere e che sposa. Ma pe' me la statistica curiosa è dove c'entra la percentuale, pe' via che, lì, la media è sempre eguale puro c'o' la persona bisognosa. Me spiego, da li conti che se fanno seconno le statistiche d'adesso risurta che te tocca un pollo all'anno: e, se nun entra ne le spese tue, t'entra ne la statistica lo stesso perchè c'é un antro che se ne magna due. Trilussa
La Statistica NON è solo questo!
Elaborare informazione Comunicare informazione Assumere decisioni Gestire operazioni complesse
Raccogliere, organizzare, “far parlare” le informazioni Statistica: Raccogliere, organizzare, “far parlare” le informazioni Strumento di decisione in condizioni di incertezza
Offerta formativa Laurea Laurea specialistica Dottorato di ricerca Master I livello Laurea Laurea specialistica Master II livello Dottorato di ricerca
Corsi di laurea in Statistica Lauree Statistica, economia, finanza e assicurazioni Statistica, economia e società Statistica gestionale Lauree magistrali Scienze attuariali e finanziarie Scienze statistiche demografiche e sociali Scienze statistiche e decisionali Scienze statistiche ed economiche Scienze statistiche per le strategie aziendali
Ambiti professionali dello statistico (1) analisi dei processi demografici struttura della popolazione, logiche della produzione e del consumo, della integrazione e dell’esclusione sociale, sistemi di protezione socio-sanitari, previdenza sociale
Profili professionali (2) nel settore assicurativo, previdenziale e bancario gestione di sistemi assicurativi e previdenziali privati e sociali analisi dei mercati finanziari analisi dei sistemi economici
Analisi dei dati per il supporto alle decisioni Riassumendo: Analisi dei dati per il supporto alle decisioni
Profili professionali analisi dei processi demografici struttura della popolazione, logiche della produzione e del consumo, della integrazione e dell’esclusione sociale sui sistemi di protezione socio-sanitari sulla sicurezza sociale in grado di inserirsi in amministrazioni, aziende, servizi, agenzie ed istituti di ricerca in attività di raccolta di dati ed informazioni di tipo quantitativo e qualitativo necessari alla soluzione di problemi specifici; di utilizzare i sistemi informativi e gli archivi esistenti, redigere rapporti di sintesi di supporto alle decisioni.
Il corpo docente della Facoltà Economisti Ricercatori operativi Matematici Statistici Probabilisti Informatici Aziendalisti Matematici finanziari Attuari Demografi Giuristi Sociologi
Le dimensioni “umane” della Facoltà di Scienze Statistiche L’articolazione dei corsi, i loro contenuti, l’assistenza degli studenti e la loro valutazione sono tali da permettere allo studente che frequenta di conseguire il diploma di laurea nei tre anni previsti . Un tutor per “ogni” studente Accesso ai programmi Socrates-Erasmus Borse di studi per tesi di laurea all’estero Studio di “casi” Stage Aule informatiche Corsi propedeutici
Attività principali dello statistico Analisi dei dati “Data mining” (identificare relazioni nascoste) Gestione del rischio Misurare significatività esperimenti Ottimizzare processi
Strumenti Matematica Calcolo delle probabilità Informatica Scienze applicate (Economia, sociologia, finanza, …)
Analisi dei dati - Data Mining Individuare regolarità Presentare risultati
Statistica “spaziale” Studio di dati e fenomeni legati al territorio
Le onde L’impatto del moto ondoso sulla costa è importante per le dinamiche litoranee, nonché per la valutazione delle sollecitazioni sui porti e le strutture costiere. Inoltre il moto ondoso è il maggior responsabile dell’erosione costiera e delle sollecitazioni che avvengono sulle strutture marine fisse o flottanti
Dinamica delle onde Le altezze d’onda si misurano in acque profonde per evitare gli effetti dovuti alla batimetria, sotto costa l’onda frange e aumenta la propria altezza….
Modello di previsione dell’intensità delle onde
Sviluppo applicazioni GIS: PESCA Modelli spaziali: distribuzione dei giovanili (Kriging Bayesiano) Medits 1996 Grund 1996 Medits 2004 Grund 2004
La matematica per descrivere fenomeni! “Modelli” …. La matematica per descrivere fenomeni! Modello lineare generalizzato Modello additivo generalizzato Modello additivo generalizzato Bayesiano
Esempio: contare … “stimiamo” il numero Quanti esemplari di una specie animale ci sono in una certa zona? Non possiamo osservarli tutti! “stimiamo” il numero
Modello: urna di contenuto ignoto Quanti biglie ci sono nell’urna? estraggo 10 biglie le contrassegno e le reinserisco nell’urna mescolo …. riestraggo 10 biglie e le osservo cosa deduco?
L’Informatica NON è solo questo!
Informatica Gestione dell’informazione: Basi di dati Sviluppo di sistemi software Sicurezza Robotica Trasmissione dell’informazione (reti di computer) Rappresentazione dell’informazione Aspetti teorici (decidibiità, complessità)
Esempio: rappresentare una rete stradale Struttura: punti (piazze, incroci, …) segmenti che uniscono punti
Altre “reti” internet - computer uniti da collegamenti web - pagine web con link ipertestuali reti sociali (p.es. Facebook) - persone unite da “amicizia” traffico telefonico - utenti uniti dalle chiamate …….
Problema: trovare cammino più breve tra due punti della rete
Come calcolare il cammino più breve da A a B? Soluzione ingenua: tento tutti i percorsi possibili da A a B e scelgo il migliore Quanto tempo impiego? (ho 1.000.000 di PC a 100 GHz!!!!!) Se la rete stradale ha 100 punti e da ogni punto partono 5 strade … 1.000.000.000.000.000.000.000. 000.000.000.000.000.000.000.000 anni
Come calcolare il cammino più breve?
Come calcolare il cammino più breve da A a B? Metodo (leggermente) più astuto: Algoritmo di Dijkstra a b
… ordinate per “utilità” (autorevolezza) Motori di ricerca Un motore di ricerca (Google, Yahoo, …) permette di trovare le pagine web che contengono le parole richieste … … ordinate per “utilità” (autorevolezza)
Come si determina l’autorevolezza di una pagina web? Si deve risolvere un ENORME sistema di equazioni lineari
Problema: verificare se due file sono identici Sono uguali? archivio archivio Sede di Milano Sede di Roma
Soluzioni Trasferisco il file da Roma a Milano e lo confronto tempo di trasferimento elevato possibili errori di trasmissione (se il file è grande …) Scelgo dei frammenti a caso, trasferisco i frammenti e li confronto se le differenze sono altrove non me ne accorgo Calcolo un “numero” sufficientemente grande X a partire dal file A (a Roma) Applicando lo stesso procedimento, calcolo il numero Y a partire dal file B (a Milano) Trasferisco il numero X da Roma a Milano e lo confronto con Y trasferisco solo il numero (p.es. 100 cifre) se X e Y sono uguali, allora quasi sicuramente A e B sono uguali
Quasi sicuramente … Se il numero derivato dal file ha 100 cifre, la probabilità di dare una risposta non corretta è 1 su 10100