Titolo: Sistemi di bigliettazione elettronica: analisi dati e data mining Relatore: Andrea Gaffi
M.A.I.O.R. Software house con svariate soluzioni sw per il TPL Prodotti che coprono l’intero processo Stima matrice OD pubblica Pianificazione dei percorsi e delle frequenze Programmazione orari e turni Assegnamento alle risorse (bus, autisti) Reportistica, analisi Supporto di Business intelligence per prendere decisioni
M.A.I.O.R. Circa 100 istallazioni in Italia (Firenze, Roma, Milano, Torino, Napoli, Bologna...) Installazioni in Germania, Spagna...) Potenti algoritmi a supporto dell’intero processo, in collaborazione con varie Università (Pisa, Firenze, Milano…)
Un nuovo prodotto: CBE. Cosa è Permette di analizzare i dati della bigliettazione elettronica (smartcard) E’ un approccio di Business Intelligence orientatao al supporto alle decisioni E’ integrato con MBI, una applicazione di business intelligence sul TPL Fornisce informazioni in tempo reale su vendite, validazioni e la relazione con corse, fermate, percorsi (linee). Aiuta a conoscere i clienti del TPL e le loro abitudini
Venduto per età
Validazioni per fascia oraria su una linea
Validazioni per fascia oraria per linea e categoria utente
Vendite: correlazione tra tipo di biglietto e categoria utente
Trend delle vendite: italiani e stranieri
Trend vendite (casalinghe): italiani e stranieri
Vendite: ricavi per competenza
Relazione tra validazioni e vendite
Ricavo medio a validazione per titolo di viaggio
Utenti (Viaggiatori)
Data mining Cosa significa? Processo per scoprire nuove relazioni tra dati (grossa quantità di dati)
Obiettivi prinicpali Scoprire spostamenti abituali delle persone con il TPL (analisi dei viaggi) Analizzare la correlazione tra attributi vari legati alle vendite Il lavoro si è svolto con il supporto dell’Universita di Pisa (prof. Dino Pedreschi) I risultati degli algoritmi saranno integrati nel sw di Business intelligence CBE
Analisi dei viaggi Si basa sulla bigliettazione elettronica (smart card) Conoscenza su: Chi compra i biglietti Quando i biglietti sono usati Come i biglietti sono usati Check in OK Check out ???
Stima del punto di check out Check out intervals: 1000 metri 3 giorni
Dati
Flussogramma
Clustering individuale
Esempio di clustering Clustering
Clustering individuale: risultati
Numero di cluster per ogni utente: distribuzione Molto spesso 2 (house work, house school), più del 70% degli utenti hanno meno di 7 cluster
Clustering globale
IN 13:15 OUT ? IN 13:58 OUT ? Viaggi con trasbordo A volte un utente usa più di un autobus per il proprio viaggio Abbiamo bisogno di: Una stima del tempo di percorrenza tra fermate Colleghiamo tra loro corse se hanno un tempo tra check-in e check-out inferiore a 30 minut
Viaggi con trasbordo Abbiamo usato i tempi di percorrenza programmati differenziati per fascia oraria e giorno tipo per ogni coppia di fermate IN 13:15 OUT IN 13:58 OUT 14:21 Sosta: 17'
Viaggi con trasbordo Colleghiamo corse con link inferiore a 30 minuti IN 13:15 OUT IN 13:58 OUT 14:21
Risultati principali Un insieme di cluster che descrivono viaggi anche complessi (cioè con più veicoli) sul TPL Il risultato, integrati nella sulzione di Business Intelligence CBE, permette di analizzare le caratteristiche di ogni cluster (i.e. Un cluster è usato soprattutto la mattina, gli utenti sono soprattutto studenti, il tipo di biglietto è un abbonamento settimanale ecc…) I risultati possono essere usati per effettuare l’aggiornamento della matrice OD del TPL
Correlazione tra attributi legati alle vendite Analizziamo i dati sulle vemndite per scoprire automaticamente correlazioni positive o negative.
Correlazione tra tipo di biglietti e categoria utenti
Correlazione tra durata biglietto, categoria utente e genere
Grazie per l’attenzione