Master in Economia e Gestione del Turismo 24ª EDIZIONE - 2016-17 BOOKINGUESS Intelligenza artificiale per prevedere le cancellazioni e gestire l’overbooking Master in Economia e Gestione del Turismo 24ª EDIZIONE - 2016-17 Chiara Congiu, Emilio De Cesare, Gianfranco Farina, Chiara Fulgenzi, Veronica Pitton, Giulio Silvestrini. Venezia, 2017
IL NOSTRO PROGETTO Obiettivo progetto: utilizzare i dati storici di tre hotel e, elaborando una serie di dati tramite l’utilizzo di algoritmi, prevedere l’andamento futuro della cancellazione per ogni singola prenotazione.
CANCELLAZIONI, OVERBOOKING, REVENUE MANAGEMENT Revenue Management: vendere il prodotto giusto, al cliente giusto, al giusto prezzo, nel giusto momento e attraverso il giusto canale di distribuzione. Il problema principale del revenue management è come allocare le camere in base alle richieste che arrivano dai clienti massimizzando i ricavi. Due strategie principali: assegnazione della capacità ricettiva (assegnare in base alla tariffa pagata la tipologia di camera più adatta) overbooking (eccedenza di prenotazioni rispetto alle camere disponibili) È possibile che una certa percentuale di camere venga cancellata prima della data di arrivo o che si manifestino dei no-show. In questi casi l’overbooking è utilizzato dalle strutture per proteggersi da mancati ricavi.
COME SI AFFRONTA IL PROBLEMA? Strumenti attuali: stima cancellazioni attraverso dati di storico, tasso di cancellazione dell’anno precedente ed esperienza. Problema: stanza vuota = perdita di ricavi si ricerca quindi il numero ottimale di overbooking attraverso dei modelli che considerano però solo tre tipologie di camera (High, Medium, Low) Innovazione del nostro modello: tiene in considerazione tutte le tipologie di camere dell’hotel indica la probabilità di cancellazione di ogni singola prenotazione i modelli tengono in considerazione un numero maggiore di variabili e non semplicemente il tasso di cancellazione dello storico
I.A. E MICROSOFT AZURE MACHINE LEARNING STUDIO I.A. (intelligenza artificiale): l’abilità di una macchina di svolgere funzioni e ragionamenti tipici della mente umana, e che fa uso di algoritmi informatici per raggiungere questo obiettivo Algoritmo: procedimento che risolve un determinato problema attraverso un numero finito di passi elementari Che cos'è ML Studio? Uno dei tanti programmi disponibili per il ML, una piattaforma elettronica per la creazione di modelli machine learning E' una piattaforma in cloud su server Microsoft con un'interfaccia accessibile da qualsiasi computer Come Funziona? Si danno in pasto delle informazioni (es. da un foglio .xml) al programma Gli algoritmi sono già precompilati dal personale Microsoft e l'utente deve scegliere quali confrontare e quale applicare per l’analisi dei dati Il programma restituisce, per ogni caso, la probabilità che l’evento considerato si verifichi o meno, in termini percentuali
UTILIZZO AZURE ML STUDIO
IL PROCESSO DI LAVORO Alberghi: Hotel Terme Venezia, Hotel Portici, AirportHotel Verona Richiesta e analisi dei dati: Predisposizione ed utilizzo di Microsoft Azure Machine Learning -> account dedicato ad ogni singolo hotel Esperimenti con ogni algoritmo fra quelli proposti da Azure Scelta della combinazione dei due algoritmi migliori Verifica dei risultati ottenuti e confronto con i dati reali ai fini di valutare l’affidabilità del modello Implementazione dei risultati e modifica dei dati utilizzati, secondo un processo di “Trial&Error” Raggiungimento dei risultati e valutazioni finali canale di prenotazione Paese di provenienza tipologia camera numero di persone prezzo di soggiorno politiche di cancellazione data di arrivo e partenza / num notti pick up time eventuali servizi extra prenotati motivo del soggiorno frequenza di soggiorno in struttura dati condizioni meteo periodo
HOTEL TERME VENEZIA Primo esperimento con dati senza nazionalità dei clienti, con risultati non soddisfacenti Secondo esperimento, utilizzando tutte le variabili a disposizione, perché i risultati appaiono migliori, soprattutto con la nazionalità: Algoritmo: Two-class Boosted Decision Tree A boosted decision tree is an ensemble learning method in which the second tree corrects for the errors of the first tree, the third tree corrects for the errors of the first and second trees, and so forth. Predictions are based on the entire ensemble of trees together that makes the prediction. Motivazione: accuratezza di 0,757 su 1, la migliore nel confronto tra tutti gli algoritmi utilizzati Esempio di foglio di lavoro ottenuto:
HOTEL TERME VENEZIA Risultati: 63,2% di efficacia per corrispondenza previsione e reale canc. - previsione e reale non canc.; probabilità canc. >=0,9 -> 58,3% dei casi si è registrata una reale cancellazione Variabili decisionali cancellate previste booking channel max Booking.com 58% 48% min canale diretto 13% 32% pick up time da 90 gg in su 60% 84% da 0 a 30 gg 27% 42% nazionalità italiana, 80% campione 30% 47% stranieri russa 55% 56% svizzera 12%
AIRPORTHOTEL VERONA e HOTEL PORTICI Algoritmo utilizzato: Two-class Decision Forest The Two-Class Decision Forest module allows to create a machine learning model based on the random decision forests algorithm. Decision forests are fast, supervised ensemble models. This module can be used to predict a target that has two values. Motivazione: accuratezza di 0,848 su 1, la migliore nel confronto tra tutti gli algoritmi utilizzati Hotel Portici Motivazione: accuratezza di 0,775 su 1, la migliore nel confronto tra tutti gli algoritmi utilizzati ...dati ancora in fase di analisi!
CHE VANTAGGI DARÀ AGLI ALBERGATORI? Maggiore possibilità di gestire: Overbooking, attraverso i risultati di probabilità ottenuti per ogni singola prenotazione/camera Migliorare l’efficienza attraverso politiche ad hoc sui prezzi, in base alla domanda, incrementando: RevPAR Offerte last minute
DISPONIBILITÀ IN TEMPO REALE Modello di tabella che sarà disponibile per l’albergatore, all’interno del PMS, dove potrà consultare la disponibilità delle camere totali in tempo reale. 18 mag 19 mag 20 mag 21 mag 22 mag 23 mag Totali 100 Prenotate 130 110 95 55 78 Cancellate 20 15 10 18 14 19 Disponibili -10 5 8 59 41 Cancellate >80% 6 11 4 3 Cancellate 50% - 80% 2 7 9 Disponibilità prevista 13 28 22 72 48
COME SARÀ INTEGRATA LA I.A. probabilità di cancellazione > 80% probabilità di cancellazione da 50% a 80% probabilità di cancellazione da 0% a 50%
GRAZIE PER L’ATTENZIONE