Data Mining Introduzione.

Slides:



Advertisements
Presentazioni simili
Il gestore di posta elettronica per le aziende e per gli studi
Advertisements

La conoscenza del contesto territoriale
Limpresa : prospettive di lettura Limpresa è un fenomeno complesso: è un insieme di attività e di processi svolti da una comunità di persone, ma anche.
L’AZIONE DI MARKETING NEL PRIVATE BANKING:
DIREZIONE DEL MARKETING
VALORIZZARE LE RELAZIONI CON IL CLIENTE
SISTEMA INFORMATIVO AZIENDALE
nuove dimensioni della performance aziendale: la Balanced Scorecard
LA MICROSEGMENTAZIONE DEL MERCATO
Quali sono i clienti che l’azienda è in grado di soddisfare?
PIANO DI MARKETING.
Economia e direzione delle imprese La programmazione: contenuti, processi e tecniche.
Il Business Plan Area Creazione e Sviluppo d’Impresa ARIES
Luglio 2003Business Intelligence1 BUSINESS INTELLIGENCE Luglio 2003.
DIFFICOLTA’ DEL LINGUAGGIO
Tipo Documento: unità didattica 4 Modulo 14 Compilatore: Antonella Bolzoni Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione.
L’Activity Based Management
Sessione 14 La comunicazione per il mercato Clienti e strategie operative.
attraverso la segmentazione
Promuovere i metodi di studio Anno Accademico
L’indagine OCSE-PISA: il framework e i risultati per la matematica
Area: la gestione dei progetti complessi
Progetto EDUCAMBIENTE
PROGETTO FIRB – GESTIONE DELLA CONOSCENZA (GECON) Documento per il Meeting del 6/4/06 - Milano.
Data mining for e-commerce sites
Quanto vale la mia offerta agli occhi del cliente
L’analisi strategica capitolo 28
ELEMENTI DI UN BUSINESS PLAN
APPLICAZIONI DI INTELLIGENZA ARTIFICIALE ALLA MEDICINA
PiemonteShopping.com. - Pag. 2 - Alfa Layer S.r.l.: progetto PiemonteShopping.com © giugno 2004 La società opera.
MARKETING PER LA NUOVA IMPRESA Come migliorare i risultati di vendita con gli strumenti del marketing.
Valutazione della ricerca: le opportunità offerte dallOpen Access Alberto Silvani Torino 18 ottobre 2010 Questo/a opera è pubblicato sotto una Licenza.
Tecnico superiore per la trasformazione dei prodotti agroindustriali
… quinte classi IGEA e MERCURIO
GLI OBIETTIVI RILEVARE LE AREE DI FABBISOGNO FORMATIVO DELLE RISORSE UMANE DEL SETTORE SICUREZZA MISURARE LA DIMENSIONE DEI FABBISOGNI E DEFINIRNE LE.
STATISTICA PER LE DECISIONI DI MARKETING
Database & Information Retrieval
MARKETING Anno Scolastico 2006/2007 Classe 5AM Progetto realizzato da: Cozzi Matteo De Giorgi Stefano Marchionne Ilaria Ye Marisa.
GeoSoft BLU short presentation 1. GeoSoft BLU short presentation 2 Il software BLU è un prodotto software di tipo CRM (Customer Relationship Management)
Il ciclo finanziario dell’impresa
Uno sguardo al passato Una Definizione
1 AUTOMATIZZAIAUTOMATIZZAIAUTOMATIZZAIAUTOMATIZZAI S.I. SISTEMASISTEMA INFORMATIVO INFORMATIVO PROCESSOPROCESSO DECISIONALE DECISIONALE DECISIONEDECISIONE.
30/03/2011. Con un approccio integrato che prevede la sinergia tra professionisti dellinformatica, esperti in materie economico- finanziarie e ingegneri.
SCHEMA MODELLO DI BUSINESS PLAN
Tipo Documento: unità didattica 4 Modulo 14 Compilatore: Antonella Bolzoni Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione.
SCHEDA INFORMATIVA DI UNITÀ
Business Plan.
PART 3: DATA ANALYSIS THROUGH OMNIFIND. Il cliente: una sorgente importante di informazioni Mercato iper-competitivo, altamente caotico. Cliente al centro.
Dall’ambiente imprenditoriale al settore dell’impresa
Applicazione del CRM: il caso “Know K.” di Paoletta Antonio Relatore: prof. Edoardo Mollona Correlatore: dott. Sergio Venturino (Dirigente della Know K.
Customer Relationship Management: un quadro di riferimento
ECONOMIA AZIENDALE E GESTIONE DELLE IMPRESE
DATA MINING.
NiXuS srl1 Training Galco Italia 22 Gennaio 2000 pMeter Software per l’analisi delle performance aziendali. N I X U S srl Via G. Scarabelli Roma,
MARKETING. RAPPORTO AZIENDA-MERCATO AZIENDA MERCATO Denaro Informazioni Comunicazioni Beni e servizi Obiettivi:  Profitto  Sviluppo.
I Parte LA PRODUZIONE STATISTICA DEI DATI  Introduzione  La pianificazione  Il disegno dell’indagine  Le tecniche d’indagine  Le fasi operative 
Literature mining.  Data mining Processo di estrazione di conoscenza da banche dati di grandi dimensioni tramite l’applicazione di algoritmi che individuano.
Hotel Italia buongiorno!
ICT e Sistemi informativi Aziendali Materiale di supporto alla didattica.
Obiettivi e strategie per la diversificazione degli investimenti e la de-correlazione dei rischi Firenze 25 Gennaio 2016.
Il geo marketing di prossimità Uno strumento per valutare opportunità e rischi potenziali di un luogo Partner tecnologico con il sostegno di:
Introduzione al corso di TECNOLOGIA, INNOVAZIONE, QUALITÀ Prof. Alessandro Ruggieri Prof. Enrico Mosconi.
Siamo tutti coinvolti da un radicale processo di cambiamento! Condivisione Comunicazione Partecipazione Collaborazione.
LA GESTIONE STRATEGICA. MISSIONE La MISSIONE è il mezzo con cui l’impresa esplicita e comunica ai suoi interlocutori in che cosa vuole essere identificata.
1. 2 ARCER PARMA IL COMMERCIALISTA DELLE PICCOLE IMPRESE Parma, ottobre 2008 a cura di M. Limido I Sistemi Direzionali L’orientamento aziendalistico.
Modulo 5 – Database ACCESS LICEO SCIENTIFICO “ B. RESCIGNO COMPUTER SCUOLA PIANO INTEGRATO 2008/09 ESPERTO prof.ssa Rita Montella.
Dal problema al programma – ciclo di sviluppo del software La scrittura del programma è solo una delle fasi del processo di sviluppo di un'applicazione.
Il marketing nell’economia e nella gestione d’impresa.
Data warehouse(B.2.8) Nei database ci sono molti dati di tipo diverso e ciascuna tipologia di dato può avere un formato diverso. Alcuni provengono da legacy.
ROMA 24 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE Raffaella Cagliano NUOVE FONTI E DOMANDE ISTAT - Rilevazione Multiscopo sulle attività complesse.
Transcript della presentazione:

Data Mining Introduzione

Definizione “Il data mining è un processo atto a scoprire correlazioni, relazioni, tendenze nuove e significative, setacciando grandi quantità di dati immagazzinati nei repository, usando tecniche di riconoscimento delle relazioni e tecniche statistiche e matematiche.” (Gartner Group)

Cos’è il data mining Processo di estrazione di conoscenza da banche dati di grandi dimensioni tramite l’applicazione di algoritmi che individuano le associazioni “nascoste” tra le informazioni e le rendono visibili

Base di dati La possibilità di accedere ad ampie basi di dati, accumulate nel corso di anni di attività o provenienti da fonti esterne, riguardanti diversi aspetti dell’attività aziendale possono fornire una nuova risposta alle esigenze ed agli obiettivi del management

Base di dati L’ottimizzazione di una campagna commerciale, la creazione di nuovi prodotti o servizi, l’apertura di nuovi punti vendita sono problemi affrontati utilizzando la conoscenza del settore, l’esperienza accumulata nel corso degli anni, gli errori fatti nel passato

Base di dati La novità offerta dalla nuova tecnologia e dal Data Mining non sta nel rinnegare il tipo tradizionale di conoscenza ma nell’integrare i processi decisionali con regole costruite sintetizzando complessi ed estesi patrimoni informativi

Obiettivo L’obiettivo è individuare le informazioni più significative nell’ambito del decision-making

Conoscenza L’estrazione della conoscenza avviene tramite l’individuazione delle associazioni, o “patterns”, o sequenze ripetute, o regolarità, nascoste nei dati

Conoscenza In questo contesto un “pattern” indica una struttura, un modello, o , in generale, una rappresentazione sintetica dei dati Nel data mining è il computer che si occupa di trovare modelli per i dati, identificando regole e caratteristiche che li legano

Conoscenza Il processo di analisi parte da un insieme limitato e cerca di sviluppare una rappresentazione ottimale della struttura dei dati; durante questa fase il processo acquisisce conoscenza Una volta che tale conoscenza è acquisita, questa può essere estesa ad un insieme più vasto di dati basandosi sull’assunzione che il largo insieme di dati ha una struttura simile a quello più semplice

Algoritmo L’algoritmo del data mining si propone di individuare raggruppamenti impliciti dei dati in maniera automatica, senza una definizione a priori del numero di classi

Algoritmo Questo consente da una parte di eliminare qualsiasi arbitrarietà e forzatura esterna, dall’altra di individuare i raggruppamenti più piccoli che spesso sfuggono all’analisi e sono di estremo interesse in quanto possono indicare potenziali di mercato non sufficientemente sviluppati

Algoritmo Spesso, infatti, i segmenti di grandi dimensioni sono già noti ed è il manifestarsi dei più piccoli segmenti che fornisce elementi nuovi per le strategie di marketing

Evoluzione Anni ’60: sistemi con report standardizzati, con semplici informazioni riassuntive Anni ’80: introduzione della possibilità di eseguire interrogazioni differenziate su database, rendendo più facile l’identificazione degli andamenti relativi

Evoluzione Anni ’90: lo sviluppo di software di analisi ha puntato sulla possibilità di “scavare” nei propri dati in tempo reale. Avere dati a disposizione infatti non è più un problema, basti pensare alla ricchezza delle sorgenti accessibili dal Web attraverso i vari Datawarehouse aziendali

Evoluzione 1960: Raccolta dati “Quanto ho venduto negli ultimi 3 anni?” 1980: Accesso ai dati “Quanto ho venduto al Nord lo scorso gennaio?”

Evoluzione Oggi: Data Mining “Perché vendiamo di più in alcune città?” 1990: Query a database “Viste le vendite al Nord mostra il dettaglio per città” Oggi: Data Mining “Perché vendiamo di più in alcune città?”

Gli strumenti del Data Mining Strumenti di indagine

Funzione principale: identificare relazioni e tendenze nei dati La maggior parte degli strumenti d’indagine s’è sviluppata nell’ambito dell’ intelligenza artificiale Funzione principale: identificare relazioni e tendenze nei dati

Tale caratteristica permette Scoprire fenomeni di mercato Consolidare le conoscenze di base sul proprio business Aumentare i propri margini di competitività

I principali strumenti di indagine sono Indagine esplorativa Alberi decisionali Reti neurali Analisi cluster

Indagine esplorativa Sfrutta le comuni doti di percezione come metodo di analisi Spesso, ciò che i numeri non possono dire può essere rivelato da un grafico od una immagine

Indagine esplorativa

Indagine esplorativa Il cerchio centrale rappresenta un titolo, circondato da altri titoli: la collocazione di questi ultimi evidenzia il loro grado di correlazione con il titolo centrale Inoltre la loro disposizione, dimensione, etc… indicano cratteristiche come variabilità dei prezzi, la distribuzione,etc..

Indagine esplorativa Gli strumenti di visualizzazione possono essere usati come strumenti di presentazione: l’analista può infatti divulgare facilmente le sue scoperte usando il linguaggio universale delle immagini

Alberi decisionali Individuano gruppi che avranno, molto probabilmente, effetti diversi su una variabile obiettivo

Alberi decisionali Si individuano caratteristiche di gruppi di stakeholders di un progetto ( tipicamente mediante dati di tipo demografico ) Si scelgono quelli che hanno risposto positivamente ad iniziative analoghe (segmentazione dei dati ) L’attuazione del progetto avviene in relazione ai gruppi più significativi trovati

Alberi decisionali

Esempi di applicazione degli alberi decisionali sono : analisi di attrito sugli ascolti ricerca di opportunità su vendite incrociate analisi sulle promozioni etc...

Correggono i parametri del modello per trovare relazioni tra i dati Reti neurali Correggono i parametri del modello per trovare relazioni tra i dati Sono non lineari per definizione e non fanno nessuna ipotesi sul modello dei dati

Reti neurali

Reti neurali Il vantaggio sta nel fatto che non è necessario avere in mente un tipo di modello quando si esegue un'analisi Inoltre le reti neurali sono in grado di identificare le interazioni (ad esempio fra sesso ed età), che invece devono essere specificate esplicitamente in altri modelli

Reti neurali Lo svantaggio è che è difficile dare una spiegazione univoca del modello Le reti neurali sono quindi utili per analizzare una variabile obiettivo in presenza di forte non linearità e di interazioni, ma non aiutano molto quando queste caratteristiche dei dati devono essere spiegate

Possibili applicazioni possono essere: Reti neurali Possibili applicazioni possono essere: previsioni modelli di risposta indagini di rischio etc...

Analisi cluster Tecnica di riduzione dei dati che raggruppa casi o variabili in base a misure di similarità

Analisi cluster

Analisi cluster Questa tecnica consente di identificare gruppi di clienti basati su caratteristiche demografiche, informazioni finanziarie o comportamenti di acquisto.

UN ESEMPIO

Un esempio Un importante centro di ricerca francese nel campo della cosmesi era interessato a conoscere gli sviluppi del cerotto medicale (patch technology). La ricerca di documenti relativi ha portato ad individuare 146 brevetti, depositati nell’arco di 10 anni, in 12 paesi da 105 diverse aziende. L’applicazione dell’algoritmo di D.M. ha consentito di individuare 20 gruppi tematici.

Un esempio La mappa qui riprodotta ne presenta i primi 12. Ogni cerchio rappresenta un gruppo di documenti ed è caratterizzato da un numero che ne identifica l’importanza in termini di dimensione.

Un esempio I legami tra gruppi sono rappresentati da linee il cui colore e spessore ne indica la forza Un insieme di gruppi tra loro collegati rappresenta una macro-tecnologia

Un esempio La mappa fornisce una prima visione di insieme degli argomenti individuati e delle loro relazioni Con un click sull’argomento di interesse si accede alla descrizione completa del gruppo di documenti

Un esempio La descrizione del cluster 2 evidenzia i codici di classificazione (e relativa descrizione) che compaiono in questo gruppo di documenti, i nomi delle aziende depositanti, e l’anno di deposito. L’evoluzione temporale indica il crescente interesse sull’argomento Elettroforesi.Si tratta quindi di una tecnologia in fase di espansione

Un esempio Questo grafico consente di valutare l’attività di ciascuna azienda nel tempo e in ciascuna area tecnologica. Si nota che , mentre per la BASF si tratta di un settore di ricerca consolidato, per la D.D.S si tratta di un settore nuovo, sul quale sta investendo pesantemente

Un esempio L’eplorazione dei risultati pùò procedere in varie direzioni, approfondendo il contenuto del secondo cluster, passando ad argomenti correlati ( ad es. il quinto cluster ), tornando alla mappa per selezionare un’altra area tematica oppure analizzando la presenza delle aziende nei diversi cluster e la caratterizzazione temporale di cisacuna area tematica.

VANTAGGI DEL DATA MINING

Perchè usare strumenti DM ? Oggi il problema non è più raccogliere le informazioni (reperibili in Internet, nel Data Warehouse aziendale, etc…) ma è cercare di utilizzare tali dati per estrarre le informazioni utili all’azienda

Perchè usare strumenti DM ? I dati, relativi all’attività giornaliera dell’azienda, sia che si riferiscono alla clientela, sia che si riferiscono al mercato o alla concorrenza, si presentano in forma Eterogenea Ridondante Non strutturata Questo fa si che solo una piccola parte dei dati venga analizzata

Gli strumenti tradizionali : Vantaggi La gestione di grandi quantità di dati fino ad ora necessitava di grande potenza di calcolo (e quindi di costi aggiuntivi per l’azienda) Gli strumenti tradizionali : Analisi statistica Data retrieval (interrogazione di banche dati) risultano inadeguati per sfruttare la potenziale ricchezza delle informazioni nascoste

Analisi statistica Non operano su grandi quantità di dati Richiedono valori di tipo quantitativo Non gestiscono i valori mancanti Richiedono personale tecnico per l’utilizzo e l’interpretazione dei dati

Data retrieval I tempi di risposta aumentano all’aumentare della quantità di dati Non sono adatti ad individuare “associazioni nascoste”

Perchè servono i Data Mining Man mano che si estraggono dai dati le informazioni utili per l’azienda diminuisce il volume dei dati da trattare ed aumenta il valore che questi hanno per l’azienda

Data Retrieval Data Mining Quanti sono i clienti di età tra 40 e 50 anni che comprano cellulari Quali sono le caratteristiche dei miei clienti

Caratteristiche della clientela Il data retrieval risponde in modo specifico a domande specifiche Il DM risponde invece a domande generiche (approccio esplorativo e non verificativo) In questo modo si possono trovare non solo relazioni nascoste e sconosciute, ma che non avremmo nemmeno ipotizzato potessero esistere

Data Retrieval Data Mining Quanti sono i clienti di età tra 40 e 50 anni che comprano cellulari Quali sono le caratteristiche dei miei clienti Quali documenti contengono la parola “Sanità” Quali sono gli argomenti trattati da un insieme di documenti

Banca dati di documenti testuali La ricerca in base ad una parola chiave non sempre porta ad individuare i documenti relativi all’argomento di interesse Gli strumenti DM consentono di raggruppare i documenti per argomento sulla base di tutte le parole contenute nei documenti stessi

Data Retrieval Data Mining Quanti sono i clienti di età tra 40 e 50 anni che comprano cellulari Quali documenti contengono la parola “Sanità” Quali sono le caratteristiche dei miei clienti Quali sono gli argomenti trattati da un insieme di documenti Quali sono i miei concorrenti e come evolve la loro attività Quanti brevetti ha depositato Nokia nel 1998

Banche dati on-line I Data Mining possono essere applicati anche a banche dati pubbliche on-line Con gli strumenti tradizionali sono di difficile consultazione a causa del loro volume che rende lunga e faticosa la ricerca dei dati interessanti per lo scopo specifico

Data Mining scoprire informazioni nascoste creare modelli esplicativi Grazie alle tecniche di indagine avanzate è possibile scoprire informazioni nascoste creare modelli esplicativi identificare relazioni fra le attività correggere gli errori Tutto questo porta a dei vantaggi reali

Vantaggi sulle entrate Identificare i clienti migliori, reali e potenziali Scoprire opportunità di vendita aggiuntive Incrementare la produttività commerciale Mantenere la clientela, identificando elementi di fidelizzazione dei clienti Individuazione di opportunità in crescita Trovare un target clienti più remunerativo

Vantaggi Valore aggiunto per l’azienda Trattamento di dati quantitativi, qualitativi e testuali Non richiede ipotesi a priori da parte del ricercatore Possibilità di elaborare un numero elevato di variabili Algoritmi ottimizzati per minimizzare il tempo di esecuzione Semplice interpretazione del risultato Valore aggiunto per l’azienda