DATA MINING.

Slides:



Advertisements
Presentazioni simili
Introduzione alla statistica
Advertisements

RILEVAZIONE E RACCOLTA DATI
Macchine di Percezione
Chiara Mocenni – Analisi delle Decisioni a.a Analisi delle Decisioni Probabilita condizionate e Teorema di Bayes Chiara Mocenni.
LA PROGETTAZIONE DEL MIGLIORAMENTO
La sperimentazione clinica
Laboratorio Processi Stocastici
ANALISI DELLA COVARIANZA
Quali sono i clienti che l’azienda è in grado di soddisfare?
Ricerca non sperimentale: La ricerca survey (inchiesta)
Levels of constraint I vincoli (o livelli di costrizione) sono i condizionamenti impiegati dalla ricerca.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Tipo Documento: unità didattica 4 Modulo 14 Compilatore: Antonella Bolzoni Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione.
Dove siamo? Ideazione Pianificazione Esecuzione e controllo Conclusione e valutazione.
PROGETTI DI SISTEMI INFORMATIVI DIREZIONALI
Metodi di ricerca in Psicologia
Metodi della ricerca in Psicologia
CORSO DI MODELLI DI SISTEMI BIOLOGICI LAUREA IN INGEGNERIA CLINICA E BIOMEDICA.
D2I - Tema 3 Analysis and comparison of methods and algorithms for data mining.
Apprendimento di movimenti della testa tramite Hidden Markov Model
Data Mining Introduzione.
Corso di Impatto Ambientale Modulo A: Pianificazione Energetica
Artificial intelligence
Lezioni per Insegnanti mod. 2 prof. Giovanni Raho I metodi della ricerca sociale Lezioni per il corso S. I. S. S. Anno 2004 mod. 2.
Cap. 2 Definizioni e notazione (simboli) di base
Analisi dei gruppi – Cluster Analisys
Statistica sociale Modulo A
Le simulazioni. Una ipotesi di lavoro
Intelligenza Artificiale
Ricerca quantitativa e ricerca qualitativa. Contenuti della lezione Lapproccio quantitativo Lapproccio quantitativo Lapproccio qualitativo Lapproccio.
09/05/03 1 Data Minig: clustering con Reti di Kohonen DATA MINING Clustering e Reti di Kohonen.
Metodologia sviluppo KBS Fabio Sartori 12 ottobre 2005.
APPLICAZIONI DI INTELLIGENZA ARTIFICIALE ALLA MEDICINA
UN SISTEMA DI SUPPORTO ALLA DETERMINAZIONE DI ANOMALIE NEL TRAFFICO DI RETE Tesi di Laurea di: Luca VESCOVI Correlatori: Ing. Aldo Franco DRAGONI Ing.
Verifica delle ipotesi su due campioni di osservazioni
Cai Lin Lin Michela & Guidetti Emanuela presentano:
STATISTICA PER LE DECISIONI DI MARKETING
Le distribuzioni campionarie
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
LA VALUTAZIONE DELLA FAD
Metodologia della ricerca sociale lorenzo bernardi
Modelli predittivi F. De Santis, L. Bolognini Convegno Misurare la giustizia? Roma, ottobre 2004.
Fasi di uno studio Disegno dello studio = decidere obiettivi e metodi
La strategia di mercato 1.Il concetto di strategia 2.Il contenuto della strategia di mercato 3.Il processo strategico 4.Il ruolo del management.
Statistica La statistica è
Tipo Documento: unità didattica 4 Modulo 14 Compilatore: Antonella Bolzoni Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione.
SCHEDA INFORMATIVA DI UNITÀ
Basi di dati distribuite Prof. M.T. PAZIENZA a.a
La statistica.
Grandezze e Misure
La verifica d’ipotesi Docente Dott. Nappo Daniela
Psicologia come scienza:
DATA MINING PER IL MARKETING
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
La rilevazione Oggetti e finalità della rilevazione.
La valutazione dell’apprendimento degli studenti Clusone, 17 marzo 2015.
A cura di Raffaele Costantino
INTELLIGENZA ARTIFICIALE
INDICATORI SOCIALI E VALUTATIVI
Literature mining.  Data mining Processo di estrazione di conoscenza da banche dati di grandi dimensioni tramite l’applicazione di algoritmi che individuano.
NB: La lettura delle slide è solo un supporto allo studio che non sostituisce i testi di esame Metodi e tecniche della ricerca sociale - Prof. Flavio Ceravolo.
Economia e Organizzazione Aziendale
ICT e Sistemi informativi Aziendali Materiale di supporto alla didattica.
____________________________ Stefano Scarcella Prandstraller Relazioni istituzionali e Gestione della responsabilità sociale d’impresa Metodo e tecniche.
REALIZZAZIONE DI UN SISTEMA DI CLASSIFICAZIONE Prof. Roberto Tagliaferri Studente: Ragognetti Gianmarco Corso di Reti Neurali e Knowledge Discovery A.A.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Campionamento procedimento attraverso il quale si estrae, da un insieme di unità (popolazione) costituenti l’oggetto delle studio, un numero ridotto di.
Introduzione a Weka Di Fabio Cassano
Data warehouse(B.2.8) Nei database ci sono molti dati di tipo diverso e ciascuna tipologia di dato può avere un formato diverso. Alcuni provengono da legacy.
Transcript della presentazione:

DATA MINING

DATA MINING Il processo di estrazione di conoscenza da una base di dati è detto Knowledge Discovery in Databases (KDD) e si avvale di tecniche che consentono di esplorare grandi quantità di dati per estrapolare dati nascosti , ossia non direttamente intuibili, ed inferenze significative. Tali tecniche si possono indicare complessivamente con il termine di data mining.

DATA MINING Perché usare tecniche di data mining? Nessuna ipotesi a priori Lavorano su dati eterogenei Possono lavorare su un gran numero di variabili Possono elaborare un gran numero di osservazioni Diminuiscono il tempo di elaborazione

DATA MINING Le tecniche tradizionale di analisi statistica e data retrieval sono inadeguate per questi scopi poiché richiedono dati strutturati (generalmente di tipo quantitativo) e condizioni note a priori ( data retrivial richiedono di formulare una query ; il sistema cerca, all'interno della banca dati, tutti i casi che soddisfano le condizioni poste nella query e fornisce la risposta).

DATA MINING Gli algoritmi di data mining utilizzano un approccio esplorativo e non “verificativo”, come avviene per la statistica standard. Essi riescono a trovare relazioni nascoste e difficilmente ipotizzabili a priori.

DATA MINING Le tecniche di clustering e l'uso delle reti neurali non supervisionate consentono di effettuare operazioni di segmentazione sui dati, cioè di individuare gruppi omogenei, o tipologie, che presentano delle regolarità al loro interno in grado di caratterizzarli e differenziarli dagli altri gruppi.

DATA MINING Le reti neurali (supervisionate) e gli alberi di decisione consentono di effettuare operazioni di classificazione, fanno cioè uso della conoscenza acquisita in fase di addestramento per classificare nuovi oggetti o prevedere nuovi eventi. Le tecniche di analisi delle associazioni consentono di individuare delle regole nelle occorrenze concomitanti di due o più eventi.

TECNICHE Le tecniche di data mining sono differenti e quindi anche gli algoritmi che le implementano. Le più utilizzate sono Clustering Reti neurali Alberi di decisione Individuazione di associazioni Algoritmi genetici …….

TECNICHE Processo di estrazione della conoscenza: Generalmente si compone delle seguenti fasi : · Definizione degli obiettivi · Organizzazione dei dati : vengono raccolti i dati e vengono organizzati in databases.

TECNICHE Pre - Processing Viene effettuata una prima valutazione della rilevanza dei dati raccolti che può richiedere una trasformazione delle variabili originarie (pulizia dei dati). Data-Mining La scelta del metodo da utilizzare dipende fortemente dal problema in esame, dagli obiettivi e dal tipo di dati disponibili.

TECNICHE · Elaborazione dei dati · Valutazione dei modelli Dal confronto dei risultati ottenuti con i diversi metodi si sceglie il modello migliore di analisi. · Interpretazione, valutazione e rappresentazione dei risultati