Introduzione a Weka Di Fabio Cassano

Slides:



Advertisements
Presentazioni simili
VIA GIULIO RATTI, CREMONA – Tel. 0372/27524
Advertisements

Macchine di Percezione
Linguaggi di programmazione
APRIRE PROGRAMMA DI POSTA OUTLOOK EXPRESS
Sistemi di Classificazione usando NCD
Comunicare con la posta elettronica (7.4)
DATAWAREHOUSE - Microstrategy
Università degli Studi di Teramo Facoltà di Agraria
Riconoscimento di forme
ALGORITMI DI OTTIMIZZAZIONE PER L'ADDESTRAMENTO DI RETI NEURALI
Realizzare il sito web della scuola
Support Vector Machines
LABORATORIO SINCRONO TUTORIAL LABORATORIO SINCRONO.
WEKA: Machine Learning Algorithms in java
TECNOLOGIE DEI SISTEMI DI CONTROLLO
“Riconoscimento di Facce”
Apprendimento di movimenti della testa tramite Hidden Markov Model
Waikato Environment for Knowledge Analysis
Analisi di un dataset di perizie assicurative
APPLICAZIONI DI INTELLIGENZA ARTIFICIALE ALLA MEDICINA
BRIDGE-3K Verso il futuro La migrazione dai sistemi HP3000. Un ponte verso il futuro conservando la cultura e le risorse aziendali. NOVITA 2007.
Introduzione a EBSCOhost Tutorial. Benvenuti alla panoramica sullinterfaccia di EBSCOhost. In questo tutorial viene illustrata linterfaccia di ricerca.
BUILDING A USER INTERFACE Using CRYSTAL REPORTS. COME UNAPPLICAZIONE COMUNICA CON LUTENTE? Problema comune a tutte le applicazioni informatiche Forse.
66. Rubrica La Rubrica vi consente di raccogliere gli indirizzi di posta elettronica. Potete accedere dalla rubrica dallinterno del programma di posta.
Introduzione a PowerPoint
Strumento per l'innovazione di prodotto eco-compatibile per le PMI
Marco Nanni Applicazioni di Intelligenza Artificiale.
Semi-Supervised Learning
CLUSTERING WITH WEKA Branca Stefano Dosi Clio Gnudi Edward William.
STATISTICA PER LE DECISIONI DI MARKETING
Obiettivi di Design Rappresentano, in un prodotto software, le basi del successivo sviluppo del prodotto, perché, su di esse, si fondano le scelte prese.
Everywhere Takeaway Progetto di SSCSWeb A.A. 2011/2012.
Everywhere Takeaway Progetto di SSCSWeb A.A. 2011/2012.
Everywhere Takeaway Progetto di SSCSWeb A.A. 2011/2012 V. Costamagna, F. Dotta, F. Barbano, L. Violanti, Oltikuka.
Everywhere Takeaway Progetto di SSCSWeb A.A. 2011/2012.
BIOINFO3 - Lezione 111 CGI-BIN CGI-BIN sono chiamati i programmi la cui esecuzione può essere richiesta attraverso il WEB. Il server web (httpd) della.
Università degli Studi di Cagliari
Percorso didattico per l’apprendimento di Microsoft Access Modulo 5
DATA MINING PER IL MARKETING
POSTA ELETTRONICA La posta elettronica è un’innovazione utilissima offerta da Internet. E’ possibile infatti al costo di una telefonata urbana (cioè del.
Tipo Documento: unità didattica 4 Modulo 14 Compilatore: Antonella Bolzoni Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione.
Sistemi Informativi A. A. 2013/14 WEKA. WEKA Explorer.
SCHEDA INFORMATIVA DI UNITÀ
“VIA GIUSEPPE BAGNERA”
Basi di dati distribuite Prof. M.T. PAZIENZA a.a
Introduzione ai sommari j quindi premere F5 oppure fare clic su Presentazione > Dall'inizio per avviare il corso. Sulla barra dei messaggi fare clic su.
Lande Immortali GDR-Descrittivo Progetto a cura di Martino Michele – Matricola: Miglio Stefano – Matricola:
Lezione 19 Riccardo Sama' Copyright  Riccardo Sama' Access.
Lezione 10 Riccardo Sama' Copyright  Riccardo Sama' Word: strumenti di correzione.
Corso di Laurea Specialistica in Ingegneria Gestionale Sistemi Informativi per le decisioni a.a Waikato Environment for Knowledge Analysis Data.
DATA MINING.
TEORIE E TECNICHE DEL RICONOSCIMENTO
Esercitazione no. 4 EXCEL II Laboratorio di Informatica AA 2009/2010.
Titolo: Sistemi di bigliettazione elettronica: analisi dati e data mining Relatore: Andrea Gaffi.
DATA MINING PER IL MARKETING Andrea Cerioli Sito web del corso GLI ALBERI DI CLASSIFICAZIONE Introduzione alla metodologia Zani-Cerioli,
Alma Mater Studiorum – Università di Bologna
TEORIE E TECNICHE DEL RICONOSCIMENTO
Everywhere Takeaway Progetto di SSCSWeb A.A. 2011/2012 V. Costamagna, F. Dotta, F. Barbano, L. Violanti, Oltikuka.
Microsoft Access (parte 3) Introduzione alle basi di dati Scienze e tecniche psicologiche dello sviluppo e dell'educazione, laurea magistrale Anno accademico:
Piattaforma Documentale EDMA –Evoluzione Interfaccia Client
Cloud Tecno V. Percorso didattico per l’apprendimento di Microsoft Access 4 - Le maschere.
Fiery Color Profiler Suite v4.7 Fiery Workflow Suite Colore eccezionale, preciso e uniforme.
0 Laboratorio Informatica - SAS – Anno Accademico LIUC Alcune indicazioni Dettaglio lezioni: Prima : Michele Gnecchi – Introduzione a SAS Guide.
REALIZZAZIONE DI UN SISTEMA DI CLASSIFICAZIONE Prof. Roberto Tagliaferri Studente: Ragognetti Gianmarco Corso di Reti Neurali e Knowledge Discovery A.A.
Pattern Recognition Lez.14: Miscugli di Gaussiane.
Access Breve introduzione. Componenti E’ possibile utilizzare Access per gestire tutte le informazioni in un unico file. In un file di database di Access.
Benvenuto su Retedeldono e complimenti per aver aderito alla Run for Polio. Ora ti farò vedere in pochi semplici passi come avviare la tua campagna di.
Benvenuto su Retedeldono e complimenti per aver aderito alla Run for Polio. Ora ti farò vedere cosa dovrà fare il runner scelto dal vostro club per lanciare.
Modulo 5 – Database ACCESS LICEO SCIENTIFICO “ B. RESCIGNO COMPUTER SCUOLA PIANO INTEGRATO 2008/09 ESPERTO prof.ssa Rita Montella.
I NTRODUZIONE AL W EKA Umberto Panniello DIMEG, Politecnico di Bari Modelli di e-business e business intelligence Cdl Ingegneria Informatica.
Transcript della presentazione:

Introduzione a Weka Di Fabio Cassano

E’ un software per l’apprendimento automatico le cui tecniche affondano le radici nell’intelligenza artificiale Cos’è Weka? +=

Data mining  Cercare dei pattern ricorrenti all’interno di una grande quantità di informazioni  Estrapolazione della conoscenza  Esempio: birra e pannolini

Iscrizione Aggiunta amici Raccolta informazioni Pagine visitate Like Condivisioni Profilazione utente Passioni Emozioni ecc Vendita del profilo Pubblicità Analisi di mercato Caso d’esempio: Facebook

Weka permette (principalmente) l’uso di tecniche di Machine Learning. In particolare sono due le più utilizzate: Il core di Weka ClusteringClassification

 E’ un insieme di tecniche che permettono di «raggruppare» diversi oggetti in base alle loro features  Gli algoritmi sono molto utilizzati in ambiti di Intelligenza Artificiale Clustering

 E’ molto importante che siano state definite nel dataset delle «classi»  Si basa sull’analisi delle features (lavoro fatto a monte dell’analisi)  Applicabili a moltissime tecniche dell’ingegneria Classification

 Il punto di partenza di Weka è l’Explorer  Si carica un Dataset (in formato.arff) Let’s start Preprocessing dei dati: i filtri Supervisionati: i dati in analisi devono essere «etichettati» da parte di qualcuno. Non supervisionati: i dati vengono utilizzati così come sono ed in generale gli algoritmi non supervisionati vengono usati per clusterizzare i dati in gruppi differenti Analisi dei dati: gli attributi E’ possibile selezionare gli attributi che l’utente ritiene essere più rilevanti. Si mantengono i più importanti e si rimuovono quelli meno utili Presenza dell’attributo «Class» necessaria per la classificazione

Hands on 1 Caricamento di un file in weka Visualizzazione del contenuto del file ARFF Distribuzione delle classi all’interno di ogni attributo

 La schermata «Classify» di Weka permette di scegliere gli algoritmi da usare  E’ possibile modificare i parametri utilizzati dagli algoritmi (a patto di conoscere a cosa servono)  Le opzioni di test…  I risultati  Gli errori Primo approccio alla classificazione

Il training set Data set Training set Test set Il training set serve per addestrare il modello. In generale è la parte più consistente dell’intero Data set Il test set serve, una volta completato l’addestramento del modello, a valutare la bontà del nostro classificatore Validation set Il validation set serve per «affinare» i parametri del classificatore

Hands on 2 Selezione del classificatore: 1) Naive Bayes 2) MultiLayer Perceptron 3) J48 Confronto dei risultati Gli errori Matrice di confusione

 E’ possibile chiedere a Weka quali siano i parametri migliori da utilizzare all’interno del modello  Meno parametri (cioè meno features) non sempre porta a soluzioni migliori Un piccolo tuning

 Rischio di incorrere nell’overfitting o nell’underfitting Il problema del modello

Hands on 3 La maschera «select attributes» L’algoritmo InfoGain con metodo di ricerca «Ranker» Cancellazione della features con meno peso Nuovo run del classificatore

 Metodo «grafico» per vedere se il modello proposto è accettabile Le curve ROC e matrice di confusione  La matrice di confusione definisce quanto sia accurato il modello che abbiamo realizzato

 Nuova finestra, nuove funzionalità  Serve per valutare diversi algoritmi e paragonare i risultati  Ottimo per fare esperienza Exprerimenter

Hands on 4 Nuovo esperimento con specifica dataset Aggiunta degli algoritmi 1) Naive Bayes 2) Multilayer Perceptron 3) J48 Lancio dell’esperimento Analisi

 Interfaccia grafica  Di facile utilizzo  Permette a tutti di capire come funziona il processo di data mining Knowledge flow

Hands on 5 Aggiunta di un Arff Assegnazione della classe di classificazione Evaluation/Cross Validation sul dataset Classifier/Naive Bayes come metodo per il data mining Evaluation/ performance evaluation Visualization/Text viewer