Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
1
TEORIE E TECNICHE DEL RICONOSCIMENTO
Apprendimento automatico Classificazione in SciKit-Learn
2
CLASSIFICAZIONE In questa lezione ritorniamo alla classificazione
Vediamo come classificare dati di tipo abbastanza semplice Scrivendo gli algoritmi noi
3
SKLEARN Useremo la versione 0.16.1
Istruzioni piu’ affidabili per scaricare scikit-learn per diverse architetture (Windows / Mac / Ubuntu)
4
IL DATASET IRIS Un classico dataset per apprendimento automatico
Dati su istanze di fiore (iris) Per ogni fiore il dataset contiene La specie (Iris Setosa, Iris Virginica, Iris Versicolor) Quattro attributi: Sepal length / width, Petal length /width Il problema di classificazione: Date certe caratteristiche di un Iris, e’ possibile prevederne la specie? Dataset molto piccolo (150 esempi)
5
Primo passo: visualizzazione
6
Come caricare i dati
7
Il dataset >>> data
{'target_names': array(['setosa', 'versicolor', 'virginica'], dtype='|S10'), 'data': array([[ 5.1, 3.5, 1.4, 0.2], [ 4.9, 3. , 1.4, 0.2], [ 4.7, 3.2, 1.3, 0.2], [ 4.6, 3.1, 1.5, 0.2], [ 5. , 3.6, 1.4, 0.2], [ 5.4, 3.9, 1.7, 0.4], [ 4.6, 3.4, 1.4, 0.3], [ 5. , 3.4, 1.5, 0.2], [ 4.4, 2.9, 1.4, 0.2], [ 4.9, 3.1, 1.5, 0.1], [ 5.4, 3.7, 1.5, 0.2], [ 4.8, 3.4, 1.6, 0.2], [ 4.8, 3. , 1.4, 0.1], ...
8
Features >>> features array([[ 5.1, 3.5, 1.4, 0.2],
[ 4.9, 3. , 1.4, 0.2], [ 4.7, 3.2, 1.3, 0.2], [ 4.6, 3.1, 1.5, 0.2], [ 5. , 3.6, 1.4, 0.2], [ 5.4, 3.9, 1.7, 0.4], [ 4.6, 3.4, 1.4, 0.3], [ 5. , 3.4, 1.5, 0.2], [ 4.4, 2.9, 1.4, 0.2], [ 4.9, 3.1, 1.5, 0.1], [ 5.4, 3.7, 1.5, 0.2], [ 4.8, 3.4, 1.6, 0.2], [ 4.8, 3. , 1.4, 0.1], [ 4.3, 3. , 1.1, 0.1], [ 5.8, 4. , 1.2, 0.2],
9
Classe degli oggetti >>> target
array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2])
10
Codice per ottenere la visualizzazione
11
UN CLASSIFICATORE FATTO A MANO
Sulla base del diagramma possiamo concludere per esempio che l’attributo ‘petal length’ discrimina Iris Setosa dagli altri esempi di Iris Possiamo scoprire automaticamente qual’e’ il punto di separazione
12
Il cutoff Output: 1.9, 3.0
13
Il classificatore
14
Come separare Virginica e Versicolor?
15
Selezione automatica delle features
16
Cross-validation
17
Un dataset piu’ complesso: Seeds
Misure di semi di grano 3 categorie: Canadian, Koma, Rosa 7 attributi: Area Perimetro Compattezza Length Width ….
18
Nearest-Neighbors Un approccio alla classificazione che classifica nuove istanze in base alla DISTANZA dagli esempi di addestramento
19
CLASSIFICAZIONE BASATA SULLA DISTANZA
20
Codice
21
More datasets
22
LETTURE
23
QUESTA LEZIONE Echert & Coelho, capitolo 2
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.