Automated counting of phytoplankton by pattern recognition: a comparison with a manual counting method K. V. EMBLETON, C. E. GIBSON AND S. I. HEANEY.

Slides:



Advertisements
Presentazioni simili
Apprendimento Automatico Apprendimento supervisionato
Advertisements

Sistemi di Classificazione usando NCD
Unità D2 Database nel web. Obiettivi Comprendere il concetto di interfaccia utente Comprendere la struttura e i livelli che compongono unapplicazione.
Tecniche analitiche per lo studio dei materiali coloranti.
Reti Neurali Alessandro Mazzetti.
Primo sguardo a metodi multivariati per l'analisi del ttH
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Reti Neurali: studi sull'intelligenza artificiale
Litografia Introduzione alla Litografia
Il Software: Obiettivi Programmare direttamente la macchina hardware è molto difficile: lutente dovrebbe conoscere lorganizzazione fisica del computer.
Apprendimento di funzioni algebriche
Computational Learning Theory and PAC learning
Corso di Laurea in Biotecnologie Informatica (Programmazione)
Corso di Informatica (Programmazione)
I dubbi della microscopia
Reti neurali naturali ed artificiali
Realizzazione e caratterizzazione di una semplice rete neurale per la separazione di due campioni di eventi Vincenzo Izzo.
Seminario su clustering dei dati – Parte II
Scene Modelling, Recognition and Tracking
TECNOLOGIE DEI SISTEMI DI CONTROLLO
“Riconoscimento di Facce”
“Riconoscimento Targhe Automobilistiche” Parte II: Clustering e Riconoscimento Caratteri (implementazione MATLAB) Studenti: Damaggio Elettra Firmani Donatella.
Apprendimento di movimenti della testa tramite Hidden Markov Model
Modelli simulativi per le Scienze Cognitive Paolo Bouquet (Università di Trento) Marco Casarotti (Università di Padova)
Reti Neurali Ricorrenti
Scheduling in GrADS Il progetto GrADS (Grid Application Development Software) ha lo scopo di semplificare lo sviluppo di unapplicazione Grid. Tra le funzionalità
Intelligenza Artificiale
Elaborazione (digitale) delle immagini
Georeferenziazione di immagini
ADSL VOIP Voice Over IP.
APPLICAZIONI DI INTELLIGENZA ARTIFICIALE ALLA MEDICINA
Il Rivelatore Digitale
FORMATTAZIONE CONDIZIONALE & CONVALIDA DATI
PoliICR Riconoscimento dei Caratteri Daniele Gasperini – William Spinelli Riconoscimento dei Segnali: un approccio unitario prof. Sergio Brofferio.
Digitalizzazione Un segnale viene digitalizzato, se il suo stato originario analogico viene tradotto e rappresentato mediante un insieme numerabile di.
Semi-Supervised Learning
STATISTICA PER LE DECISIONI DI MARKETING
Foglio elettronico Excel Livello avanzato
Università degli Studi di Cagliari
Tabelle Pivot Istogrammi e frequenze Diagramma box-plot
Perceptron. è la somma effettuata sul nodo i-esimo dello strato j n è il numero di nodi dello strato j-1 è l'output proveniente dal nodo k-esimo dello.
NUOVE TECNOLOGIE Didattica della Chimica Organica - Prof. Cristina Cimarelli - TFA - AA
Clicca e vai..buona navigazione. Conoscere Mind Manager Per iniziare La barra della mappa La barra della formattazione Mappa della formattazione avanzata.
Esercitazione 2 Reti Neurali Backpropagation. 2 Esercizio 1  Scompattare bp  Compilare i 4 programmi (con make, v.file readme )  Utilizzare i dati.
Analisi di Immagini e Dati Biologici Edge detection and sharpening L7 38.
1 Informatica Generale Alessandra Di Pierro Ricevimento: Giovedì ore presso Dipartimento di Informatica, Via Buonarroti,
RETI NEURALI - 2.
Intelligenza Artificiale Reti Neurali
Esercitazione no. 4 EXCEL II Laboratorio di Informatica AA 2009/2010.
Corso integrato di Matematica, Informatica e Statistica Informatica di base Linea 1 Daniela Besozzi Dipartimento di Informatica e Comunicazione Università.
DATA MINING PER IL MARKETING Andrea Cerioli Sito web del corso GLI ALBERI DI CLASSIFICAZIONE Introduzione alla metodologia Zani-Cerioli,
Sistemi di Gestione dei Dati e dei Processi Aziendali Computer-Assisted Audit Technique (CAAT)
Corso integrato di Matematica, Informatica e Statistica Informatica di base Linea 1 Daniela Besozzi Dipartimento di Informatica e Comunicazione Università.
Il muschio.
Strategie inventate o algoritmi tradizionali?
Selezione del volume dei polmoni M. Antonelli, B. Lazzerini, F. Marcelloni Dipartimento Ingegneria dell’Informazione Pisa.
REALIZZAZIONE DI UN SISTEMA DI CLASSIFICAZIONE Prof. Roberto Tagliaferri Studente: Ragognetti Gianmarco Corso di Reti Neurali e Knowledge Discovery A.A.
Tecniche di Gestione della Qualità Prof. Alessandro Ruggieri Prof. Enrico Mosconi A.A
Esercitazione N°5 Approssimazione di Funzioni. Esercizio 1 Costruzione di una rete RBF Il metodo più semplice per approssimare una funzione mediante reti.
Microsoft Access è uno strumento di gestione di database. E 'un grande vantaggio per le piccole, medie imprese e anche per le imprese individuali per.
Impariamo ad usare Excel. Utilizzare l’interfaccia Avviare Excel e iniziare ad esplorare l'interfaccia per acquisire familiarità con esso… Non c'è modo.
Self-Organizing Map (SOM Kohonen, 1981) è una tecnica di visualizzazione dei dati multidimensionali SOM è una mappa mono- (bi-)dimensionale che rappresenta.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Campionamento.
Grass-meeting Trento Implementazione di una procedura di estrazione dell’urbanizzato basata su classificazione multispettrale e morfologia matematica.
POLITECNICO DI BARI CORSO DI LAUREA IN INGEGNERIA INFORMATICA DIPARTIMENTO DI ELETTRONICA ED ELETTROTECNICA POLITECNICO DI BARI CORSO DI LAUREA IN INGEGNERIA.
Introduzione a Weka Di Fabio Cassano
La funzione CASUALE. Gli istogrammi.
Biotas 2.0 alpha Biotas è un programma estremamente versatile, elabora fail di tipo geografico (.shp), database e fogli exel. E’ utilizzato prevalentemente.
Tecniche di Gestione della Qualità Prof. Alessandro Ruggieri Prof. Enrico Mosconi A.A
Scienze tecniche e psicologiche
Transcript della presentazione:

Automated counting of phytoplankton by pattern recognition: a comparison with a manual counting method K. V. EMBLETON, C. E. GIBSON AND S. I. HEANEY

Introduzione In questo articolo si mettono a confronto 2 metodi di studio del fitoplancton nel lago Lough Neagh nell’Irlanda del nord: uso di reti neurali e analisi manuali. In questo articolo si mettono a confronto 2 metodi di studio del fitoplancton nel lago Lough Neagh nell’Irlanda del nord: uso di reti neurali e analisi manuali. Problema: le misure manuali tramite microscopio richiedono troppo tempo. Problema: le misure manuali tramite microscopio richiedono troppo tempo. L’analisi delle immagini in modo automatico e il metodo del pattern recognition permette l’identificazione, il conteggio e le misurazioni del fitoplancton. L’analisi delle immagini in modo automatico e il metodo del pattern recognition permette l’identificazione, il conteggio e le misurazioni del fitoplancton. Trasformazione dei dati in parametri utilizzati dalle reti neurali. Trasformazione dei dati in parametri utilizzati dalle reti neurali. Confronto del volume totale delle cellule ottenuto dai 2 metodi. Confronto del volume totale delle cellule ottenuto dai 2 metodi.

Metodologia: analisi convenzionali Il campione selezionato per l’analisi fa parte del programma di monitoraggio del Dipartimento dell’Agricoltura dell’Irlanda del nord (DANI). Il campione selezionato per l’analisi fa parte del programma di monitoraggio del Dipartimento dell’Agricoltura dell’Irlanda del nord (DANI). I campioni sono raccolti in superficie e fissati con la soluzione di Lugol. I campioni sono raccolti in superficie e fissati con la soluzione di Lugol. I vetrini studiati al microscopio invertito, sono di 2.2 ml con diametro 26 mm. I vetrini studiati al microscopio invertito, sono di 2.2 ml con diametro 26 mm. Analizzate 4 specie di volume noto: 2 cianobatteri filamentosi Planktothrix agardhii (Gomont) Anagnostidis e Limnothrix redekei (Van Goor) Meffert; colonia di diatomea Aulacoseira subarctica (Müller) Haworth; la diatomea Stephanodiscus astraea (Eh.) Kütz. Analizzate 4 specie di volume noto: 2 cianobatteri filamentosi Planktothrix agardhii (Gomont) Anagnostidis e Limnothrix redekei (Van Goor) Meffert; colonia di diatomea Aulacoseira subarctica (Müller) Haworth; la diatomea Stephanodiscus astraea (Eh.) Kütz.

Metodologia: sistema automatico di conteggio I vetrini per l’analisi automatico sono di volume 0.71 ml. I vetrini per l’analisi automatico sono di volume 0.71 ml. La media del numero di oggetti contenuti per ogni immagine è nel range La media del numero di oggetti contenuti per ogni immagine è nel range Microscopio utilizzato è Olympus con ingrandimento 20x. Microscopio utilizzato è Olympus con ingrandimento 20x. Macchina fotografica Sony DXC-930P. Macchina fotografica Sony DXC-930P. Dimensioni immagini 768x576 pixel. Dimensioni immagini 768x576 pixel. Analisi immagini con pacchetto software KS400. Analisi immagini con pacchetto software KS400. Le reti neurali usano NeuroSolution. Le reti neurali usano NeuroSolution. I risultati portati poi in fogli Excel. I risultati portati poi in fogli Excel.

Metodologia: elaborazione delle immagini L’acquisizione, il trattamento e l’analisi delle immagini è controllato da una macro scritta nel pacchetto software KS400. L’acquisizione, il trattamento e l’analisi delle immagini è controllato da una macro scritta nel pacchetto software KS400. Le foto sono scattate da un operatore che calibra la luminosità e la messa a fuoco. Le foto sono scattate da un operatore che calibra la luminosità e la messa a fuoco. Per ogni foto viene fissata una soglia per identificare le regioni di interesse trasformandola in un’immagine binaria (2 livelli di grigio). Per ogni foto viene fissata una soglia per identificare le regioni di interesse trasformandola in un’immagine binaria (2 livelli di grigio).

Metodologia: elaborazione delle immagini Vengono eliminati i bordi e riempiti i buchi all’interno delle regioni di interesse. Vengono eliminati i bordi e riempiti i buchi all’interno delle regioni di interesse. All’immagine binaria viene applicato un filtro mediano per lisciare i contorni. All’immagine binaria viene applicato un filtro mediano per lisciare i contorni. Le regioni troppo piccole vengono eliminate. Le regioni troppo piccole vengono eliminate. Con l’uso di un filtro passa basso vengono identificati gli incroci fra i filamenti. Con l’uso di un filtro passa basso vengono identificati gli incroci fra i filamenti. Infine ogni regione viene etichettata. Infine ogni regione viene etichettata.

Metodologia: elaborazione delle immagini a. immagine al microscopio. b. Soglia binaria. c. Filtro mediano. d. Filtro passa basso. e. Identificazione incroci. f. Immagine etichettata.

Reti neurali Funzionano come il cervello umano, fatti di tanti neuroni che lavorano insieme per risolvere un problema. Funzionano come il cervello umano, fatti di tanti neuroni che lavorano insieme per risolvere un problema. Imparano per esempi. Imparano per esempi. Si occupano del riconoscimento delle immagini (Pixel [0,255]). Si occupano del riconoscimento delle immagini (Pixel [0,255]). Si ha una risposta finale che è si o no. Si ha una risposta finale che è si o no. Esiste una fase di addestramento e uno di funzionamento. Esiste una fase di addestramento e uno di funzionamento. Implicazione più importante pattern recognition. Implicazione più importante pattern recognition. Esistono diversi tipi di reti neurali: feed-forward, feedback. Esistono diversi tipi di reti neurali: feed-forward, feedback.

Addestramento delle reti neurali Viene stabilito un set di 74 parametri per ogni immagine (per lo più geometrici). Viene stabilito un set di 74 parametri per ogni immagine (per lo più geometrici). Il database contenente i parametri viene riempito anche con parametri di oggetti estranei per addestrare e riconoscere i falsi. Il database contenente i parametri viene riempito anche con parametri di oggetti estranei per addestrare e riconoscere i falsi. Tutte le reti neurali utilizzate sono feed-forward MLP addestrate con l’algoritmo di back propagation. Tutte le reti neurali utilizzate sono feed-forward MLP addestrate con l’algoritmo di back propagation. Ogni rete ha come nodi di input un sottoinsieme dei 74 parametri, un hidden layer di 10 nodi, 1 solo nodo di output (range +1,-1). Ogni rete ha come nodi di input un sottoinsieme dei 74 parametri, un hidden layer di 10 nodi, 1 solo nodo di output (range +1,-1).

Addestramento delle reti neurali Sono stati fatti tentativi con più hidden layer senza un miglioramento apprezzabile del risultato. Sono stati fatti tentativi con più hidden layer senza un miglioramento apprezzabile del risultato. Durante l’addestramento i pesi sui nodi venivano continuamente aggiustati anche a mano per ridurre l’errore tra risultato desiderato ed ottenuto. Durante l’addestramento i pesi sui nodi venivano continuamente aggiustati anche a mano per ridurre l’errore tra risultato desiderato ed ottenuto. Il database contenente i valori dei parametri è stato diviso in 2 parti. Il database contenente i valori dei parametri è stato diviso in 2 parti.

Addestramento delle reti neurali 80% dei dati è stato usato come insieme d’addestramento, 20% come test della rete. 80% dei dati è stato usato come insieme d’addestramento, 20% come test della rete. L’addestramento è continuato finchè l’errore sul test set non ha cominciato ad aumentare invece che diminuire. L’addestramento è continuato finchè l’errore sul test set non ha cominciato ad aumentare invece che diminuire. Per ognuna delle 4 specie è stata fatto una differente rete neurale. Per ognuna delle 4 specie è stata fatto una differente rete neurale. L’output di queste reti era “riconosciuto” o “non riconosciuto”. L’output di queste reti era “riconosciuto” o “non riconosciuto”. Questo approccio è stato scelto in previsione di aggiungere nuove specie. Questo approccio è stato scelto in previsione di aggiungere nuove specie.

Addestramento delle reti neurali In questo modo per ogni specie nuova si aggiunge una rete nuova simile alle precedenti. In questo modo per ogni specie nuova si aggiunge una rete nuova simile alle precedenti. Altrimenti usando una sola rete con più nodi di output ogni nuova aggiunta comporterebbe il riaddestramento di una nuova rete. Altrimenti usando una sola rete con più nodi di output ogni nuova aggiunta comporterebbe il riaddestramento di una nuova rete. Ogni rete aveva come parametri di input solo un piccolo insieme dei 74 parametri misurati, diverso per ogni rete, scelto in modo da ottimizzare il riconoscimento. Ogni rete aveva come parametri di input solo un piccolo insieme dei 74 parametri misurati, diverso per ogni rete, scelto in modo da ottimizzare il riconoscimento. Si sono usate delle regole aggiuntive sui parametri per validare la classificazione ottenuta dalla rete. Si sono usate delle regole aggiuntive sui parametri per validare la classificazione ottenuta dalla rete.

Nella tabella sotto sono riportati i parametri considerati ottimali in quanto comportano minori errori. Nella tabella sono riportati i 74 parametri ottenuti dalle misurazioni dei campioni.

Prova del sistema I classificatori sono stati testati prendendo campioni del lago Lough Neagh, 75 immagini per ogni campione. I classificatori sono stati testati prendendo campioni del lago Lough Neagh, 75 immagini per ogni campione. I volumi sono stati calcolati a mano e con il metodo automatico per il confronto dei risultati. I volumi sono stati calcolati a mano e con il metodo automatico per il confronto dei risultati. 5 campioni sono stati messi da parte per poter poi ripetere la procedura più volte. 5 campioni sono stati messi da parte per poter poi ripetere la procedura più volte.

Risultati La procedura automatica richiede 7 minuti circa di tempo operatore per scattare 75 foto per ogni campione; minuti di tempo di computazione. La procedura automatica richiede 7 minuti circa di tempo operatore per scattare 75 foto per ogni campione; minuti di tempo di computazione. Alla fine della procedura automatica viene generato una tabella in Excel per la visualizzazione dei risultati. Alla fine della procedura automatica viene generato una tabella in Excel per la visualizzazione dei risultati.

Risultati Confronto fra metodo manuale e automatico. Confronto fra metodo manuale e automatico. Il volume calcolato automaticamente è entro il 10% di quello calcolato manualmente. Il volume calcolato automaticamente è entro il 10% di quello calcolato manualmente. La misura del volume può essere soggetta a doppio errore che si compensa (mancate identificazioni compensate da falsi positivi). La misura del volume può essere soggetta a doppio errore che si compensa (mancate identificazioni compensate da falsi positivi).

Risultati Confronto fra le classificazioni delle singole specie. Confronto fra le classificazioni delle singole specie. Problemi nel distinguere tra 2 specie filamentose simili. Problemi nel distinguere tra 2 specie filamentose simili.

Risultati Confronto tra i volumi delle singole specie. Confronto tra i volumi delle singole specie. Risultato simile alla precedente siccome il volume medio è sempre lo stesso. Risultato simile alla precedente siccome il volume medio è sempre lo stesso.

Confronto su analisi ripetute di 5 campioni.

Conclusioni Vantaggi del sistema automatico: veloce, richiede meno esperienza, dà risultati accettabili nella stima del volume totale. Vantaggi del sistema automatico: veloce, richiede meno esperienza, dà risultati accettabili nella stima del volume totale. Con il progredire della tecnologia (macchine digitali più sofisticate, maggiore risoluzione, maggiori capacità di calcolo) è possibile ridurre gli errori. Con il progredire della tecnologia (macchine digitali più sofisticate, maggiore risoluzione, maggiori capacità di calcolo) è possibile ridurre gli errori. Sono richiesti ulteriori studi per affinare la scelta dei parametri delle immagini da utilizzare nelle reti neurali. Sono richiesti ulteriori studi per affinare la scelta dei parametri delle immagini da utilizzare nelle reti neurali. Con minor parametri (scelti opportunamente) in input si risparmia tempo e si riducono gli errori. Con minor parametri (scelti opportunamente) in input si risparmia tempo e si riducono gli errori.

Conclusioni La maggior parte degli errori è dovuta a cellule in contatto fra loro difficilmente separabili con tecniche di elaborazione delle immagini. La maggior parte degli errori è dovuta a cellule in contatto fra loro difficilmente separabili con tecniche di elaborazione delle immagini. Molti altri errori sono dovuti alla larghezza dei filamenti che con la risoluzione utilizzata spesso era di 2-3 pixel (il filtro mediano li cancella). Molti altri errori sono dovuti alla larghezza dei filamenti che con la risoluzione utilizzata spesso era di 2-3 pixel (il filtro mediano li cancella). Il contrasto può essere migliorato con l’utilizzo della soluzione di Lugol o con l’utilizzo della fluorescenza (o anche tramite il metodo del Calcofluor nel caso dei dinoflagellati). Il contrasto può essere migliorato con l’utilizzo della soluzione di Lugol o con l’utilizzo della fluorescenza (o anche tramite il metodo del Calcofluor nel caso dei dinoflagellati).

Ordine Peridiniales Haeckel 1894: Famiglia Protoperidiniaceae Balech 1988 Protoperidinium steinii e Protoperidinium conicum Protoperidinium steinii e Protoperidinium conicum

Ordine Dynophysiales Lindemann 1928: Famiglia Dinophysiaceae Stein 1883 Dinophysis rotundata Claparède et Lachmann Dinophysis rotundata Claparède et Lachmann Dinophysis sacculus Stein Dinophysis sacculus Stein