Le reti neurali dagli esordi alle applicazioni Alessandro Monaco Fabio Penna
Le origini Gli automi cellulari “…astrarre dal problema naturale dell’autoriproduzione la sua forma logica.” numero finito di stati stato determinato dagli automi circostanti comportamento non prevedibile
Sistema autoreplicante interpretazione Replicazione Informazioni non interpretazione
L’apprendimento Integrazione ontogenetico (individuale) filogenetico - supervisionato - non supervisionato Integrazione filogenetico - backpropagation
Altri tipi di apprendimento Aumento dei valori dei coefficienti di connessione eccitatori che, dallo strato inferiore, inviano segnali alle unità che hanno vinto la competizione
Criteri per la propagazione del segnale strategia con più vincitori winner takes all strategia a bolle
Reti di Caianiello Lo stato di attivazione del neurone dipende : dallo s.d.a. degli altri nell’istante precedente dallo s.d.a. negli istanti precedenti Caratteristiche - conoscenza dei punti di equilibrio e del suo ciclo - dinamicità
ART Problematiche Peculiarità interferenza catastrofica plasticità / accuratezza Peculiarità flessibilità autoadattamento autoapprendimento
Il neurone biologico
Il neurone artificiale
Le reti neurali artificiali Reti feed-forward unidirezionali (assenza di retroazione) i neuroni assumono valori reali buona flessibilità della rete Applicabilità a problemi reali
Back propagation Svantaggi Vantaggi applicabilità a qualsiasi rete atta a minimizzare la discordanza tra l’output desiderato e quello ottenuto Svantaggi minimi locali lentezza dell’algoritmo
Classificazione tipo di utilizzo: algoritmo di apprendimento - memorie associative - simulatori - classificatori algoritmo di apprendimento architettura dei collegamenti apprendimento supervisionato/non
SOM (self organizing maps)
Reti di Kohonen
Diagramma a cappello messicano Bolle di attivazione
La predizione della struttura proteica
Organizzazione strutturale delle proteine Struttura primaria Struttura secondaria Struttura terziaria Struttura quaternaria DNA Proteine
Problematiche sulla analisi strutturale lentezza di metodiche tradizionali (diffraz. X-Ray, NMR, data-base…etc) inaccuratezza dei metodi statistici non sempre applicabili (prot. di membrana) Biologia molecolare e DNA ricombinante
Utilizzo reti neurali ad apprendimento supervisionato
Vantaggi Svantaggi non sono necessarie assunzioni teoriche preliminari flessibilità calcolo “in parallelo” Svantaggi influenza del training set il problema del “black box”
Il caso della Nitrito-reduttasi di Pseudomonas aeruginosa 2 H + + 1e - + NO 2 - -------> H2 O + NO Percettrone a due livelli implementato su un foglio elettronico programmabile addestrato con 3 diversi training set
Risultati la performance funzionale di un percettrone dipenda strettamente dalla composizione dei 'training set' Mappe di Kohonen
Una corteccia somatosensoria simulata
Riconoscimento di fenomeni contaminativi nelle risorse idriche sotterraneee Individuazione di un bacino idrogeologico da utilizzare come caso di prova e conseguente creazione dei modelli di flusso e di trasporto; Analisi dei dati forniti dal modello e loro pre-elaborazione; Studio delle architetture neurali più adatte per il problema in oggetto; Addestramento delle reti con dati generati dal modello; Creazione di dati per la validazione del sistema neurale Test della capacità di generalizzazione del sistema mediante simulazione.
Specificamente: 1) È stato utilizzato il programma ModFlow per creare modelli di flusso e di trasporto. Con esso si possono simulare le variazioni in concentrazione di singole specie misurate e contenute nelle falde acquifere considerando: • l’advezione • la dispersione • le reazioni chimiche semplici
Specificamente: 2) I campioni ottenuti dallo studio del modello sono costituiti da matrici di dimensioni [m,n], una per ogni strato esaminato e per ogni valore del tempo t. Tali matrici vengono convertite in vettori di dimensioni [(m*n),1], troppo elevate per poter essere successivamente elaborati con le reti neurali, in quanto richiederebbero un numero troppo grande di esempi. Per questo motivo diventa assolutamente necessaria una pre-elaborazione finalizzata alla riduzione drastica delle dimensioni dei vettori. 3) Le reti neurali che sono state utilizzate sono le Reti Neurali Ricorrenti, perché consentono di esaminare le evoluzioni temporali dei fenomeni in studio. Per la loro applicazione si sta usando il Neural Network Toolbox di Matlab.
Stato di avanzamento dello studio Risulta fondamentale il settaggio dei seguenti parametri: • numero degli strati e delle celle utilizzati nelle simulazioni dei fenomeni fisici; • minimo numero di nodi nello strato nascosto della rete; • opportunità di associare all’uscita le sole coordinate delle celle interessate dalla contaminazione all’istante t=0 e relativi valori delle concentrazione, riducendo così notevolmente il numero dei nodi dell’ultimo strato di output. Fasi di sviluppo successive simulazioni con più contaminanti utilizzo di dati reali come “learning set”
Un caso candidato L'area dello Stabilimento EurAllumina del Polo industriale di Portovesme (Sardegna sud-occidentale) è interessata da estesi fenomeni di inquinamento da soda caustica, che interessano gli acquiferi impostati nelle formazioni sabbiose affioranti.
Monitoraggio di trading system Analisi fondamentale vs Analisi tecnica