ANALISI CONFORMAZIONALE
Analisi conformazionale Le proprietà chimiche, fisiche e biologiche di una molecola dipendono spesso dalle strutture tridimensionali, o conformazioni, che questa può adottare. L’analisi conformazionale è lo studio delle conformazioni di una molecola e della loro influenza sulle sue proprietà. Le conformazioni di una molecola sono tradizionalmente definite come arrangiamenti dei suoi atomi nello spazio che si possono interconvertire fra loro semplicemente con la rotazione attorno ad uno o più legami. Questa definizione è spesso utilizzata in maniera meno stringente perché piccole distorsioni negli angoli di legame e nelle lunghezze di legame spesso accompagnano cambiamenti conformazionali. Inoltre tali rotazioni possono avvenire intorno a legami che si trovano in sistemi coniugati e che hanno un ordine tra il primo e il secondo. Un componente chiave dell’analisi conformazionale è la ricerca (search) conformazionale, che ha come obiettivo l’identificazione delle conformazioni “preferite” di una molecola, quelle conformazioni che ne determinano il comportamento. Questo di solito richiede l’individuazione delle conformazioni corrispondenti a punti di minimo della superficie d’energia.
Analisi conformazionale I metodi di minimizzazione dell’energia giocano quindi un ruolo cruciale nell’analisi conformazionale. Abbiamo già visto che un’importante caratteristica dei metodi di minimizzazione dell’energia è la loro capacità di muoversi verso il punto di minimo più vicino alla struttura iniziale. Per questa ragione è necessario avere un algoritmo separato che generi le strutture di partenza per le successive minimizzazioni. Anche se teoricamente è possibile identificare tutte le conformazioni a minima energia sulla superficie, il numero dei minimi può essere così grande che è praticamente impossibile considerarli tutti. Inoltre nessun algoritmo ci garantisce che abbiamo realmente trovato il minimo globale. Ma vogliamo solo il minimo globale? Struttura attiva Minimo più popolato Minimo globale
ni = numero di molecole aventi conformazione i-esima Analisi conformazionale In queste circostanze di solito si cerca di trovare il maggior numero di minimi accessibili. L’insieme delle conformazioni ottenute mediante la ricerca può essere ulteriormente caratterizzato mediante metodi statistici. In questo caso la frazione xi della conformazione i in una miscela all’equilibrio è data dalla distribuzione di Boltzmann: R= costante dei gas ni = numero di molecole aventi conformazione i-esima N = numero totale di molecole Ei = energia molare della conformazione i-esima T = temperatura Le proprietà molecolari all’equilibrio possono essere ottenute facendo la media in base alla distribuzione di Boltzmann delle proprietà delle conformazioni individuali. Se p è la proprietà che vogliamo:
Esempio: momento di dipolo
Media di Boltzmann e ricerca conformazionale La media di Boltzmann è esatta Le approssimazioni vengono dal set di conformazioni che viene preso in considerazione Per avere una buona analisi conformazionale dobbiamo prendere in considerazione almeno tutte le conformazioni energeticamente accessibili
I metodi di ricerca conformazionale possono essere divisi in varie Analisi conformazionale I metodi di ricerca conformazionale possono essere divisi in varie categorie: algoritmi di ricerca sistematica metodi di costruzione di modelli (model-building) approcci stocastici random dinamica molecolare
Analisi conformazionale Metodi sistematici Come suggerisce il nome, una ricerca sistematica esplora lo spazio conformazionale facendo regolari e prevedibili cambiamenti sulle conformazioni. La più semplice ricerca conformazionale sistematica, chiamata anche grid search (ricerca su griglia), consiste nei seguenti passi: si identificano tutti i legami che possono ruotare nella molecola: le lunghezze di legame e gli angoli rimangono fissi. ognuno di questi legami viene sistematicamente ruotato usando un incremento fisso fino a raggiungere i 360°. tutte le conformazioni così generate sono soggette a minimizzazione dell’energia. la ricerca termina quando tutte le possibili combinazioni degli angoli di torsione sono state generate e minimizzate
Metodi sistematici: esempio Analisi conformazionale: metodi sistematici Metodi sistematici: esempio Alanina di-Peptide: Minimizzazione vincolata
5 legami con 30° di incremento 248832 strutture 69 ore Analisi conformazionale: metodi sistematici Il maggior inconveniente della ricerca su griglia è che il numero delle strutture generate e minimizzate cresce esponenzialmente con il numero dei legami che possono ruotare, un fenomeno conosciuto come esplosione combinatoriale. Il numero di strutture generate è dato da: dove i è l’incremento del diedro che è scelto per i legami ed N è il numero dei torsionali. Se l’incremento è lo stesso per ogni angolo 5 legami con 30° di incremento 248832 strutture 69 ore 7 legami con 30° di incremento circa 36 milioni di strutture 415 giorni
Eliminazione delle strutture ad alta energia Analisi conformazionale: metodi sistematici Eliminazione delle strutture ad alta energia 1 2 3 4 Torsione 1 3 valori 5 6 7 8 10 9 Torsione 2 2 valori 12 13 14 15 16 17 18 19 20 21 22 26 27 28 23 24 25 Torsione 3 3 valori 11 Torsione 1 Torsione 2 Torsione 3
Eliminazione delle strutture ad alta energia Analisi conformazionale: metodi sistematici Eliminazione delle strutture ad alta energia 1 Torsione 1 3 valori 2 3 4 Torsione 2 2 valori 5 6 7 8 9 10 Torsione 3 3 valori 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 Se, ad esempio, il secondo valore della torsione 1 combinato con il primo valore della torsione 2 porta a strutture con problemi (es. ad alta energia sterica), possiamo eliminare (“potare”) tutti i nodi corrispondenti a tale combinazione.
Esempio 13 torsioni: 11 nella catena lunga 2 nella catena corta Analisi conformazionale: metodi sistematici Esempio 13 torsioni: 11 nella catena lunga 2 nella catena corta Consideriamo per ogni angolo un incremento di 120° Piperonil-butossido 1.595.323 conformazioni Tagliamo quelle conformazioni in cui la distanza fra 2 idrogeni è minore di 1.5 Å e la distanza fra due atomi più pesanti (non legati) è 3 Å. 53.494 conformazioni
Eliminazione di alcune strutture in molecole cicliche Analisi conformazionale: metodi sistematici Eliminazione di alcune strutture in molecole cicliche Le molecole cicliche sono spesso abbastanza difficili da analizzare usando una ricerca sistematica. La strategia comune è quella di rompere l’anello, ottenendo una molecola “pseudo-aciclica” che può quindi essere trattata come una normale molecola aciclica. Quando si fa la ricerca conformazionale di molecole cicliche deve essere inclusa una verifica addizionale (lunghezze e angoli di chiusura ciclica) in grado di garantire che gli anelli siano correttamente costruiti. Esempio: cicloesano cis La chiusura ciclica non può avvenire trans
Campionamento della griglia Analisi conformazionale: metodi sistematici Campionamento della griglia
Metodi model-building Analisi conformazionale Metodi model-building Una maniera di limitare, almeno parzialmente, l’esplosione combinatoriale della ricerca sistematica è di usare frammenti molecolari a partire dai quali costruire le conformazioni. Con gli approcci a “costruzione da modello” all’analisi conformazionale si costruiscono le conformazioni di una molecola unendo insieme strutture tridimensionali di frammenti molecolari. Tali metodi possono essere più efficaci poiché ci sono molte meno combinazioni di valori di angoli torsionali. Ciò è particolarmente vero per frammenti ciclici che possono creare problemi nella ricerca conformazionale.
Metodi model-building Analisi conformazionale Metodi model-building . Per usare questi metodi vanno fatte alcune assunzioni: Ogni frammento deve essere conformazionalmente indipendente dal resto della molecola. Le conformazioni a disposizione per ogni frammento devono coprire il range di strutture osservate in molecole completamente costruite. Ovviamente si possono solo analizzare molecole i cui frammenti siano disponibili.
Metodi Casuali (Random) Come suggerisce il nome, in tali metodi si esplora lo spazio conformazionale partendo da una data conformazione e facendo cambiamenti del tutto casuali su di essa in una serie di step successivi che portano alla generazione di nuove conformazioni in un ordine impredittibile. Uno schema generale di ricerca conformazionale casuale consiste nei seguenti passi: Si sceglie una data conformazione di partenza e si inizia un ciclo iterativo. Si varia in maniera casuale la geometria di tale conformazione. Ciò può essere fatto sia variando le coordinate atomiche degli atomi che gli angoli di torsione dei legami che possono ruotare. La nuova struttura è soggetta a minimizzazione dell’energia e genera una nuova conformazione Si confronta tale conformazione con quelle dei cicli precedenti (RMSD) e se essa non è stata già trovata viene aggiunta alla lista delle conformazioni. Si sceglie una conformazione di partenza per il ciclo successivo e si torna al punto 2. La ricerca termina quando viene verificato un opportuno criterio di terminazione.
Schema generale di ricerca casuale Conformazione di partenza Prendi conformazione iniziale Genera una nuova struttura aggiungendo valori casuali (x,y,z) a ciuascuna coordinata cartesiana Genera una nuova struttura ruotando casualmente attorno ad angoli di torsione scelti a caso Minimizza No Già generata? Aggiungi alla lista delle conformazioni Si Finito? Si No Stop Determina la conformazione per la prossima iterazione
Vari approcci possibili Scelta della conformazione per l’iterazione successiva Conformazione dell’ultimo ciclo Scelta casualmente fra quelle generate nei cicli precedenti La meno utilizzata fra quelle generate nei cicli precedenti Quella di più bassa energia fra le generate nei cicli precedenti Scelta col criterio Monte Carlo - Metropolis Criterio di terminazione Dopo un numero di cicli predefinito Fino a che nessuna nuova struttura viene generata In un metodo sistematico la procedura ha una fine definita In un metodo casuale non la procedura non ha termine e non si è mai assolutamente certi che tutte le conformazioni di bassa energia siano state trovate
Monte Carlo Multiple Minimum (MCMM) La scelta della conformazione per l’iterazione successiva è basata sul criterio Monte Carlo Metropolis La conformazione dell’ultimo ciclo, n ,è accettata come conformazione di partenza del ciclo successivo, n+1, se: La sua energia è inferiore a quella del ciclo precedente En < En-1 La sua energia è superiore a quella del ciclo precedente En > En-1 ma il fattore di Boltzmann della differenza di energia: exp[-(En - En-1 )/RT] è maggiore di un numero scelto casualmente fra 0 e 1 In caso contrario per il ciclo successivo si mantiene come conformazione iniziale quella del ciclo precedente (già usata per l’ultimo ciclo n)
Systematic Unbound Multiple Minimum (SUMM) Combinazione di ricerca sistematica e casuale Si procede come segue: Si seleziona una conformazione iniziale Si variano casualmente gli angoli torsionali di valori predefiniti, dapprima grandi (120o) e poi in successione sempre più piccoli (60o, 30o,...) Si minimuzza la nuova geometria ottenendo una nuova conformazione Si controlla l’eventuale duplicazione della conformazione ottenuta con quelle dei cicli precedenti Si torna al punto 1 fino a che si trovano nuove conformazioni
Geometrie di partenza generate sistematicamente o casualmente Analisi conformazionale Geometrie di partenza generate sistematicamente o casualmente Minimizzazione dell’energia Eliminazione dei duplicati Scelta di una struttura rappresentativa per ogni minimo
Confrontro tra diversi conformeri: RMSD Analisi conformazionale Confrontro tra diversi conformeri: RMSD Il fitting è la procedura attraverso cui due o più conformazioni della stessa o di diverse molecole sono orientate nello spazio in maniera che atomi o gruppi funzionali particolari siano sovrapposti uno sull’altro in maniera ottimale. Un algoritmo di fitting molecolare richiede una misura numerica della “differenza” tra due strutture disposte nello spazio. La misura più usata è quella della root-mean-square-distance (RMSD) tra coppie di atomi: dove Natomi è il numero di atomi totale e di è la distanza tra le coordinate dell’atomo i nelle due strutture sovrapposte. Occorre trovare l’orientazione relativa delle due conformazioni tale che la RMSD sia minima.
Confrontro tra diversi conformeri. Analisi conformazionale Confrontro tra diversi conformeri. A volte occorre prendere in considerazione anche possibili strutture che apparentemente differiscono per ragioni di simmetria. 1 1 2 3 3 2 4 5 5 4
Confrontro tra diversi conformeri. Analisi conformazionale Confrontro tra diversi conformeri. In maniera alternativa si può misurare la distanza tra due conformazioni in termini di angoli di torsione. Questa distanza si può calcolare come distanza Euclidea I set prodotti usando la RMSD e la distanza Euclidea possono essere abbastanza diversi. Infatti piccoli cambiamenti negli angoli di torsione nel centro della molecola possono dar luogo a grosse differenze nelle posizioni degli atomi terminali di una molecola. La RMSD produce cluster in cui le molecole hanno forma simile.
Raggruppamento di strutture simili: algoritmi di clustering Analisi conformazionale Raggruppamento di strutture simili: algoritmi di clustering La ricerca conformazionale può generare un gran numero di dati che devono essere analizzati. Molte delle conformazioni generate sono molto simili, è quindi preferibile essere in grado di selezionare dal set di dati un set di conformazioni rappresentative più piccolo. Questo può essere fatto con l’analisi di cluster che raggruppa insieme oggetti simili da cui estrarre i più rappresentativi. Raggruppare insieme oggetti simili Selezionare un componente Richiede una misura di similarità
Geometrie di partenza generate sistematicamente o casualmente Analisi conformazionale Geometrie di partenza generate sistematicamente o casualmente Minimizzazione dell’energia Eliminazione dei duplicati Scelta di una struttura rappresentativa per ogni minimo
Metodi di clustering Agglomerative Gerarchici Divisive Relocation Analisi conformazionale Metodi di clustering Agglomerative Gerarchici Divisive Relocation Nearest neighbours Non-Gerarchici Altri Single-pass
Cluster gerarchici Metodi agglomerativi Analisi conformazionale Cluster gerarchici C’è un ordine preciso in base al quale i cluster sono formati e amalgamati. Sono semplici da programmare e sono indipendenti dall’ordine in cui le conformazioni vengono assegnate ad ogni cluster. Metodi agglomerativi 1. All’inizio ogni conformazione fa parte di un cluster diverso 2. Si calcolano tutte le distanze fra ogni cluster. 3. Si fondono i due cluster più simili in un unico cluster. 4. Si ripete il punto 3 fino a che: La distanza tra tutte le coppie di cluster è maggiore di un valore prefissato. Tutti I cluster sono stati uniti in un unico cluster.
Calcolo della distanza tra due cluster Analisi conformazionale Calcolo della distanza tra due cluster Distanza minima (single linkage) Distanza massima (Complete linkage) Distanza media (Average linkage) – la più comune
Analisi conformazionale Esempio 1 2 6 8 7 5 4 3
Sequenza di clustering Analisi conformazionale Esempio (cont.) 1 2 6 8 7 5 4 3 Sequenza di clustering (tra parentesi la distanza fra i cluster formati)
Dendrogramma Esempio (cont.) Analisi conformazionale Esempio (cont.) Dendrogramma Numero di cluster ad ogni livello di similarità Appartenenza a ciascun cluster 12 10 8 1 2 6 8 7 5 4 3 6 5,8 4 2 3 4 7 8 5 2 6 1
Metodi di clustering non gerarchici: Analisi conformazionale Metodi di clustering non gerarchici: “nearest neighbours” Lo svantaggio dei metodi gerarchici consiste nel fatto che occorre calcolare la matrice di similarità che ha dimensioni NxN, dove N è il numero di conformazioni trovate. Questo ne limita l’applicabilità per numeri di conformazioni molto grandi. I metodi non gerarchici superano questo problema. Il metodo “nearest neighbours” (Jarvis-Patrick) consiste nei seguenti punti: Per ogni conformazione si genera una lista delle m conformazioni ad essa più simili. Due conformazioni sono nello stesso cluster se: 1. Sono ognuno nella lista dei vicini dell’altro. 2. Hanno p (p < m) conformazioni nella lista dei vicini in comune
Esempio 1 2 6 8 7 5 4 3 Conformazione Nearest neighbours Si No Analisi conformazionale Esempio 1 2 6 8 7 5 4 3 Conformazione Nearest neighbours 1 2, 6, 8 2 1, 6, 8 3 4, 7, 8 4 3, 5, 7 5 3, 4, 7 6 1, 2, 8 7 3, 4, 8 8 3, 4, 7 Si Si richiede che 2 (=p) su 3 (=m) della lista dei vicini siano comuni No
Caratteristiche del metodo Analisi conformazionale Caratteristiche del metodo Parametri Numero dei vicini nella lista. Numero dei vicini comuni. Vantaggi Computazionalmente poco pesante. Svantaggi Le conformazioni esterne in zone poco popolate tendono a raggrupparsi insieme anche se sono lontane. Cluster grandi compatti possono essere suddivisi in maniera arbitraria.