ANALISI CONFORMAZIONALE

Slides:



Advertisements
Presentazioni simili
Grandezze ed equazioni fondamentali
Advertisements

Laboratorio Processi Stocastici
IDROCARBURI - I ALCANI NOMENCLATURA Proprietà fisiche REAZIONI.
Chimica Organica Lezione 1.
Hash Tables Indirizzamento diretto Tabelle Hash Risoluzioni di collisioni Indirizzamento aperto.
Simulazioni Molecolari
Esplorazione dello spazio conformazionale usando metodi di simulazione
ANALISI CONFORMAZIONALE
CLUSTER ANALYSIS Insieme di tecniche con l’obiettivo di unire le unità di un insieme statistico in un numero finito di classi o gruppi i quali devono.
Caratteristiche strutturali di biopolimeri
Sistemi basati su conoscenza Metodi di ricerca informata Prof. M.T. PAZIENZA a.a
Macchine non completamente specificate
Esperienza di laboratorio sull’elasticità
Identificazione delle attività
Apprendimento Non Supervisionato
ANALISI DEI GRUPPI seconda parte
Un manipolatore è costituito da un insieme di corpi rigidi (bracci) connessi in cascata tramite coppie cinematiche (giunti) a formare una catena cinematica.
Esempio – Manipolatore Antropomorfo
Algoritmi e Strutture Dati (Mod. B)
CORSO DI MODELLI DI SISTEMI BIOLOGICI LAUREA IN INGEGNERIA CLINICA E BIOMEDICA.
PEPTIDI E PROTEINE.
Alcuni aspetti rilevanti in scienza dei materiali
Esercizi.
Studente Claudia Puzzo
Analisi dei gruppi – Cluster Analisys
Intelligenza Artificiale Algoritmi Genetici
CALCOLO EVOLUZIONISTICO. In ogni popolazione si verificano delle mutazioni. Le mutazioni possono generare individui che meglio si adattano allambiente.
Normalizzazione Le forme normali certificano che la base di dati soddisfa criteri di qualità che mirano ad evitare le ridondanze e i conseguenti effetti.
RIASSUNTO STRUTTURE DI ALCANI.
METODI E CONTROLLI STATISTICI DI PROCESSO
MOLTIPLICAZIONE COMBINATORIA
Metodo della moltiplicazione
Derivate Parziali di una Funzione di più Variabili
Elementi di Informatica di base
Le distribuzioni campionarie
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
TRATTAMENTO DEI DATI ANALITICI
Un approccio soft per i primi tre anni della primaria
Rotazione intorno al legame semplice C-C
Classificazione (aka Cluster Analysis)
Rete di Hopfield applicata al problema del TSP Federica Bazzano
ALCHENI Formula generale
I FRATTALI Frattale di Mandebrot
Lez.13: Unsupervised classification: clustering gerarchico
ANALISI DEI DATI STATISTICI
Implementazione di dizionari Problema del dizionario dinamico Scegliere una struttura dati in cui memorizzare dei record con un campo key e alcuni altri.
R. Soncini Sessa, MODSS, L 26 Stima degli effetti Calcolo degli obiettivi (Laplace) Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini.
Il comportamento di una sostanza può essere interpretato in maniera completa solo se si conosce anche la natura dei legami che tengono uniti gli atomi.
Docking.
Sistemi basati su conoscenza Metodi di ricerca informata Prof. M.T. PAZIENZA a.a
Tecniche di analisi matematica. Gli studi di autenticazione e di tracciabilità sugli alimenti sono generalmente effettuati individuando variabili chimico-fisiche.
Progettazione di basi di dati: metodologie e modelli
Il comportamento di una sostanza può essere interpretato in maniera completa solo se si conosce anche la natura dei legami che tengono uniti gli atomi.
Metodi di minimizzazione Ricerca del minimo di dove è l’insieme delle variabili (coordinate)
STATISTICA P IA F ONDAZIONE DI C ULTO E R ELIGIONE C ARD. G. P ANICO Azienda Ospedaliera CORSO DI LAUREA IN INFERMIERISTICA Sr. Margherita Bramato.
Normalizzazione. Introduzione Nell’organizzazione tradizionale degli archivi, si verificano alcuni problemi, quali: Ridondanza dei dati (gli stessi dati.
Come migliorare le prestazioni di un codice di dinamica molecolare.
Proprietà macromolecolari Il calcolo delle proprietà macromolecolari implica l’utilizzo della statistica della catena polimerica in termini di distanze.
  Disegno assistito dal computer STRATEGIE PER LA RICERCA DEI NUOVI LEADS Computer-assisted design utilizza la chimica computazionale per al scoperta.
Chimica organica I Lezione. Chimica organica La chimica organica si occupa delle caratteristiche chimiche e fisiche delle molecole organiche. Si definiscono.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Campionamento.
Campionamento procedimento attraverso il quale si estrae, da un insieme di unità (popolazione) costituenti l’oggetto delle studio, un numero ridotto di.
6 Inchiesta Giulio Vidotto Raffaele Cioffi. Indice: 6.1 Come si prepara un questionario 6.2 Come somministrare un questionario 6.3 Campionamento.
I POLIELETTROLITI Polielettroliti sono composti macromolecolari che contengono un gran numero (dell’ordine del grado di polimerizzazione) di gruppi che.
Termodinamica di soluzioni di polimeri C’è una notevole differenza tra le soluzioni dei polimeri e quelle delle molecole piccole dovuta alla differenza.
Se A e B sono variabili random statisticamente indipendenti P (2) (B,A)=P(B)P(A) P(A)=probabilità che la variabile stocastica A assuma un certo valore.
Il DEFF Il DEFF (Design EFFect) è l’Effetto del Piano di
PARAGONE CON I RISULTATI SPERIMENTALI Dobbiamo correlare i parametri  ed s con variabili sperimentali. Per fare questo assumiamo che la costante di equilibrio.
R.m.s.d. = root mean square deviation
Transcript della presentazione:

ANALISI CONFORMAZIONALE

Analisi conformazionale Le proprietà chimiche, fisiche e biologiche di una molecola dipendono spesso dalle strutture tridimensionali, o conformazioni, che questa può adottare. L’analisi conformazionale è lo studio delle conformazioni di una molecola e della loro influenza sulle sue proprietà. Le conformazioni di una molecola sono tradizionalmente definite come arrangiamenti dei suoi atomi nello spazio che si possono interconvertire fra loro semplicemente con la rotazione attorno ad uno o più legami. Questa definizione è spesso utilizzata in maniera meno stringente perché piccole distorsioni negli angoli di legame e nelle lunghezze di legame spesso accompagnano cambiamenti conformazionali. Inoltre tali rotazioni possono avvenire intorno a legami che si trovano in sistemi coniugati e che hanno un ordine tra il primo e il secondo. Un componente chiave dell’analisi conformazionale è la ricerca (search) conformazionale, che ha come obiettivo l’identificazione delle conformazioni “preferite” di una molecola, quelle conformazioni che ne determinano il comportamento. Questo di solito richiede l’individuazione delle conformazioni corrispondenti a punti di minimo della superficie d’energia.

Analisi conformazionale I metodi di minimizzazione dell’energia giocano quindi un ruolo cruciale nell’analisi conformazionale. Abbiamo già visto che un’importante caratteristica dei metodi di minimizzazione dell’energia è la loro capacità di muoversi verso il punto di minimo più vicino alla struttura iniziale. Per questa ragione è necessario avere un algoritmo separato che generi le strutture di partenza per le successive minimizzazioni. Anche se teoricamente è possibile identificare tutte le conformazioni a minima energia sulla superficie, il numero dei minimi può essere così grande che è praticamente impossibile considerarli tutti. Inoltre nessun algoritmo ci garantisce che abbiamo realmente trovato il minimo globale. Ma vogliamo solo il minimo globale? Struttura attiva Minimo più popolato Minimo globale

ni = numero di molecole aventi conformazione i-esima Analisi conformazionale In queste circostanze di solito si cerca di trovare il maggior numero di minimi accessibili. L’insieme delle conformazioni ottenute mediante la ricerca può essere ulteriormente caratterizzato mediante metodi statistici. In questo caso la frazione xi della conformazione i in una miscela all’equilibrio è data dalla distribuzione di Boltzmann: R= costante dei gas ni = numero di molecole aventi conformazione i-esima N = numero totale di molecole Ei = energia molare della conformazione i-esima T = temperatura Le proprietà molecolari all’equilibrio possono essere ottenute facendo la media in base alla distribuzione di Boltzmann delle proprietà delle conformazioni individuali. Se p è la proprietà che vogliamo:

Esempio: momento di dipolo

Media di Boltzmann e ricerca conformazionale La media di Boltzmann è esatta Le approssimazioni vengono dal set di conformazioni che viene preso in considerazione Per avere una buona analisi conformazionale dobbiamo prendere in considerazione almeno tutte le conformazioni energeticamente accessibili

I metodi di ricerca conformazionale possono essere divisi in varie Analisi conformazionale I metodi di ricerca conformazionale possono essere divisi in varie categorie: algoritmi di ricerca sistematica metodi di costruzione di modelli (model-building) approcci stocastici random dinamica molecolare

Analisi conformazionale Metodi sistematici Come suggerisce il nome, una ricerca sistematica esplora lo spazio conformazionale facendo regolari e prevedibili cambiamenti sulle conformazioni. La più semplice ricerca conformazionale sistematica, chiamata anche grid search (ricerca su griglia), consiste nei seguenti passi: si identificano tutti i legami che possono ruotare nella molecola: le lunghezze di legame e gli angoli rimangono fissi. ognuno di questi legami viene sistematicamente ruotato usando un incremento fisso fino a raggiungere i 360°. tutte le conformazioni così generate sono soggette a minimizzazione dell’energia. la ricerca termina quando tutte le possibili combinazioni degli angoli di torsione sono state generate e minimizzate

Metodi sistematici: esempio Analisi conformazionale: metodi sistematici Metodi sistematici: esempio Alanina di-Peptide: Minimizzazione vincolata

5 legami con 30° di incremento  248832 strutture  69 ore Analisi conformazionale: metodi sistematici Il maggior inconveniente della ricerca su griglia è che il numero delle strutture generate e minimizzate cresce esponenzialmente con il numero dei legami che possono ruotare, un fenomeno conosciuto come esplosione combinatoriale. Il numero di strutture generate è dato da:   dove i è l’incremento del diedro che è scelto per i legami ed N è il numero dei torsionali. Se l’incremento è lo stesso per ogni angolo 5 legami con 30° di incremento  248832 strutture  69 ore 7 legami con 30° di incremento  circa 36 milioni di strutture  415 giorni

Eliminazione delle strutture ad alta energia Analisi conformazionale: metodi sistematici Eliminazione delle strutture ad alta energia 1 2 3 4 Torsione 1 3 valori 5 6 7 8 10 9 Torsione 2 2 valori 12 13 14 15 16 17 18 19 20 21 22 26 27 28 23 24 25 Torsione 3 3 valori 11 Torsione 1 Torsione 2 Torsione 3

Eliminazione delle strutture ad alta energia Analisi conformazionale: metodi sistematici Eliminazione delle strutture ad alta energia 1 Torsione 1 3 valori 2 3 4 Torsione 2 2 valori 5 6 7 8 9 10 Torsione 3 3 valori 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 Se, ad esempio, il secondo valore della torsione 1 combinato con il primo valore della torsione 2 porta a strutture con problemi (es. ad alta energia sterica), possiamo eliminare (“potare”) tutti i nodi corrispondenti a tale combinazione.

Esempio 13 torsioni: 11 nella catena lunga 2 nella catena corta Analisi conformazionale: metodi sistematici Esempio 13 torsioni: 11 nella catena lunga 2 nella catena corta Consideriamo per ogni angolo un incremento di 120° Piperonil-butossido 1.595.323 conformazioni Tagliamo quelle conformazioni in cui la distanza fra 2 idrogeni è minore di 1.5 Å e la distanza fra due atomi più pesanti (non legati) è 3 Å. 53.494 conformazioni

Eliminazione di alcune strutture in molecole cicliche Analisi conformazionale: metodi sistematici Eliminazione di alcune strutture in molecole cicliche Le molecole cicliche sono spesso abbastanza difficili da analizzare usando una ricerca sistematica. La strategia comune è quella di rompere l’anello, ottenendo una molecola “pseudo-aciclica” che può quindi essere trattata come una normale molecola aciclica. Quando si fa la ricerca conformazionale di molecole cicliche deve essere inclusa una verifica addizionale (lunghezze e angoli di chiusura ciclica) in grado di garantire che gli anelli siano correttamente costruiti. Esempio: cicloesano cis La chiusura ciclica non può avvenire trans

Campionamento della griglia Analisi conformazionale: metodi sistematici Campionamento della griglia

Metodi model-building Analisi conformazionale Metodi model-building Una maniera di limitare, almeno parzialmente, l’esplosione combinatoriale della ricerca sistematica è di usare frammenti molecolari a partire dai quali costruire le conformazioni. Con gli approcci a “costruzione da modello” all’analisi conformazionale si costruiscono le conformazioni di una molecola unendo insieme strutture tridimensionali di frammenti molecolari. Tali metodi possono essere più efficaci poiché ci sono molte meno combinazioni di valori di angoli torsionali. Ciò è particolarmente vero per frammenti ciclici che possono creare problemi nella ricerca conformazionale.

Metodi model-building Analisi conformazionale Metodi model-building . Per usare questi metodi vanno fatte alcune assunzioni: Ogni frammento deve essere conformazionalmente indipendente dal resto della molecola. Le conformazioni a disposizione per ogni frammento devono coprire il range di strutture osservate in molecole completamente costruite. Ovviamente si possono solo analizzare molecole i cui frammenti siano disponibili.

Metodi Casuali (Random) Come suggerisce il nome, in tali metodi si esplora lo spazio conformazionale partendo da una data conformazione e facendo cambiamenti del tutto casuali su di essa in una serie di step successivi che portano alla generazione di nuove conformazioni in un ordine impredittibile. Uno schema generale di ricerca conformazionale casuale consiste nei seguenti passi: Si sceglie una data conformazione di partenza e si inizia un ciclo iterativo. Si varia in maniera casuale la geometria di tale conformazione. Ciò può essere fatto sia variando le coordinate atomiche degli atomi che gli angoli di torsione dei legami che possono ruotare. La nuova struttura è soggetta a minimizzazione dell’energia e genera una nuova conformazione Si confronta tale conformazione con quelle dei cicli precedenti (RMSD) e se essa non è stata già trovata viene aggiunta alla lista delle conformazioni. Si sceglie una conformazione di partenza per il ciclo successivo e si torna al punto 2. La ricerca termina quando viene verificato un opportuno criterio di terminazione.

Schema generale di ricerca casuale Conformazione di partenza Prendi conformazione iniziale Genera una nuova struttura aggiungendo valori casuali (x,y,z) a ciuascuna coordinata cartesiana Genera una nuova struttura ruotando casualmente attorno ad angoli di torsione scelti a caso Minimizza No Già generata? Aggiungi alla lista delle conformazioni Si Finito? Si No Stop Determina la conformazione per la prossima iterazione

Vari approcci possibili Scelta della conformazione per l’iterazione successiva Conformazione dell’ultimo ciclo Scelta casualmente fra quelle generate nei cicli precedenti La meno utilizzata fra quelle generate nei cicli precedenti Quella di più bassa energia fra le generate nei cicli precedenti Scelta col criterio Monte Carlo - Metropolis Criterio di terminazione Dopo un numero di cicli predefinito Fino a che nessuna nuova struttura viene generata In un metodo sistematico la procedura ha una fine definita In un metodo casuale non la procedura non ha termine e non si è mai assolutamente certi che tutte le conformazioni di bassa energia siano state trovate

Monte Carlo Multiple Minimum (MCMM) La scelta della conformazione per l’iterazione successiva è basata sul criterio Monte Carlo Metropolis La conformazione dell’ultimo ciclo, n ,è accettata come conformazione di partenza del ciclo successivo, n+1, se: La sua energia è inferiore a quella del ciclo precedente En < En-1 La sua energia è superiore a quella del ciclo precedente En > En-1 ma il fattore di Boltzmann della differenza di energia: exp[-(En - En-1 )/RT] è maggiore di un numero scelto casualmente fra 0 e 1 In caso contrario per il ciclo successivo si mantiene come conformazione iniziale quella del ciclo precedente (già usata per l’ultimo ciclo n)

Systematic Unbound Multiple Minimum (SUMM) Combinazione di ricerca sistematica e casuale Si procede come segue: Si seleziona una conformazione iniziale Si variano casualmente gli angoli torsionali di valori predefiniti, dapprima grandi (120o) e poi in successione sempre più piccoli (60o, 30o,...) Si minimuzza la nuova geometria ottenendo una nuova conformazione Si controlla l’eventuale duplicazione della conformazione ottenuta con quelle dei cicli precedenti Si torna al punto 1 fino a che si trovano nuove conformazioni

Geometrie di partenza generate sistematicamente o casualmente Analisi conformazionale Geometrie di partenza generate sistematicamente o casualmente Minimizzazione dell’energia Eliminazione dei duplicati Scelta di una struttura rappresentativa per ogni minimo

Confrontro tra diversi conformeri: RMSD Analisi conformazionale Confrontro tra diversi conformeri: RMSD Il fitting è la procedura attraverso cui due o più conformazioni della stessa o di diverse molecole sono orientate nello spazio in maniera che atomi o gruppi funzionali particolari siano sovrapposti uno sull’altro in maniera ottimale. Un algoritmo di fitting molecolare richiede una misura numerica della “differenza” tra due strutture disposte nello spazio. La misura più usata è quella della root-mean-square-distance (RMSD) tra coppie di atomi: dove Natomi è il numero di atomi totale e di è la distanza tra le coordinate dell’atomo i nelle due strutture sovrapposte. Occorre trovare l’orientazione relativa delle due conformazioni tale che la RMSD sia minima.

Confrontro tra diversi conformeri. Analisi conformazionale Confrontro tra diversi conformeri. A volte occorre prendere in considerazione anche possibili strutture che apparentemente differiscono per ragioni di simmetria. 1 1 2 3 3 2 4 5 5 4

Confrontro tra diversi conformeri. Analisi conformazionale Confrontro tra diversi conformeri. In maniera alternativa si può misurare la distanza tra due conformazioni in termini di angoli di torsione. Questa distanza si può calcolare come distanza Euclidea I set prodotti usando la RMSD e la distanza Euclidea possono essere abbastanza diversi. Infatti piccoli cambiamenti negli angoli di torsione nel centro della molecola possono dar luogo a grosse differenze nelle posizioni degli atomi terminali di una molecola. La RMSD produce cluster in cui le molecole hanno forma simile.

Raggruppamento di strutture simili: algoritmi di clustering Analisi conformazionale Raggruppamento di strutture simili: algoritmi di clustering La ricerca conformazionale può generare un gran numero di dati che devono essere analizzati. Molte delle conformazioni generate sono molto simili, è quindi preferibile essere in grado di selezionare dal set di dati un set di conformazioni rappresentative più piccolo. Questo può essere fatto con l’analisi di cluster che raggruppa insieme oggetti simili da cui estrarre i più rappresentativi. Raggruppare insieme oggetti simili Selezionare un componente Richiede una misura di similarità

Geometrie di partenza generate sistematicamente o casualmente Analisi conformazionale Geometrie di partenza generate sistematicamente o casualmente Minimizzazione dell’energia Eliminazione dei duplicati Scelta di una struttura rappresentativa per ogni minimo

Metodi di clustering Agglomerative Gerarchici Divisive Relocation Analisi conformazionale Metodi di clustering Agglomerative Gerarchici Divisive Relocation Nearest neighbours Non-Gerarchici Altri Single-pass

Cluster gerarchici Metodi agglomerativi Analisi conformazionale Cluster gerarchici C’è un ordine preciso in base al quale i cluster sono formati e amalgamati. Sono semplici da programmare e sono indipendenti dall’ordine in cui le conformazioni vengono assegnate ad ogni cluster. Metodi agglomerativi 1. All’inizio ogni conformazione fa parte di un cluster diverso 2. Si calcolano tutte le distanze fra ogni cluster. 3. Si fondono i due cluster più simili in un unico cluster. 4. Si ripete il punto 3 fino a che: La distanza tra tutte le coppie di cluster è maggiore di un valore prefissato. Tutti I cluster sono stati uniti in un unico cluster.

Calcolo della distanza tra due cluster Analisi conformazionale Calcolo della distanza tra due cluster Distanza minima (single linkage) Distanza massima (Complete linkage) Distanza media (Average linkage) – la più comune

Analisi conformazionale Esempio 1 2 6 8 7 5 4 3

Sequenza di clustering Analisi conformazionale Esempio (cont.) 1 2 6 8 7 5 4 3 Sequenza di clustering (tra parentesi la distanza fra i cluster formati)

Dendrogramma Esempio (cont.) Analisi conformazionale Esempio (cont.) Dendrogramma Numero di cluster ad ogni livello di similarità Appartenenza a ciascun cluster 12 10 8 1 2 6 8 7 5 4 3 6 5,8 4 2 3 4 7 8 5 2 6 1

Metodi di clustering non gerarchici: Analisi conformazionale Metodi di clustering non gerarchici: “nearest neighbours” Lo svantaggio dei metodi gerarchici consiste nel fatto che occorre calcolare la matrice di similarità che ha dimensioni NxN, dove N è il numero di conformazioni trovate. Questo ne limita l’applicabilità per numeri di conformazioni molto grandi. I metodi non gerarchici superano questo problema. Il metodo “nearest neighbours” (Jarvis-Patrick) consiste nei seguenti punti: Per ogni conformazione si genera una lista delle m conformazioni ad essa più simili. Due conformazioni sono nello stesso cluster se: 1. Sono ognuno nella lista dei vicini dell’altro. 2. Hanno p (p < m) conformazioni nella lista dei vicini in comune

Esempio 1 2 6 8 7 5 4 3 Conformazione Nearest neighbours Si No Analisi conformazionale Esempio 1 2 6 8 7 5 4 3 Conformazione Nearest neighbours 1 2, 6, 8 2 1, 6, 8 3 4, 7, 8 4 3, 5, 7 5 3, 4, 7 6 1, 2, 8 7 3, 4, 8 8 3, 4, 7 Si Si richiede che 2 (=p) su 3 (=m) della lista dei vicini siano comuni No

Caratteristiche del metodo Analisi conformazionale Caratteristiche del metodo Parametri Numero dei vicini nella lista. Numero dei vicini comuni. Vantaggi Computazionalmente poco pesante. Svantaggi Le conformazioni esterne in zone poco popolate tendono a raggrupparsi insieme anche se sono lontane. Cluster grandi compatti possono essere suddivisi in maniera arbitraria.