Docking
Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si legano tra di loro? Quanto vale l’energia di interazione? (binding energy) Qual’è la geometria del complesso fra le due molecole? Problemi di docking in biochimica: Docking proteina-molecola Docking DNA-molecola Docking proteina-proteina Docking proteina-DNA
Importanza del docking Il docking permette di studiare come una molecola si lega ad una macromolecola biologica (enzima, proteina, DNA, recettore) processo alla base del riconoscimento molecolare Il riconoscimento molecolare è un fenomeno di enorme importanza in biologia Enzima substrato, inibitore Anticorpo antigene Recettore ligando (agonista, antagonista) Strutture di complessi proteina-ligando raggi X NMR Importanza in chimica farmaceutica Ligando = Molecola con azione farmacologica?
Generalità sul docking L’associazione fra le due molecole è basata su interazioni: Van der Waals Elettrostatiche Legami idrogeno Le interazioni corrispondenti sono deboli e a corto raggio Complementarietà geometrica Complementarietà chimica Nel docking si cerca di determinare la geometria del complesso intermolecolare formato fra le due molecole L’energia di binding è la differenza di energia fra il complesso e le due molecole separate Il solvente (acqua) gioca un ruolo importante L’entropia ha un impatto significativo sul binding.
Aspetti Energetici Interazioni a corto raggio implicano elevata complementarietà geometrica fra le superfici a contatto: “docking geometrici” Ligando e proteina sono conformazionalmente flessibili La stima dell’energia è difficoltosa (energie conformazionali, effetto del solvente, effetto entropico, energia elettrostatica,..)
Energia di binding
Applicazioni Stima dell’energia di binding target-ligando Predizione della geometria del complesso target-ligando Principale campo di applicazione delle tecniche di docking è lo studio delle proprietà (energia e geometria) di binding di potenziali nuovi farmaci: Modalità di binding di farmaci già noti Ricerca di molecole potenzialmente attive su nuovi target recettoriali (virtual screening) Previsione “in silico” della potenziale attività farmacologica di nuove molecole
Peculiarità del docking La ricerca farmaceutica richiede elevate prestazioni (arrivare a risultati plausibili in poco tempo), per cui tutte le tecniche di docking impiegate in questo ambito puntano a: Sfruttare al meglio tutte quello che si conosce del sistema target-ligando in oggetto Impiegare algoritmi specializzati per la ricerca della geometria di binding Impiegare funzioni parametrizzate per la stima dell’affinità target-ligando e per la previsione della geometria di binding
Condizioni iniziali Lo studio di docking può essere effettuato quando: È nota la struttura 3D del target recettoriale Sono note le principali interazioni target-ligando La struttura di target e ligando sono compatibili con la parametrizzazione dei modelli impiegati Le dimensioni e la complessità del sistema possono essere trattati dai modelli impiegati Quasi tutte le condizioni citate sono soddisfatte quando è possibile trovare la struttura di complessi co-cristallizzati del target con molecole simili al ligando in oggetto.
Protein Data Bank (PDB) Un organismo che si occupa di raccogliere, catalogare, classificare e rendere disponibile a chiunque i dati cristallografici relativi ad enzimi, recettori, acidi nucleici e, in generale, macromolecole biologiche. Tutti possono accedere, consultare e scaricare strutture Xray dall’archivio PDB, www.pdb.org Esistono anche siti o applicazioni specifiche per la consultazione guidata del dati presenti sul PDB. Tutti i programmi di modelling sono in grado di leggere i files depositati nell’archivio PDB.
Funzioni di score L’ enorme mole di dati strutturali disponibili tramite l’archivio PDB, è stata ed è fondamentale per lo sviluppo di metodi di docking validi. L’obiettivo più importante è sviluppare metodi di docking in grado di prevedere la geometria di binding tramite una funzione che stima l’affinità tra target e ligando. Questa funzione viene generalmente indicata con il nome di funzione di score. Effettivamente, i diversi programmi di docking finora sviluppati si differenziano proprio in base alla funzione di score e all’algoritmo di ricerca.
Finora sono state implementate diversi tipi di funzioni di score e, quasi certamente, negli anni la lista è destinata ad aumentare. Attualmente, possiamo distiguere tra classi principali: Force field based: la stima dell’affinità target-ligando viene effettuata tramite la meccanica molecolare. Knowledge based: funzioni che stimano la probabilità di “avvicinamento” tra atomi del ligando ed atomi del target. Consensus scoring: lo scoring complessivo è dato dalla combinazione di più funzioni di score.
Approcci al docking Target Ligando Rigido: gli atomi del target sono fissi durante la ricerca della geometria di binding ( cruciale la scelta della struttura inziale del target) Semi-rigido: alcuni atomi del sito di binding possono adattarsi al binding del ligando Flessibile: le conformazioni di target e ligando si adattano reciprocamente( attualmente si può fare solo con la dinamica molecolare, non con il docking) Ligando Rigido: nel docking sono ricercate la posizione e l’orientamento di una conformazione fissa del ligando nel sito recettoriale. Flessibile: nel docking sono ricercate la posizione, l’orientamento e la conformazione del ligando nel sito recettoriale.
Variabili del docking Una combinazione delle 6+n variabili definisce la posa di un ligando. xcm, ycm, zcm , , 1, 2
Algoritmi Genetici (GA) Sono algoritmi di ricerca del minimo globale basati sull’analogia con la genetica e l’evoluzione Genotipo: ogni posa è individuata da un cromosoma, a sua volta formato da 6+n geni: - 3 coordinate del centro di massa - 3 angoli di Eulero - n angoli di torsione dei legami rotabili Fenotipo: l’affinità con il target (score) è l’unico fattore che viene considerato nell’evoluzione e si identifica con la fitness. Questi algoritmi di ricerca creano popolazioni di pose che di generazione in generazione evolvono trasmettendosi i caratteri ereditari sotto una costante pressione selettiva. Il meccanismo di trasmissione dei caratteri avviene in base a processi che mimano il rimescolamento dell’informazione genica che si osservano in natura: mutazioni puntiformi e crossing-over. I parametri di controllo di questi algoritmi sono tipicamente il numero di generazioni, la pressione selettiva, il tasso di mutazione e crossing-over, il numero di nicchie evolutive, etc.
Popolazione initiale di m conformazioni: Ciascuna conformazione è rappresentata da un cromosoma 1 2 3 4 Si calcola la funzione di fitness ( l’energia) per ciascun cromosoma Nel cromosoma, ciascuna torsione può essere rappresentata da uno dei 25=32 valori corrispondenti a numeri binari a 5 cifre
Nuova popolazione ottenuta tramite gli operatori genetici: Selezione: solo gli individui con miglior fitness si riproducono Crossover: Mutazione puntuale: 00100011110001 11000011001100 00100011001100 11000011110001 00100011110001 00100010110001
Gold Fitness evaluation of individual with chromosome c: Build conformation according to c. Superimpose matching interacting groups. Calculate docking score: -Ehydrogen bond – (Einternal + EVdW-complex) Genetic operators Cross over Mutation Migration Operators randomly selected. 20-50 runs, each with up to 100000 genetic operations.
Gold Validation: Good 4PHV - A peptide-like ligand docked into HIV protease
Gold Validation: Close 1GLQ - A nitrophenyl-substituted peptide ligand docked into glutathione-S-transferase
Algoritmi a ricerca gerarchica L’algoritmo effettua un search conformazionale preliminare allo scopo di generare un numero elevato di conformeri del ligando. La popolazione di conformeri viene sottoposta ad una serie di test, via via più restrittivi, per individuare un numero ristretto di candidati. Viene effettuato lo scoring dei conformeri così ottenuti; quelli corrispondenti alle pose migliori vengono considerati per una fase successiva di rescoring, in cui viene stimata in maniera più accurata l’interazione tra target e ligando.
Docking con Glide Preparazione della proteina ed del ligando: la funzione di score implementata in Glide usa il campo di forze OPLS il programma deve assegnare i parametri del FF agli atomi del target e del ligando. Calcolo dei campi molecolari di interazione: il sito di binding del target viene mappato con griglie tridimensionali (Grid Generation). Il mapping renderà lo scoring (eseguito nella succesiva fase di docking) molto più rapido ed efficiente. Docking: le pose del ligando vengono calcolate, filtrate ed i risultati vengono elaborati per renderli disponibili all’utente.