Docking
Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: Le due molecole si legano tra di loro? Quanto vale l’energia di interazione? (binding energy) Qual’è la geometria del complesso fra le due molecole? Problemi di docking in biochimica: Docking proteina-molecola Docking DNA-molecola Docking proteina-proteina Docking proteina-DNA
Importanza del docking Il docking permette di studiare come una molecola si lega ad una macromolecola biologica (enzima, proteina, DNA, recettore) processo alla base del riconoscimento molecolare Il riconoscimento molecolare è un fenomeno di enorme importanza in biologia Enzima substrato Anticorpo antigene Recettore ligando (agonista, antagonista, inibitore) Strutture di complessi proteina-ligando raggi X NMR Importanza in chimica farmaceutica Ligando = Molecola con azione farmacologica!
Generalità sul docking L’associazione fra le due molecole è basata su interazioni: Van der Waals Elettrostatiche Legami idrogeno Le interazioni corrispondenti sono deboli e a corto raggio L’associazione implica complementarietà geometrica Nel docking si cerca di determinare la geometria del complesso intermolecolare formato fra le due molecole L’energia di binding è la differenza di energia fra il complesso e le due molecole separate Il solvente (acqua) gioca un ruolo importante L’entropia ha un impatto significativo sul binding.
Aspetti Energetici Interazioni a corto raggio implicano elevata complementarietà geometrica fra le supefici a contatto: “docking geometrici” Ligando e proteina sono conformazionalmente flessibili La stima dell’energia è difficoltosa (energie conformazionali, effetto del solvente, effetto entropico, energia elettrostatica,..)
Applicazioni Stima dell’energia di binding Ricerca di capostipiti di nuove classi di farmaci che agiscano interagendo con un recettore (screening virtuale) Stima dell’influenza di modifiche della struttura della molecola capostipite per sviluppare farmaci sempre più efficaci Progettazione ex-novo di un farmaco Predizione del complesso molecolare Comprensione delle modalità di binding Ottimizzazione della struttura del farmaco
Interazioni coinvolte nel docking Energia di interazione: somma di interazione VdW e elettrostatica fra gli atomi di una molecola e quelli dell’altra i=1,2,3 j=1,2 1 1 Se fra i e j c’è un legame idrogeno si deve aggiungere anche un contributo di tipo VdW con potenze 12-10 e non 12-6 2 Aij 12 Bij 10 3 _ __ __ 2 rij rij
Algoritmi di docking Lo scopo è di predirre la struttura e l’energia del complesso intermolecolare fra due molecole (proteina e ligando) Gli algoritmi di docking sono basati sulla ricerca del minimo globale per l’energia di interazione fra la proteina e il ligando Il docking può essere distinto in: docking rigido docking flessibile (solo il ligando) Le variabili da minimizzare sono: Tre coordinate cartesiane del centro di massa del ligando Tre angoli che descrivono l’orientamento del ligando N angoli di torsione del ligando (solo docking flessibile)
Esempio ligando con due legami rotabili xcm, ycm, zcm , , 1, 2
Docking rigido Assunzioni Applicazioni Esempi Proteina rigida Ligando rigido Applicazioni Docking of molecole piccole e poco flessibili Docking di data base di molti conformeri Esempi Programma DOCK basato su complementarietà geometrica
Docking rigido Matching delle caratteristiche geometriche delle due molecole (proteina ligando) nello spazio A B C D b c a ligando receptor
Docking Flessibile Assunzioni La flessibilità del ligando è limitata agli angoli di torsione e alle conformazioni di anello Insieme delle possibili conformazioni Docking rigido di ciascuna delle possibili conformazioni del ligando Frammentazione del ligando Costruzione incrementale (FlexX) Search conformazionale esplicito Monte Carlo (LigandFit) Algoritmo genetico (AutoDock, GOLD) La proteina è considerata rigida Modelli di proteina multipli (FlexE)
Algoritmi Genetici (GA) Sono algoritmi di ricerca del minimo globale basati sull’analogia con la genetica e l’evoluzione Nel docking la posizione relativa del ligando rispetto alla proteina è descritta dalle seguenti variabili: - tre coordinate del centro di massa - tre angoli che descrivono l’orientamento nello spazio - angoli di torsione dei legami rotabili Nell’analogia genetica lo stato del ligando corrisponde al genotipo, le sue coordinate al fenotipo Nel docking la “fitness” è rappresentata dall’energia di interazione del ligando con la proteina
Nell’algoritmo genetico lo stato del ligando corriponde al cromosoma e ogniuna delle variabili ad un gene In genere le variabili sono rappresentate in cifre binarie Si parte da una certo numero di stati del ligando (insiemi di coordinate angoli di rotazione e angoli di torsione) cioè di cromosomi ovvero individui che costituiscono una popolazione Coppie di individui (stati del ligando) vengono accoppiate mediante processi di crossover e variazione casuale di una cifra Si passa così ad una generazione successiva che corrisponde ad una nuova popolazione Si procede così ottenendo tante nuove popolazioni successive sempre più “sane” cioè con energia minore Dopo un certo numero di generazioni si valuta l’individuo con l’energia più bassa
Si crea una popolazione initiale di m conformazioni: Ciascuna conformazione è rappresentata da un cromosoma 1 2 3 4 Si calcola la funzione di fitness ( l’energia) per ciascun cromosoma Nel cromosoma, ciascuna torsione può essere rappresentata da uno dei 25=32 valori corrispondenti a numeri binari a 5 cifre
Si applicano alla nuova popolazione gli operatori genetici: Sono propagati gli individui col miglior fitness Crossover: Mutazione puntuale: Si ripete la procedura su nuove popolazione 00100011110001 11000011001100 00100011001100 11000011110001 00100011110001 00100010110001
Gold Fitness evaluation of individual with chromosome c: Build conformation according to c. Superimpose matching interacting groups. Calculate docking score: -Ehydrogen bond – (Einternal + EVdW-complex) Genetic operators Cross over Mutation Migration Operators randomly selected. 20-50 runs, each with up to 100000 genetic operations.
Gold Validation: Good 4PHV - A peptide-like ligand docked into HIV protease
Gold Validation: Close 1GLQ - A nitrophenyl-substituted peptide ligand docked into glutathione-S-transferase