La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

Presentazioni simili


Presentazione sul tema: "Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )"— Transcript della presentazione:

1 Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )

2 Sommario Dal genoma al proteoma Classificazione delle proteine Tecniche sperimentali Progettazione di inibitori e di farmaci Screening di ligandi Strutture cristalline risolte ai raggi X Strutture NMR Metodi empirici e tecniche predittive Predizione delle modificazioni posttraduzionali 2

3 Introduzione 1 proteoma Mentre il genoma è la somma complessiva del mate- riale genetico di un organismo, il proteoma è linsieme delle sue proteine La natura dei geni la loro semplice composizione chimica e la loro capacità di essere utilizzati come stampo per fare copie esatte di sé stessi li ha resi relativamente facili da studiare ed analizzare con metodi automatici La natura delle proteine con i loro venti componenti elementari, le complesse modificazioni chimiche e lim- possibilità di duplicarsi è, invece, molto più difficile da analizzare 3

4 Introduzione 2 Le proteine sono gli agenti che, allinterno della cellula, fanno ciò che cè da fare Una delle scoperte più eclatanti della nuova era post genomica, è che il vecchio paradigma secondo cui un gene codifica per una sola proteina risulta non essere più valido Infatti, a causa di modifiche posttraduzionali (glicosi- lazione, fosforilazione) delle proteine, ad un genoma possono corrispondere più di un proteoma Il genoma di un essere vivente, anche quando comple- tamente sequenziato, non permette di comprendere tutte le funzioni biologiche che caratterizzano un organismo e che dipendono da molteplici fattori, tra i quali le vie regolatorie e metaboliche delle proteine 4

5 5 Introduzione 3

6 Introduzione 4 complementare La proteomica si rivela, pertanto, complementare alla genomica ed essenziale per la comprensione dei meccanismi biologici modi fiche posttraduzionali La proteomica consente lo studio delle proteine, sia nelle forme appena tradotte dai geni sia nelle isoforme (dovute a splicing alternativo) o nelle eventuali modi- fiche posttraduzionali, che possono verificarsi nella cellula dopo la traduzione attivitàfunzione Lo studio delle isoforme o delle modifiche post traduzionali consente la comprensione dei meccanismi di interazione tra le proteine: tali meccanismi ne condizionano lattività e la funzione 6

7 Introduzione 5 La proteomica è la scienza che mira ad indagare e a stabilire lidentità, la quantità, la struttura e le funzioni biochimiche e cellulari di tutte le proteine presenti in un tessuto, in una cellula o in un comparto sub cellulare, descrivendo come queste proprietà siano variabili nello spazio, nel tempo o in un determinato stato fisiologico La proteomica è la scienza che mira ad indagare e a stabilire lidentità, la quantità, la struttura e le funzioni biochimiche e cellulari di tutte le proteine presenti in un tessuto, in una cellula o in un comparto sub cellulare, descrivendo come queste proprietà siano variabili nello spazio, nel tempo o in un determinato stato fisiologico (M. Tyers & M. Mann, 2003) Obiettivi della proteomica Comparazione tra tessuti malati e normali Comparazione tra tessuti malati e trattati farmacologica- mente Identificazione di nuovi bersagli proteici per farmaci Studio delle modificazioni posttraduzionali Strategie integrate con la genomica Analisi dei tessuti nelle patologie tumorali 7

8 Introduzione 6 Gli attuali studi di proteomica sono prevalentemente focaliz- zati su due aree principali: Proteomica funzionale Proteomica di espressione proteomica funzionale La proteomica funzionale ha come obiettivo la definizione della funzione biologica di proteine, il cui ruolo è ancora sconosciuto, e lidentificazione delle interazioni proteina proteina in vivo, per la descrizione a livello molecolare dei meccanismi cellulari proteomica di espressione La proteomica di espressione è focalizzata sullo studio quali- tativo e quantitativo dei differenti profili di espressione delle proteine; lespressione delle proteine può infatti modificarsi per variazioni delle condizioni cellulari (diverse condizioni di crescita, stress o presenza di patologie cellulari, etc.) Il diverso profilo delle proteine rilevate in un tessuto, assenza, presenza o livelli quantitativi differenti, sono potenziali bioin- dicatori di uno stato fisiologico e/o patologico 8

9 Introduzione 7 Pertanto… Le proteine sono necessarie per tutte le attività biologiche Il proteoma rappresenta linsieme delle proteine di un organismo o di un sistema biologico, ossia linsieme delle proteine prodotte dal genoma Lo studio del proteoma (studio della struttura e dellat- tività proteica) è fondamentale per comprendere la fisio- logia e i processi biologici degli esseri viventi Proteomica Proteomica Scienza che consente lo studio appro- fondito del proteoma, il completo corredo proteico espresso in una cellula o in un tessuto (Wilkins et al., 1996) 9

10 Dal genoma al proteoma 1 Nonostante la capacità di generare sbalorditive quanti- tà di dati, le tecniche di analisi dellespressione genica forniscono poche informazioni su quali proteine siano presenti allinterno della cellula e tanto meno su quale sia la loro funzione e come venga svolta La correlazione tra labbondanza relativa di un mRNA e labbondanza relativa della sua corrispondente proteina allinterno di ogni cellula è abitualmente inferiore allo 0.5 Molte proteine, dopo la traduzione, subiscono ampie modificazioni biochimiche, con modalità molto diverse Tali modificazioni, quasi invariabilmente, alterano lattività proteica e si manifestano in forme diverse a seconda del tipo di tessuto e delle circostanze 10

11 Dal genoma al proteoma 2 Molte proteine non sono funzionalmente rilevanti finché non si assemblano tra loro in complessi più grandi o non vengono trasportate in collocazioni appropriate allinter- no o allesterno della cellula La sequenza aminoacidica può solo offrire qualche indica- zione sullo scopo di tali interazioni e sulla destinazione finale della proteina Difficoltà nel dedurre la popolazione proteica di una cellula ed il ruolo delle singole proteine, aggravata an- che dalla scarsa disponibilità di proteine analizzabili direttamente 11

12 Dal genoma al proteoma 3 Le proteine richiedono manipolazioni molto più accura- te rispetto al DNA perché la struttura terziaria, funzio- nalmente importante, può venire facilmente alterata quando entrano in contatto con una superficie o un ambiente inappropriati Inoltre: La capacità degli acidi nucleici di ibridarsi in maniera specifica con altre sequenze nucleotidiche rendono liden- tificazione del DNA un compito relativamente semplice Lidentificazione delle proteine è molto più difficile e richiede analisi complicate di spettrometria di massa e strumenti software evoluti o la generazione di specifici anticorpi 12

13 Dal genoma al proteoma 4 Infine, molte analisi effettuate sia sugli acidi nucleici sia sulle proteine si basano sulla capacità di manipo- lare miliardi di molecole identiche La generazione di numerose copie di ogni gene è semplificata dalla capacità del gene di venire utilizzato come stampo per la propria amplificazione (PCR) Le proteine devono essere isolate chimicamente, in modo inefficiente e laborioso, a partire da un gran numero di cellule viventi Tuttavia… le potenzialità che derivano dalla cono- scenza del proteoma di un organismo sono enormi: Comprensione delle basi molecolari di alcune malattie Conversione di cellule in fabbriche molecolari Efficienza degli organismi geneticamente ingegnerizzati Progettazione di nuovi farmaci 13

14 Dal genoma al proteoma 5 Genoma vs Proteoma Il bruco e la farfalla sono organismi geneticamente identici, ma posseggono diverso proteoma e fenotipo, così come il girino e la rana! 14

15 Classificazione delle proteine Lindicizzazione e la catalogazione dei dati proteomici sono compiti molto ardui, data la grande varietà di proteine differenti, utili alla cellula per svolgere i suoi compiti International Enzyme Commission Diversi metodi sistemici proposti: il più antico, dovuto alla International Enzyme Commission, si basa sulle funzioni delle proteine ed assegna ogni proteina ad una delle sei differenti categorie che derivano dalle diverse macrofunzioni In alternativa, metodo di classificazione basato sulla storia evolutiva e le similarità strutturali, con circa mille famiglie di proteine omologhe 15

16 Nomenclatura degli enzimi 1 La rapida crescita, durante gli anni 50, del numero di enzimi conosciuti rese necessario stabilire delle con- venzioni riguardo alla loro nomenclatura Prima della fondazione della International Enzyme Commission (1955), non era infatti insolito che un singolo enzima fosse conosciuto con nomi diversi, né che lo stesso nome venisse assegnato ad enzimi dif- ferenti Inoltre, alcuni nomi non davano nessuna indicazione sulla natura delle reazioni chimiche catalizzate dal relativo enzima Nel 1965 fu suggerito un approccio sistematico per classificare gli enzimi in sei classi principali, sulla base delle tipologie generali delle reazioni catalizzate (http://www.chem.qmul.ac.uk/iubmb/enzyme/ )http://www.chem.qmul.ac.uk/iubmb/enzyme/ 16

17 Nomenclatura degli enzimi 2 17 Attraverso lutilizzo di un sistema di numerazione, ad ogni enzima viene assegnato un codice numerico, dove il primo numero si riferisce alla classe principale, il secondo ed il terzo numero corrispondono a specifiche sottoclassi ed il numero finale rappresenta il numero seriale dellenzima nella sua sottoclasse

18 Nomenclatura degli enzimi 3 Esempi alcooldeidrogenasi ossidoreduttasi Lalcooldeidrogenasi è identificato come classe principale: ossidoreduttasi, classe: attività sul gruppo CHOH del donatore; sottoclasse: con NAD o NADP (molecole che permettono lossidoriduzione) come accettore; è il primo dei 269 enzimi presenti in questa categoria RNApolimerasi DNAdipendente transferasi LRNApolimerasi DNAdipendente è identificato dal nu- mero classe principale: transferasi; classe: trasferimento di gruppi contenti fosforo; sottoclasse: nucleotidiltransferasi; è il sesto dei 60 enzimi presenti in questa categoria 18

19 Nomenclatura degli enzimi 4 19

20 Famiglie e superfamiglie 1 La similarità di sequenza aminoacidica, tra le molte migliaia di proteine per cui essa è disponibile, sugge- risce che tutte le proteine esistenti ai giorni nostri possano derivare da circa mille proteine originarie Non è chiaro, tuttavia, se il ristretto numero di proteine esistenti sia dettato più da vincoli fisici sul ripiegamento della catena polipeptidica in una strut- tura tridimensionale o dalla sufficiente varietà di proprietà strutturali e chimiche che esse possiedono (che non ne ha rese necessarie altre nel corso del- levoluzione) o da una combinazione di entrambi i fattori 20

21 Famiglie e superfamiglie 2 Una delle argomentazioni più forti a favore dellipotesi evolutiva viene dallo studio pubblicato nel 1991 da Dorit et al., nel quale si teorizzava che gli esoni stessi corrispondano strettamente ai domini funzionali delle proteine e che tutte le proteine derivino dai vari ar- rangiamenti dei circa 7000 esoni disponibili Tuttavia, a prescindere dalle basi della similarità, i metodi di allineamento di sequenze e di ricerca di similarità in database sono spesso impiegati per sco- prire le possibili relazioni familiari fra proteine diverse Utili per predire la struttura proteica, che sembra sotto- stare a vincoli evolutivi più forti della sequenza amino- acidica 21

22 Famiglie e superfamiglie 3 famiglia Per definizione, le proteine che hanno unidentità di sequenza maggiore del 50% sono membri di ununica famiglia superfamiglie Allo stesso modo, le superfamiglie sono gruppi di famiglie proteiche correlate tramite livelli di similarità di sequenza bassi, ma ancora rilevabili (30%) hanno unorigine evolutiva comune, ma più antica Tutte le proteine possono essere ulteriormente suddi- vise in categorie sulla base delle caratteristiche predo- minanti di struttura secondaria: proteine di membrana, proteine principalmente, proteine principalmente, strutture e e strutture 22

23 Famiglie e superfamiglie 4 23 Sono stati realizzati diversi database gerarchici che raggruppano le proteine secondo queste caratteristiche SCOP SCOP Structural Classification Of Protein CATH CATH Class, Architecture, Topology and Homologous superfamily FSSP FSSP Fold classification based on Structure-Structure alignment of Proteins

24 Ripiegamenti 1 ripiegamento Mentre le famiglie di proteine hanno relazioni evolutive chiare e le superfamiglie proteiche hanno relazioni evolutive probabili, si dice che le proteine presentano un ripiegamento comune se hanno la stessa struttura secondaria con lo stesso tipo di arrangiamento e con la stessa connessione topologica Proteine diverse con lo stesso ripiegamento spesso presentano elementi marginali di struttura secondaria e regioni a turn che differiscono in dimensione e con- formazione motivo strutturale Il termine ripiegamento è utilizzato come sinonimo di motivo strutturale, anche se generalmente si riferisce a combinazioni più ampie di strutture secondarie in qualche caso, un ripiegamento coinvolge metà della struttura totale della proteina 24

25 Ripiegamenti 2 Proteine che si trovano nella stessa categoria di ripiegamento possono anche non avere unorigine evo- lutiva comune, ma essere il risultato di un rimesco- lamento degli esoni, in cui proteine con nuove funzioni vengono create attraverso il processo di ricombina- zione di esoni corrispondenti a domini funzionali di geni esistenti a livello del DNA Alternativamente, le similarità strutturali possono nascere solamente da caratteristiche fisiche e chimiche delle proteine, che favoriscono certi arrangiamenti e certe topologie della catena 25

26 Tecniche sperimentali Come nel caso dellanalisi genomica, molte analisi proteomiche sono limitate dalle tecniche sperimentali attualmente disponibili Sfortunatamente, dalla prospettiva della proteomica, la natura stessa delle proteine rende le analisi di laboratorio particolarmente difficili e molto meno pre- cise rispetto a quelle disponibili per lanalisi genomica Elettroforesi bidimensionale Spettrometria di massa Microarray proteici 26

27 Elettroforesi bidimensionale 1 elettroforesi bidimensionale Lelettroforesi bidimensionale è una tecnica che per- mette di separare le proteine in base al peso moleco- lare e alla carica Il procedimento utilizzato parte dallestrazione delle proteine in un tessuto Le proteine, poste su un striscia di supporto polimerico a cui è applicata una corrente elettrica e in presenza di un gradiente di acidità, migrano in maniera a diversa a seconda della loro carica elettrica intrinseca, rag- giungendo il proprio punto isoelettrico e formando delle bande A questo punto il supporto viene posto sul margine di un gel per elettroforesi che consente la separazione delle proteine in base al peso molecolare in seguito allapplicazione della corrente elettrica 27

28 Elettroforesi bidimensionale 2 Il risultato finale è un gel in cui virtualmente ciascuna proteina occupa un punto nello spazio bidimensionale, ed è evidenziabile attraverso opportune colorazioni La tappa ultima consiste nellisolamento dal gel di cia- scuna proteina per effettuare lanalisi che ne consenta lidentificazione Lanalisi può essere fatta in maniera manuale, rita- gliando dei tondini di gel contenenti una sola proteina e quindi procedendo con la spettrografia di massa, o attraverso tecniche automatiche (più o meno evolute) di lettura diretta da gel 28

29 Elettroforesi bidimensionale 3 Con lelettroforesi bidimensio- nale si ottengono fotografie in cui ogni puntino rappresenta una proteina Confrontando fotografie otte- nute da campioni diversi si pos- sono individuare quali proteine differiscono per presenza e quantità in diverse condizioni sperimentali 29 In pratica, si considera una cellula o un tessuto e, usando le tecniche indicate, si ottengono, con una sola analisi, infor- mazioni su tutte le proteine che compongono il campione

30 Elettroforesi bidimensionale 4 Lelettroforesi bidimensionale ha in realtà diverse gravi limitazioni che ne impediscono lutilizzo estensivo Il genoma umano codifica molte decine di migliaia di proteine Inadeguatezza per lanalisi delle proteine molto piccole o con poca carica elettrica e delle proteine che attraver- sano la membrana plasmatica (e che rivestono impor- tanti ruoli in molte malattie) a causa della loro scarsa solubilità nelle preparazioni e nei gel Sensibilità relativamente bassa dei metodi di rilevamento Difficoltà nel determinare con precisione quale proteina è rappresentata da ciascuno spot 30

31 Spettrometria di massa 1 spettrometro Lo spettrometro è uno strumento che scompone lo spettro di una sorgente e ne misura le componenti Esistono spettrometri che misurano lo spettro della radiazione elettromagnetica e spettrometri che misu- rano lo spettro di massa di una sostanza, ossia le masse dei suoi costituenti (atomi, molecole, composti) In uno spettrometro di massa possono essere intro- dotti campioni allo stato solido, liquido o gassoso Le sostanze solide o liquide devono essere rese volatili prima di iniziare la fase di ionizzazione in cui la molecola del composto viene ionizzata, nel caso più comune per interazione con un fascio di elettroni 31

32 Spettrometria di massa 2 Lo ione molecolare carico positivamente si frammenta, con formazione di molecole e di ioni positivi (cationi) Solo questi ultimi sono rivelati dallo spettrometro e sono separati in funzione del loro rapporto massa/carica Infatti, i percorsi dei frammenti proteici (allinterno di un analizzatore) vengono fatti deviare da un campo magne- tico impronta digitale della massa dei peptidimass fingerprint La collisione degli ioni carichi positivamente con un collettore posto allestremità dellanalizzatore genera una corrente elettrica che può essere amplificata e rilevata come una serie di picchi corrispondenti ad unimpronta digitale della massa dei peptidi (mass fingerprint) In questo modo è possibile anche individuare lesistenza di isotopi e determinarne la massa 32

33 Spettrometria di massa 3 Nel grafico di uno spettro di massa, lasse delle x riporta i valori di rapporto massa/carica e lasse delle y i valori di abbondanza relativa degli ioni analizzati Se la risoluzione dello strumento è sufficientemente elevata, è possibile determinare la massa esatta dei singoli ioni, da cui si può dedurre la composizione elementare dello ione stesso Lo spettrometro di massa può essere direttamente interfacciato ad un gascromatografo; miscele com- plesse di prodotti possono quindi essere risolte nei singoli componenti ed i singoli spettri possono essere interpretati o confrontati con librerie standard di spettri di composti noti 33

34 Microarray proteici 1 microarray proteici I microarray proteici si sono diffusi grazie alla possibilità di svolgere analisi di proteine su larga scala, nello stesso modo in cui i chip genetici hanno rivolu- zionato lanalisi del trascrittoma Il concetto alla base dei chip proteici è molto simile a quello dei chip genetici: piccole quantità di sonde individuali sono legate covalentemente alla superficie di chip di silicio in array ad alta densità Le proteine estratte dalle cellule vengono marcate con fluorofori e flussate sul chip Proprio come avviene con i chip genetici, la quantità di materiale (in questo caso, proteina) legato alle sonde viene determinato mediante eccitazione del fluoroforo 34

35 Microarray proteici 2 Per rilevare le interazioni proteinaproteina, protei- nacomposto, etc., si possono utilizzare anche array di sonde di cattura (per esempio anticorpi), che si legano alle proteine di un campione in modo tale da rilevarne i relativi livelli di espressione I microarray proteici non hanno lo stesso impatto dei chip genetici Diversamente dalle sequenze di DNA, con i loro legami unici dettati dallaccoppiamento fra basi, è ragionevole aspettarsi che una singola proteina possa interagire con più sonde differenti La cinetica di legame di ogni sonda può variare e differenze nellin- tensità del segnale potrebbero essere dovute a differenze nellintensità di legame Le proteine sono notoriamente sensibili alla chimica del loro ambiente ed alla superficie che esse incontrano, e sia gli estratti cellulari sia le sonde si possono comportare in modo inatteso quando vengono sottoposte alle procedure di controllo 35

36 Microarray proteici 3 Per il momento (ed in attesa di tecniche di analisi automatica attendibili) è più semplice utilizzare i chip genetici come base, per puntare verso lo studio delle proteine di interesse Una volta ristretto il campo, le analisi proteomiche su piccoli sottoinsiemi di proteine verranno effettuate su chip proteici realizzati appositamente 36

37 Progettazione di inibitori e di farmaci 1 Una delle principali applicazioni della bioinformatica è la ricerca di agenti farmaceutici efficaci per prevenire e curare malattie delluomo Lo sviluppo ed il test di un nuovo farmaco sono dispendiosi sia in termini di tempo spesso occorrono fino a 15 anni, sia di denaro con costi di centinaia di milioni di dollari La genomica funzionale, la bioinformatica e la proteo- mica promettono di ridurre il lavoro associato a questo processo, accelerando i tempi ed abbassando i costi di sviluppo di nuovi farmaci 37

38 Progettazione di inibitori e di farmaci 2 scopertatest Mentre le fasi esatte dello sviluppo di un farmaco sono variabili, il procedimento complessivo si divide nei due passi fondamentali di scoperta e test Il processo di test, che coinvolge prove precliniche e cliniche, non è generalmente soggetto a miglioramenti significativi per lutilizzo di metodi automatici Il processo di scoperta, che è invece laborioso e co- stoso ed offre un terreno fertile per la ricerca bioinfor- matica, può essere suddiviso in diverse fasi Identificazione del bersaglio Scoperta ed ottimizzazione di un composto guida Tossicologia e farmacocinetica (che studia quantitativa- mente lassorbimento, la distribuzione, il metabolismo e leliminazione dei farmaci) 38

39 Progettazione di inibitori e di farmaci 3 identificazione del bersaglio patogeno Lobiettivo dellidentificazione del bersaglio consiste nellisolare una molecola biologica che sia essenziale per la sopravvivenza o la proliferazione di un parti- colare agente causa di una malattia, detto patogeno drug design Identificato il bersaglio, lobiettivo della progettazione di farmaci (drug design) consiste nello sviluppo di una molecola che si leghi al bersaglio e lo inibisca Dato che la funzione del bersaglio è essenziale per il processo vitale del patogeno, linibizione del bersaglio ferma la proliferazione del patogeno o lo distrugge Comprendere la struttura e la funzione delle proteine è una componente fondamentale nello sviluppo di far- maci, in quanto le proteine sono comuni bersagli dei farmaci stessi 39

40 Progettazione di inibitori e di farmaci 4 Esempio HIV proteasi La HIV proteasi è una proteina prodotta dal virus umano dellimmunodeficienza (HIV) il patogeno che causa lAIDS nel contesto di una cellula umana ospite La HIV proteasi è essenziale per la proliferazione del virus: linibizione della proteina annienta lefficacia del virus e la sua capacità di trasmissione 40

41 Progettazione di inibitori e di farmaci 5 Come potrebbe una molecola inibire lazione di un enzima, quale la HIV proteasi? Le proteasi sono proteine che digeriscono altre proteine, come gli enzimi di restrizione utilizzati per tagliare in modo specifico la molecola di DNA Molte delle proteine di cui lHIV ha bisogno per soprav- vivere e proliferare in un ospite umano vengono prodotte come una singola, lunga, catena polipeptidica Questo polipeptide deve poi essere tagliato nelle compo- nenti proteiche funzionali dalla HIV proteasi Come molti enzimi, la HIV proteasi possiede un sito attivo a cui si legano e su cui operano altre molecole Progettare una molecola che si leghi nel sito attivo della HIV proteasi, in modo da impedirne il normale funziona- mento 41

42 Screening di ligandi 1 inibitore composti guida Il primo passo verso la scoperta di un inibitore per una particolare proteina è di solito lidentificazione di uno o più composti guida, che si leghino al sito attivo della proteina bersaglio Tradizionalmente, la ricerca dei composti guida è sem- pre stata un processo trialanderror, durante il quale si testano diversi composti, fino a trovarne un numero sufficiente con effetti inibitori screening HTSHighThroughput Screening Recentemente, metodologie di screening ad alta pro- duttività (HTS, HighThroughput Screening) hanno reso la procedura molto più efficiente, anche se il processo sotteso resta comunque una ricerca esau- stiva del maggior numero di composti guida 42

43 Screening di ligandi 2 È noto da tempo che i siti attivi degli enzimi sono ospitati in tasche (cavità) ricavate nella struttura proteica, con specifiche caratteristiche chimicofisiche Linterazione proteinaligando è dettata principalmente dalle caratteristiche di complementarietà dei due com- posti: ligandi idrofobici legheranno regioni idrofobiche, ligandi carichi saranno richiamati da regioni cariche di segno opposto, etc. docking Gli algoritmi di docking di ligandi e quelli di screening tentano di rendere efficienti i processi di scoperta dei composti guida, muovendosi dal mondo della speri- mentazione in vitro a quello dei modelli astratti e del calcolo automatico 43

44 Docking di ligandi 1 docking Il docking è la simulazione in silicio dellaggancio della proteina con un ligando, ovvero obiettivo del docking è determinare come possono interagire due molecole di struttura nota Geometria delle superfici Interazioni tra residui affini Campi di forza elettrostatici 44

45 Docking di ligandi 2 In molti casi, la struttura tridimensionale di una protei- na e del suo ligando sono note, ma la struttura del complesso che essi formano è sconosciuta Nella progettazione di farmaci, il docking molecolare viene impiegato per determinare come un particolare farmaco si lega ad un bersaglio o come due proteine interagiscano fra loro a formare un sito di legame Gli approcci di docking molecolare hanno molto in comune con gli algoritmi per il ripiegamento delle proteine Molti gradi di libertà: ricerche euristiche e soluzioni subottime Entrambe le problematiche implicano il calcolo dellener- gia di una particolare conformazione molecolare e la ricerca della conformazione che minimizza lenergia libera del sistema Molti gradi di libertà: ricerche euristiche e soluzioni subottime 45

46 Docking di ligandi 3 Come nel ripiegamento proteico, vi sono due considerazioni principali di cui tenere conto allatto della progettazione di un algoritmo di docking Formulare una funzione energia per valutare la qualità di un particolare complesso e successivamente utilizzare un algorit- mo per esplorare lo spazio di tutti i possibili modi e conforma- zioni di legame alla ricerca di una struttura con energia minima Gestire la flessibilità sia della proteina sia del ligando putativo approccio chiaveserratura Lapproccio chiaveserratura assume una struttura proteica rigida a cui si aggancia un ligando con struttura flessibile (approccio computazionalmente vantaggioso) docking con adattamento indotto Il docking con adattamento indotto permette la flessibilità sia della proteina che del ligando Compromesso: assumere per la proteina una catena principale rigida, mentre si permette la flessibilità delle catene laterali vicino al sito di legame del ligando 46

47 Docking di ligandi 4 47

48 Docking di ligandi 5 AutoDock AutoDock (http://autodock.scripps.edu/) è un metodo ben noto per il docking di ligandi rigidi o flessibilihttp://autodock.scripps.edu/ Per valutare un particolare complesso usa un campo di forza basato su una griglia Il campo di forza viene utilizzato per dare un punteggio al complesso in base alla formazione di interazioni elettrostatiche favorevoli, al numero di legami idrogeno, alle interazioni di van der Waals, etc. 48

49 Docking di ligandi 6 AutoDock AutoDock utilizzava originariamente un approccio Monte Carlo/simulated annealing Si inducono cambiamenti casuali nella posizione e conforma- zione corrente del ligando, tenendo quelli che danno origine a conformazioni a più bassa energia rispetto a quella corrente (quando un cambiamento porta ad un aumento di energia, viene scartato) Tuttavia, per permettere allalgoritmo di trovare stati a bassa energia, superando eventuali barriere energetiche, i cambia- menti che portano ad energie più alte, talvolta, vengono ac- cettati (con una frequenza alta allinizio del processo di ottimiz- zazione, che decresce lentamente per iterazioni successive) Le versioni più recenti utilizzano algoritmi genetici, programmi di ottimizzazione che emulano la dinamica della selezione naturale su una popolazione di soluzioni in competizione 49

50 Screening di database 1 Una delle considerazioni principali nel progettare algoritmi di docking è il bilanciamento tra la necessità di una completa ed accurata ricerca di tutte le possibili conformazioni e modalità di legame del ligando e la necessità di realizzare un algoritmo di complessità computazionale ragionevole Per lo screening di database di possibili farmaci, gli algoritmi devono infatti effettuare il docking di migliaia di ligandi al sito attivo di una proteina e, pertanto, hanno bisogno di un efficienza elevata 50

51 Screening di database 2 SLIDE Metodi progettati specificamente per lo screening di database, come lalgoritmo SLIDE, spesso riducono il numero di composti considerati, utilizzando tecniche di indicizzazione del database per scartare, a priori, i composti guida che è altamente improbabile che leghino il sito attivo del bersaglio SLIDE SLIDE caratterizza il sito attivo del bersaglio in accordo con la posizione di potenziali donatori ed accettori di legami idrogeno e con i punti di interazione idrofobica del ligando, formando un modello Ogni potenziale ligando nel database viene caratte- rizzato nello stesso modo e viene costruito un insieme di indici 51

52 Screening di database 3 SLIDE Loperazione di indicizzazione permette a SLIDE di scartare rapidamente i ligandi che sono, per esempio, troppo grandi o troppo piccoli per adattarsi al modello SLIDE Attraverso la riduzione del numero di ligandi che vengono sottoposti alla procedura di docking, compu- tazionalmente onerosa, SLIDE (e algoritmi simili) possono sondare grandi database di potenziali ligandi in giorni, o ore, rispetto a tempistiche di mesi 52

53 Screening di database 4 53

54 Strutture cristalline risolte ai raggi X 1 Anche la più potente tecnica microscopica è insufficiente per determinare le coordinate molecolari di ciascun atomo di una proteina cristallografia a raggi X La scoperta dei raggi X da parte di W. C. Roentgen (1895) ha invece permesso lo sviluppo di un potente strumento per lanalisi della struttura proteica: la cristallografia a raggi X cristalli Nel 1912, M. von Laue scoprì che i cristalli, strutture solide formate da un reticolo regolare di atomi o molecole, dif- frangono i raggi X in motivi (pattern) regolari e prevedibili Allinizio degli anni 50, scienziati pionieristici come D. Hodgkin furono in grado di cristallizzare alcune molecole organiche complesse e di determinare la loro struttura osservando come esse diffrangessero un fascio di raggi X Oggi, la cristallografia a raggi X è stata impiegata per determinare la struttura di circa proteine ad un alto livello di risoluzione 54

55 Strutture cristalline risolte ai raggi X 2 55 Source: PDB statistics

56 Strutture cristalline risolte ai raggi X 3 Il primo passo nella determinazione cristallografica della struttura di una proteina è la crescita del relativo cristallo La cristallizzazione è un processo molto delicato ed impegnativo, ma lidea di base è semplice Proprio come i cristalli di zucchero possono essere fatti crescere attraverso la lenta evaporazione di una soluzione di zucchero ed acqua, i cristalli di proteine vengono fatti crescere attraverso levaporazione di una soluzione di proteina pura I cristalli delle proteine, però, sono generalmente molto piccoli (da circa 0.3mm ad 1.5mm in ogni dimensione) e sono fatti circa al 70% di acqua, con una consistenza più simile alla gelatina che ai cristalli di zucchero 56

57 Strutture cristalline risolte ai raggi X 4 57 La crescita dei cristalli di proteine generalmente richiede condizioni attentamente controllate ed una grande quantità di tempo: per raggiungere le opportune condi- zioni di cristallizzazione di una sin- gola proteina possono essere ne- cessari mesi o anche anni di esperimenti Una volta ottenuti, i cristalli proteici vengono caricati allinterno di un tubo capillare ed esposti ad un fascio di raggi X, che viene diffratto dal cristallo della proteina

58 Strutture cristalline risolte ai raggi X 5 computer, per la successiva analisi Una volta ottenuti i dati di diffrazio- ne, si utilizzano metodi numerici e modelli proteici per determinare la struttura tridimensionale della pro- teina 58 Originariamente, il pattern di diffrazione veniva cattu- rato su una pellicola radio- grafica I moderni strumenti per la cristallografia utilizzano ri- levatori di raggi X che tra- sferiscono il pattern di dif- frazione direttamente su

59 Strutture cristalline risolte ai raggi X 6 Più in dettaglio… Dallo spettro di diffrazione dei raggi X dei cristalli, i cristallografi sono in grado di calcolare mappe di densità elettronica, le quali, in pratica, sono immagini delle molecole che formano il cristallo ingrandite circa cento milioni di volte Si esaminano le mappe di densità elettronica con la grafica computerizzata e se ne verifica laccordo (fitting) con un modello molecolare Dopo le fasi di affinamento si riesce ad ottenere un mo- dello molecolare che ha un errore medio sulle coordinate di Å e che permette un esame molto dettagliato della struttura tridimensionale delle proteine 59

60 Strutture cristalline risolte ai raggi X 7 Infine, si noti che la struttura cristallografica è essen- zialmente mediata su più copie di un singolo cristallo proteico e sul tempo durante il quale il cristallo è esposto ai raggi X Le proteine cristallizzate non sono completamente rigide e la mobilità di un atomo specifico in una proteina rende confuso il segnale cristallografico La posizione delle molecole di acqua nel cristallo (che spesso sono incluse nelle entry dei database proteici) è difficile da risolvere e provoca rumore Tuttavia, la cristallografia è attualmente il metodo principale per ottenere la visione della struttura tridimensionale delle proteine a risoluzione atomica 60

61 Strutture cristalline risolte ai raggi X 8 61 Protein Data Bank PDB La Protein Data Bank (PDB, è la principale banca dati in cui sono depositate le strutture di proteine derivate dalla cristallografia a raggi Xhttp://www.pdb.org

62 Strutture NMR 1 La tecnica spettroscopica della risonanza magnetica nuclea- re fornisce un metodo alternativo per determinare la struttura delle macromolecole NMRNuclear Magnetic Resonance Alla base della tecnica NMR (Nuclear Magnetic Resonance) vi è il fatto che gli atomi di alcuni elementi come lidrogeno e gli isotopi radioattivi del carbonio e dellazoto vibrano, o risuonano, quando le molecole a cui appartengono sono immerse in un campo magnetico statico ed esposte ad un secondo campo magnetico oscillante I nuclei atomici tentano di allinearsi con il campo magnetico statico in maniera parallela o antiparallela e quando il campo magnetico oscillante fornisce loro unenergia pari alla differenza energetica fra i due stati, si verifica il fenomeno della risonanza, che può essere rilevata attraverso sensori esterni, come gli spettrometri NMR 62

63 Strutture NMR 2 Il comportamento di ogni atomo è influenzato princi- palmente dagli atomi vicini, posti cioè in residui adiacenti Lanalisi e linterpretazione dei dati richiede tecniche numeriche complesse e limita, di per sé, lutilità del- lapproccio per ogni proteina o dominio proteico (ununità globulare o fibrosa formata da catene poli- peptidiche ripiegate in più regioni compatte le quali costituiscono divisioni della struttura terziaria) più lungo di 200 aminoacidi I metodi NMR non presuppongono la cristallizzazione: sono molto vantaggiosi nel caso di proteine che non possono essere cristallizzate (specialmente proteine integrali di membrana) 63

64 Strutture NMR 3 Il risultato di un esperimento NMR è un insieme di vincoli sulle distanze interatomiche allinterno di una struttura macromolecolare Detti vincoli possono essere poi utilizzati, insieme alla sequenza proteica, per descrivere un modello della struttura tridimensionale della proteina Tuttavia, generalmente, più di un modello proteico può effettivamente soddisfare i vincoli ottenuti dalla tecni- ca NMR, perciò le strutture NMR solitamente conten- gono diversi modelli di una proteina, cioè diversi insiemi di coordinate, mentre le strutture cristallo- grafiche, solitamente, ne contengono solo uno La PDB contiene circa strutture di proteine derivate dalla NMR 64

65 Strutture NMR 4 65 Source: PDB statistics

66 PDB 1 66 Le strutture contenute nella PDB sono memorizzate in formato testo Una linea del file PDB contiene le coordinate ( x, y, z ) in angstrom (1010 m) di ogni atomo di una proteina (con altre informazioni utili) Si può inoltre ottenere unimmagine della struttura tridimensionale della proteina Ad ogni struttura nella banca dati PDB è assegnato un codice a quattro caratteri Esempio rizopuspepsina Esempio: 2APR contiene le coordinate molecolari della rizopuspepsina, una proteasi aspartica I file in formato PDB sono generalmente chiamati XXXX.pdb o pdbXXXX.ent, dove XXXX è il codice a quattro lettere della struttura

67 PDB 2 67

68 Rappresentazioni della struttura terziaria 68 La rappresenta- zione filiforme e a ball and stick illu- stra le interazioni molecolari Il metodo a cartoon evidenzia le regioni di struttura secondaria La rappresentazione della superficie mo- lecolare rivela la for- ma complessiva del- la proteina

69 Metodi empirici e tecniche predittive 1 69 Problema Problema: realizzare un algoritmo che, data la struttura tridimensionale di una proteina, predica quali sono i residui che più probabilmente sono coinvolti in uninterazione proteinaproteina Importante perché molte proteine sono attive solo quando sono associate ad altre proteine in complessi multienzimatici Soluzione Soluzione: dalle strutture presenti nel PDB, selezionare un insieme di strutture esempio che presentano due o più proteine che formano un complesso interfacciali Vi saranno residui interfacciali, coinvolti nella superficie di contatto, e residui non interfacciali Per ogni residuo, occorre selezionare un insieme di feature da misurare e da usare per risolvere il problema di predizione

70 Metodi empirici e tecniche predittive 2 70 Possibili feature: Numero di residui in un intorno di raggio stabilito rispetto al residuo in esame Carica netta del residuo e dei residui vicini Livello di idrofobicità Potenziale dei legami idrogeno Costruzione di un vettore di feature descrittive del dato residuo In concomitanza con il vettore di feature, si ha il target che attesta lappartenenza o meno del particolare residuo allinterfaccia proteinaproteina Utilizzo di un metodo di apprendimento automatico

71 Predizione delle modificazioni posttraduzionali Lampia varietà di strutture e funzioni proteiche è dovuta, in parte, al fatto che le proteine sono sotto- poste ad unampia varietà di modificazioni dopo essere state tradotte Rimozione di segmenti della proteina Formazione di legami covalenti alla superficie dei residui con zuccheri, fosfati o gruppi solfati Formazione di legami incrociati tra residui allinterno di una proteina (formazione di legami disolfuro) Molte di queste modificazioni sono effettuate da altre proteine, che devono riconoscere specifici residui superficiali, appropriati per innescare la modificazione Tecniche di predizione basate su reti neurali 71

72 Smistamento delle proteine 1 La presenza di compartimenti interni circondati da membra- ne è una caratteristica delle cellule eucariotiche Lambiente chimico allinterno dei diversi compartimenti può differire notevolmente, come può essere molto diversa la loro popolazione proteica È un imperativo funzionale ed energetico che gli eucarioti trasportino le proteine nei loro compartimenti appropriati Per esempio, gli istoni proteine legate al DNA associate con la cromatina sono funzionalmente utili solo allinterno dei nuclei delle cellule eucariotiche, dove si trovano i cromosomi Altre proteine come le proteasi, che si trovano dentro i perossisomi (comparti metabolici specializzati) sarebbero addirittura pericolose per la cellula se si trovassero in qualsiasi altro posto al suo interno 72

73 Smistamento delle proteine 2 proteine non associate/ associate alle membrane Sembra che le cellule eucariotiche considerino le proteine come appartenenti a due classi distinte in base alla loro localizzazione: proteine non associate/ associate alle membrane Il primo insieme di proteine è tradotto esclusivamente dai ribosomi, che si trovano sospesi, o fluttuanti, dentro al citoplasma 73

74 Smistamento delle proteine 3 74

75 Smistamento delle proteine 4 Gli mRNA tradotti dai ribosomi fluttuanti possono quindi rimanere nel citoplasma o essere trasportati: nel nucleo nei mitocondri nei cloroplasti nei perossisomi 75

76 Smistamento delle proteine 5 Risiedere dentro il citoplasma sembra essere lo stato di default per le proteine; al contrario il trasporto delle proteine nei diversi compartimenti separati da mem- brane richiede la presenza ed il riconoscimento di specifici segnali di localizzazione 76

77 Smistamento delle proteine 6 sequenza di localizzazione nucleare Le proteine nucleari sono destinate al nucleo grazie al fatto che possiedono una sequenza di localizzazione nucleare: una regione interna lunga da 7 a 41 ami- noacidi ricca di lisine e/o arginine Le proteine mitocondriali possiedono tutte unelica anfipatica (che contiene sia un gruppo idrofilico sia uno idrofobico) lunga da 12 a 30 aminoacidi al loro Nterminale sequenza segnale mitocondriale Questa sequenza segnale mitocondriale è riconosciuta da un recettore sulla superficie dei mitocondri e viene spesso rimossa per attivare la proteina appena viene trasportata allinterno dei mitocondri 77

78 Smistamento delle proteine 7 sequenza di transito al cloroplasto Le proteine dei cloroplasti, codificate da geni nucleari, possiedono una sequenza di transito al cloroplasto (circa 25 aminoacidi posti allNterminale) che viene similmente riconosciuta da recettori proteici posti sulla superficie dei cloroplasti segnali di destinazione perossisomiale Infine, le proteine destinate ai perossisomi possiedono uno dei due segnali di destinazione perossisomiale riconosciuti da recettori che assicurano il loro trasporto alla destinazione corretta 78

79 Smistamento delle proteine 8 reticolo endoplasmaticoEREndoplasmic Reticulum Il secondo insieme di proteine è tradotto dai ribosomi legati alla membrana che sono associati con il reticolo endoplasmatico (ER, Endoplasmic Reticulum) Il reticolo endoplasmatico è una rete di membrane intimamente associata con lapparato di Golgi dove avviene lelaborazione ulteriore delle proteine (come la glicosilazione e lacetilazione) Tutte le proteine tradotte dai ribosomi dellER, in realtà, iniziano ad essere tradotte dai ribosomi flut- tuanti nel citoplasma sequenza segnale Quando i primi 1530 aminoacidi da tradurre corri- spondono ad una particolare sequenza segnale, una particella che la riconosce si lega alla proteina e ne ferma la traduzione finché il ribosoma ed il suo mRNA non vengono trasportati allER 79

80 Smistamento delle proteine 9 Anche se non è evidente nessuna particolare sequenza consenso per la sequenza segnale, quasi sempre si riscontra una sequenza idrofobica lunga 1015 residui che termina con uno o più aminoacidi con carica positiva Quando la traduzione riprende, il nuovo polipeptide viene estruso attraverso un poro della membrana dellER nel lumen (spazio interno) dello stesso ER peptidasi segnale Un peptidasi segnale taglia dalla proteina la sequenza target dellNterminale (a meno che non debba essere mantenuta permanentemente come una proteina legata alla membrana) Reti neurali Reti neurali: 80

81 Taglio proteolitico 1 Sia i procarioti che gli eucarioti possiedono numerosi enzimi responsabili del taglio e della degradazione delle proteine e dei peptidi Esistono molteplici esempi di taglio proteico Rimozione del residuo di metionina presente allinizio di ogni polipeptide (poiché il codone dinizio codifica anche per la metionina) Rimozione dei peptidi segnale 81

82 Taglio proteolitico 2 Qualche volta il segnale di taglio può essere corto quanto un singolo residuo La chimotripsina taglia i polipeptidi allestremità Ctermi- nale dei voluminosi residui aromatici (contenenti un anello) come la fenilalanina La tripsina taglia il legame peptidico sul lato carbossilico dei residui di arginina e di lisina Lelastasi taglia il legame peptidico sul lato Cterminale di piccoli residui, come la glicina e lalanina In molti casi, comunque, il motivo di sequenza è più lungo e più ambiguo Reti neurali Reti neurali: livello di accuratezza di predizione >98% (http://www.paproc.de)http://www.paproc.de 82

83 Glicosilazione 1 glicosilazione La glicosilazione è il processo che lega permanente- mente un oligosaccaride (una breve catena di zucche- ri) alla catena laterale di un residuo sulla superficie proteica La presenza di residui glicosilati può avere un effetto significativo sul ripiegamento delle proteine, la loro localizzazione, lattività biologica e linterazione con altre proteine Negli eucarioti: Nglicosilazione Oglicosilazione 83

84 Glicosilazione 2 Nglicosilazione La Nglicosilazione è laggiunta di un oligosaccaride ad un residuo di asparagina durante la traduzione della proteina Il segnale principale che indica che un residuo di asparagina (Asn) deve essere glicosilato è la sequenza aminoacidica locale AsnXSer o AsnXThr, dove X corrisponde ad un qualsiasi residuo tranne la prolina Tuttavia, tale sequenza da sola non è sufficiente a determinare la glicosilazione (come si osserva in natura) 84

85 Glicosilazione 3 Oglicosilazione La Oglicosilazione è un processo posttraduzionale in cui lenzima Nacetilglucosaminil transferasi attacca un oligosaccaride ad un atomo di ossigeno di un resi- duo di serina o di treonina Diversamente dalla Nglicosilazione, non si conoscono motivi di sequenza che segnalino un sito per la Oglicosilazione, ma solo la presenza di residui di prolina e valina vicino alla Ser o Thr che deve essere glicosilata Reti neurali Reti neurali: accuratezza del 75% per Nglicosilazione e superiore all85% per Oglicosilazione 85

86 Fosforilazione 1 fosforilazione La fosforilazione (attacco di un gruppo fosfato) dei residui superficiali è probabilmente la modificazione posttraduzionale più comune nelle proteine animali chinasi Le chinasi, gli enzimi responsabili della fosforilazione, sono coinvolte in unampia varietà di percorsi regolatori e di trasmissione dei segnali Dato che la fosforilazione serve frequentemente come segnale di attivazione per un enzima, essa rappresenta spesso una condizione temporanea fosfatasi Le fosfatasi sono gli enzimi responsabili della rimozione dei gruppi fosfato dai residui fosforilati 86

87 Fosforilazione 2 Dato che la fosforilazione dei residui chiave di tirosina, serina e treonina serve come meccanismo regolatore in unampia varietà di processi molecolari, i vari tipi di chinasi coinvolte in ogni processo devono avere unalta specificità nel riconoscimento di particolari enzimi Nessuna sequenza consenso singola identifica un residuo come un target della fosforilazione Reti neurali Reti neurali: accuratezza 70% (http://www.cbs.dtu.dk/services/NetPhos)http://www.cbs.dtu.dk/services/NetPhos 87

88 Concludendo… 1 Mentre la genomica sta rapidamente diventando unarea di ricerca molto sviluppata, le tecniche proteo- miche iniziano solo ora ad identificare le proteine codificate nel genoma e le loro varie interazioni La caratterizzazione del proteoma di un organismo promette di colmare il varco tra la nostra conoscenza del genoma e gli effetti fisiologici e morfologici dei geni che esso contiene Varie tassonomie sono state sviluppate per classificare ed organizzare le proteine secondo la funzione enzi- matica, la similarità della sequenza e la struttura tridimensionale 88

89 Concludendo… 2 Provvisti di database di famiglie, superfamiglie e ripie- gamenti proteici, insieme con tecniche sperimentali come lelettroforesi bidimensionale e la spettrometria di massa, gli analisti sono in grado di separare, purificare ed identificare le varie proteine espresse da una cellula in un dato momento Unimportante applicazione delle informazioni proteo- miche è la progettazione di farmaci I progressi nella conoscenza della struttura delle proteine e nella cristallografia a raggi X hanno permesso la realizzazione di metodi automatici per lo screening ed il docking di ligandi proteici e per contribuire al processo di scoperta dei farmaci 89

90 Concludendo… 3 Anche se la struttura tridimensionale delle proteine è la chiave di volta per capirne la funzione e linterazione con le altre proteine, alcune utili informazioni possono essere ottenute anche dalla sola sequenza La localizzazione delle proteine e le varie modificazioni posttraduzionali sono segnalate attraverso motivi di sequenza conservati nella struttura primaria delle proteine Le modificazioni posttraduzionali danno conto del fatto che lo stesso gene può codificare per più proteine 90


Scaricare ppt "Proteomica 1 La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza. ( A. Einstein )"

Presentazioni simili


Annunci Google