La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Proteomica “La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza.” (A. Einstein)

Presentazioni simili


Presentazione sul tema: "Proteomica “La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza.” (A. Einstein)"— Transcript della presentazione:

1 Proteomica “La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza.” (A. Einstein)

2 Sommario Dal genoma al proteoma Classificazione delle proteine
Tecniche sperimentali Progettazione di inibitori e di farmaci Screening di ligandi Strutture cristalline risolte ai raggi X Strutture NMR Metodi empirici e tecniche predittive Predizione delle modificazioni posttraduzionali

3 Introduzione  1 Mentre il genoma è la somma complessiva del mate-riale genetico di un organismo, il proteoma è l’insieme delle sue proteine La natura dei geni  la loro semplice composizione chimica e la loro capacità di essere utilizzati come stampo per fare copie esatte di sé stessi  li ha resi relativamente facili da studiare ed analizzare con metodi automatici La natura delle proteine  con i loro venti componenti elementari, le complesse modificazioni chimiche e l’im-possibilità di duplicarsi  è, invece, molto più difficile da analizzare

4 Introduzione  2 Le proteine sono gli agenti che, all’interno della cellula, “fanno ciò che c’è da fare” Una delle scoperte più eclatanti della nuova era post genomica, è che il vecchio paradigma secondo cui un gene codifica per una sola proteina risulta non essere più valido Infatti, a causa di modifiche posttraduzionali (glicosi-lazione, fosforilazione) delle proteine, ad un genoma possono corrispondere più di un proteoma Il genoma di un essere vivente, anche quando comple-tamente sequenziato, non permette di comprendere tutte le funzioni biologiche che caratterizzano un organismo e che dipendono da molteplici fattori, tra i quali le vie regolatorie e metaboliche delle proteine 4

5 Introduzione  3

6 Introduzione  4 La proteomica si rivela, pertanto, complementare alla genomica ed essenziale per la comprensione dei meccanismi biologici La proteomica consente lo studio delle proteine, sia nelle forme appena tradotte dai geni sia nelle isoforme (dovute a splicing alternativo) o nelle eventuali modi-fiche posttraduzionali, che possono verificarsi nella cellula dopo la traduzione Lo studio delle isoforme o delle modifiche post traduzionali consente la comprensione dei meccanismi di interazione tra le proteine: tali meccanismi ne condizionano l’attività e la funzione 6

7 Introduzione  5 La proteomica è la scienza che mira ad indagare e a stabilire l’identità, la quantità, la struttura e le funzioni biochimiche e cellulari di tutte le proteine presenti in un tessuto, in una cellula o in un comparto sub cellulare, descrivendo come queste proprietà siano variabili nello spazio, nel tempo o in un determinato stato fisiologico (M. Tyers & M. Mann, 2003) Obiettivi della proteomica Comparazione tra tessuti malati e normali Comparazione tra tessuti malati e trattati farmacologica-mente Identificazione di nuovi bersagli proteici per farmaci Studio delle modificazioni posttraduzionali Strategie integrate con la genomica Analisi dei tessuti nelle patologie tumorali 7

8 Introduzione  6 Gli attuali studi di proteomica sono prevalentemente focaliz-zati su due aree principali: Proteomica funzionale Proteomica di espressione La proteomica funzionale ha come obiettivo la definizione della funzione biologica di proteine, il cui ruolo è ancora sconosciuto, e l’identificazione delle interazioni proteina proteina in vivo, per la descrizione a livello molecolare dei meccanismi cellulari La proteomica di espressione è focalizzata sullo studio quali-tativo e quantitativo dei differenti profili di espressione delle proteine; l’espressione delle proteine può infatti modificarsi per variazioni delle condizioni cellulari (diverse condizioni di crescita, stress o presenza di patologie cellulari, etc.) Il diverso profilo delle proteine rilevate in un tessuto, assenza, presenza o livelli quantitativi differenti, sono potenziali bioin-dicatori di uno stato fisiologico e/o patologico 8

9 Introduzione  7 Pertanto…
Le proteine sono necessarie per tutte le attività biologiche Il proteoma rappresenta l’insieme delle proteine di un organismo o di un sistema biologico, ossia l’insieme delle proteine prodotte dal genoma Lo studio del proteoma (studio della struttura e dell’at-tività proteica) è fondamentale per comprendere la fisio-logia e i processi biologici degli esseri viventi Proteomica  Scienza che consente lo studio appro-fondito del proteoma, il completo corredo proteico espresso in una cellula o in un tessuto (Wilkins et al., 1996) 9

10 Dal genoma al proteoma  1
Nonostante la capacità di generare sbalorditive quanti-tà di dati, le tecniche di analisi dell’espressione genica forniscono poche informazioni su quali proteine siano presenti all’interno della cellula e tanto meno su quale sia la loro funzione e come venga svolta La correlazione tra l’abbondanza relativa di un mRNA e l’abbondanza relativa della sua corrispondente proteina all’interno di ogni cellula è abitualmente inferiore allo 0.5 Molte proteine, dopo la traduzione, subiscono ampie modificazioni biochimiche, con modalità molto diverse Tali modificazioni, quasi invariabilmente, alterano l’attività proteica e si manifestano in forme diverse a seconda del tipo di tessuto e delle circostanze

11 Dal genoma al proteoma  2
Molte proteine non sono funzionalmente rilevanti finché non si assemblano tra loro in complessi più grandi o non vengono trasportate in collocazioni appropriate all’inter-no o all’esterno della cellula La sequenza aminoacidica può solo offrire qualche indica-zione sullo scopo di tali interazioni e sulla destinazione finale della proteina Difficoltà nel dedurre la popolazione proteica di una cellula ed il ruolo delle singole proteine, aggravata an-che dalla scarsa disponibilità di proteine analizzabili direttamente

12 Dal genoma al proteoma  3
Le proteine richiedono manipolazioni molto più accura-te rispetto al DNA perché la struttura terziaria, funzio-nalmente importante, può venire facilmente alterata quando entrano in contatto con una superficie o un ambiente inappropriati Inoltre: La capacità degli acidi nucleici di ibridarsi in maniera specifica con altre sequenze nucleotidiche rendono l’iden-tificazione del DNA un compito relativamente semplice L’identificazione delle proteine è molto più difficile e richiede analisi complicate di spettrometria di massa e strumenti software evoluti o la generazione di specifici anticorpi

13 Dal genoma al proteoma  4
Infine, molte analisi effettuate sia sugli acidi nucleici sia sulle proteine si basano sulla capacità di manipo-lare miliardi di molecole identiche La generazione di numerose copie di ogni gene è semplificata dalla capacità del gene di venire utilizzato come stampo per la propria amplificazione (PCR) Le proteine devono essere isolate chimicamente, in modo inefficiente e laborioso, a partire da un gran numero di cellule viventi Tuttavia… le potenzialità che derivano dalla cono-scenza del proteoma di un organismo sono enormi: Comprensione delle basi molecolari di alcune malattie Conversione di cellule in fabbriche molecolari Efficienza degli organismi geneticamente ingegnerizzati Progettazione di nuovi farmaci

14 Dal genoma al proteoma  5
Genoma vs Proteoma Il bruco e la farfalla sono organismi geneticamente identici, ma posseggono diverso proteoma e fenotipo, così come il girino e la rana!

15 Classificazione delle proteine
L’indicizzazione e la catalogazione dei dati proteomici sono compiti molto ardui, data la grande varietà di proteine differenti, utili alla cellula per svolgere i suoi compiti Diversi metodi sistemici proposti: il più antico, dovuto alla International Enzyme Commission, si basa sulle funzioni delle proteine ed assegna ogni proteina ad una delle sei differenti categorie che derivano dalle diverse “macrofunzioni” In alternativa, metodo di classificazione basato sulla storia evolutiva e le similarità strutturali, con circa mille famiglie di proteine omologhe

16 Nomenclatura degli enzimi  1
La rapida crescita, durante gli anni ‘50, del numero di enzimi conosciuti rese necessario stabilire delle con-venzioni riguardo alla loro nomenclatura Prima della fondazione della International Enzyme Commission (1955), non era infatti insolito che un singolo enzima fosse conosciuto con nomi diversi, né che lo stesso nome venisse assegnato ad enzimi dif-ferenti Inoltre, alcuni nomi non davano nessuna indicazione sulla natura delle reazioni chimiche catalizzate dal relativo enzima Nel 1965 fu suggerito un approccio sistematico per classificare gli enzimi in sei classi principali, sulla base delle tipologie generali delle reazioni catalizzate (http://www.chem.qmul.ac.uk/iubmb/enzyme/)

17 Nomenclatura degli enzimi  2
Attraverso l’utilizzo di un sistema di numerazione, ad ogni enzima viene assegnato un codice numerico, dove il primo numero si riferisce alla classe principale, il secondo ed il terzo numero corrispondono a specifiche sottoclassi ed il numero finale rappresenta il numero seriale dell’enzima nella sua sottoclasse

18 Nomenclatura degli enzimi  3
Esempi L’alcooldeidrogenasi è identificato come  classe principale: ossidoreduttasi, classe: attività sul gruppo CHOH del donatore; sottoclasse: con NAD o NADP (molecole che permettono l’ossidoriduzione) come accettore; è il primo dei 269 enzimi presenti in questa categoria L’RNApolimerasi DNAdipendente è identificato dal nu-mero  classe principale: transferasi; classe: trasferimento di gruppi contenti fosforo; sottoclasse: nucleotidiltransferasi; è il sesto dei 60 enzimi presenti in questa categoria

19 Nomenclatura degli enzimi  4

20 Famiglie e superfamiglie  1
La similarità di sequenza aminoacidica, tra le molte migliaia di proteine per cui essa è disponibile, sugge-risce che tutte le proteine esistenti ai giorni nostri possano derivare da circa mille proteine originarie Non è chiaro, tuttavia, se il ristretto numero di proteine esistenti sia dettato più da vincoli fisici sul ripiegamento della catena polipeptidica in una strut-tura tridimensionale o dalla sufficiente varietà di proprietà strutturali e chimiche che esse possiedono (che non ne ha rese necessarie altre nel corso del-l’evoluzione) o da una combinazione di entrambi i fattori

21 Famiglie e superfamiglie  2
Una delle argomentazioni più forti a favore dell’ipotesi evolutiva viene dallo studio pubblicato nel 1991 da Dorit et al., nel quale si teorizzava che gli esoni stessi corrispondano strettamente ai domini funzionali delle proteine e che tutte le proteine derivino dai vari ar-rangiamenti dei circa 7000 esoni disponibili Tuttavia, a prescindere dalle basi della similarità, i metodi di allineamento di sequenze e di ricerca di similarità in database sono spesso impiegati per sco-prire le possibili relazioni familiari fra proteine diverse Utili per predire la struttura proteica, che sembra sotto-stare a vincoli evolutivi più forti della sequenza amino-acidica

22 Famiglie e superfamiglie  3
Per definizione, le proteine che hanno un’identità di sequenza maggiore del 50% sono membri di un’unica famiglia Allo stesso modo, le superfamiglie sono gruppi di famiglie proteiche correlate tramite livelli di similarità di sequenza bassi, ma ancora rilevabili (30%)  hanno un’origine evolutiva comune, ma più antica Tutte le proteine possono essere ulteriormente suddi-vise in categorie sulla base delle caratteristiche predo-minanti di struttura secondaria: proteine di membrana, proteine principalmente , proteine principalmente , strutture  e  e strutture 

23 Famiglie e superfamiglie  4
Sono stati realizzati diversi database gerarchici che raggruppano le proteine secondo queste caratteristiche SCOP  Structural Classification Of Protein CATH  Class, Architecture, Topology and Homologous superfamily FSSP  Fold classification based on Structure-Structure alignment of Proteins

24 Ripiegamenti  1 Mentre le famiglie di proteine hanno relazioni evolutive chiare e le superfamiglie proteiche hanno relazioni evolutive probabili, si dice che le proteine presentano un ripiegamento comune se hanno la stessa struttura secondaria con lo stesso tipo di arrangiamento e con la stessa connessione topologica Proteine diverse con lo stesso ripiegamento spesso presentano elementi marginali di struttura secondaria e regioni a turn che differiscono in dimensione e con-formazione Il termine ripiegamento è utilizzato come sinonimo di motivo strutturale, anche se generalmente si riferisce a combinazioni più ampie di strutture secondarie  in qualche caso, un ripiegamento coinvolge metà della struttura totale della proteina

25 Ripiegamenti  2 Proteine che si trovano nella stessa categoria di ripiegamento possono anche non avere un’origine evo-lutiva comune, ma essere il risultato di un rimesco-lamento degli esoni, in cui proteine con nuove funzioni vengono create attraverso il processo di ricombina-zione di esoni corrispondenti a domini funzionali di geni esistenti a livello del DNA Alternativamente, le similarità strutturali possono nascere solamente da caratteristiche fisiche e chimiche delle proteine, che favoriscono certi arrangiamenti e certe topologie della catena

26 Tecniche sperimentali
Come nel caso dell’analisi genomica, molte analisi proteomiche sono limitate dalle tecniche sperimentali attualmente disponibili Sfortunatamente, dalla prospettiva della proteomica, la natura stessa delle proteine rende le analisi di laboratorio particolarmente difficili e molto meno pre-cise rispetto a quelle disponibili per l’analisi genomica Elettroforesi bidimensionale Spettrometria di massa Microarray proteici

27 Elettroforesi bidimensionale  1
L’elettroforesi bidimensionale è una tecnica che per-mette di separare le proteine in base al peso moleco-lare e alla carica Il procedimento utilizzato parte dall’estrazione delle proteine in un tessuto Le proteine, poste su un striscia di supporto polimerico a cui è applicata una corrente elettrica e in presenza di un gradiente di acidità, migrano in maniera a diversa a seconda della loro carica elettrica intrinseca, rag-giungendo il proprio punto isoelettrico e formando delle “bande” A questo punto il supporto viene posto sul margine di un gel per elettroforesi che consente la separazione delle proteine in base al peso molecolare in seguito all’applicazione della corrente elettrica

28 Elettroforesi bidimensionale  2
Il risultato finale è un gel in cui virtualmente ciascuna proteina occupa un punto nello spazio bidimensionale, ed è evidenziabile attraverso opportune colorazioni La tappa ultima consiste nell’isolamento dal gel di cia-scuna proteina per effettuare l’analisi che ne consenta l’identificazione L’analisi può essere fatta in maniera manuale, rita-gliando dei tondini di gel contenenti una sola proteina e quindi procedendo con la spettrografia di massa, o attraverso tecniche automatiche (più o meno evolute) di lettura diretta da gel

29 Elettroforesi bidimensionale  3
In pratica, si considera una cellula o un tessuto e, usando le tecniche indicate, si ottengono, con una sola analisi, infor-mazioni su tutte le proteine che compongono il campione Con l’elettroforesi bidimensio-nale si ottengono fotografie in cui ogni puntino rappresenta una proteina Confrontando fotografie otte-nute da campioni diversi si pos-sono individuare quali proteine differiscono per presenza e quantità in diverse condizioni sperimentali

30 Elettroforesi bidimensionale  4
L’elettroforesi bidimensionale ha in realtà diverse gravi limitazioni che ne impediscono l’utilizzo estensivo Il genoma umano codifica molte decine di migliaia di proteine Inadeguatezza per l’analisi delle proteine molto piccole o con poca carica elettrica e delle proteine che attraver-sano la membrana plasmatica (e che rivestono impor-tanti ruoli in molte malattie) a causa della loro scarsa solubilità nelle preparazioni e nei gel Sensibilità relativamente bassa dei metodi di rilevamento Difficoltà nel determinare con precisione quale proteina è rappresentata da ciascuno spot

31 Spettrometria di massa  1
Lo spettrometro è uno strumento che scompone lo spettro di una sorgente e ne misura le componenti Esistono spettrometri che misurano lo spettro della radiazione elettromagnetica e spettrometri che misu-rano lo spettro di massa di una sostanza, ossia le masse dei suoi costituenti (atomi, molecole, composti) In uno spettrometro di massa possono essere intro-dotti campioni allo stato solido, liquido o gassoso Le sostanze solide o liquide devono essere rese volatili prima di iniziare la fase di ionizzazione in cui la molecola del composto viene ionizzata, nel caso più comune per interazione con un fascio di elettroni

32 Spettrometria di massa  2
Lo ione molecolare carico positivamente si frammenta, con formazione di molecole e di ioni positivi (cationi) Solo questi ultimi sono rivelati dallo spettrometro e sono separati in funzione del loro rapporto massa/carica Infatti, i percorsi dei frammenti proteici (all’interno di un analizzatore) vengono fatti deviare da un campo magne-tico La collisione degli ioni carichi positivamente con un collettore posto all’estremità dell’analizzatore genera una corrente elettrica che può essere amplificata e rilevata come una serie di picchi corrispondenti ad un’impronta digitale della massa dei peptidi (mass fingerprint) In questo modo è possibile anche individuare l’esistenza di isotopi e determinarne la massa

33 Spettrometria di massa  3
Nel grafico di uno spettro di massa, l’asse delle x riporta i valori di rapporto massa/carica e l’asse delle y i valori di abbondanza relativa degli ioni analizzati Se la risoluzione dello strumento è sufficientemente elevata, è possibile determinare la massa esatta dei singoli ioni, da cui si può dedurre la composizione elementare dello ione stesso Lo spettrometro di massa può essere direttamente interfacciato ad un gascromatografo; miscele com-plesse di prodotti possono quindi essere risolte nei singoli componenti ed i singoli spettri possono essere interpretati o confrontati con librerie standard di spettri di composti noti

34 Microarray proteici  1 I microarray proteici si sono diffusi grazie alla possibilità di svolgere analisi di proteine su larga scala, nello stesso modo in cui i chip genetici hanno rivolu-zionato l’analisi del trascrittoma Il concetto alla base dei chip proteici è molto simile a quello dei chip genetici: piccole quantità di sonde individuali sono legate covalentemente alla superficie di chip di silicio in array ad alta densità Le proteine estratte dalle cellule vengono marcate con fluorofori e flussate sul chip Proprio come avviene con i chip genetici, la quantità di materiale (in questo caso, proteina) legato alle sonde viene determinato mediante eccitazione del fluoroforo

35 Microarray proteici  2 Per rilevare le interazioni proteinaproteina, protei-nacomposto, etc., si possono utilizzare anche array di sonde di cattura (per esempio anticorpi), che si legano alle proteine di un campione in modo tale da rilevarne i relativi livelli di espressione I microarray proteici non hanno lo stesso impatto dei chip genetici Diversamente dalle sequenze di DNA, con i loro legami unici dettati dall’accoppiamento fra basi, è ragionevole aspettarsi che una singola proteina possa interagire con più sonde differenti La cinetica di legame di ogni sonda può variare e differenze nell’in-tensità del segnale potrebbero essere dovute a differenze nell’intensità di legame Le proteine sono notoriamente sensibili alla chimica del loro ambiente ed alla superficie che esse incontrano, e sia gli estratti cellulari sia le sonde si possono comportare in modo inatteso quando vengono sottoposte alle procedure di controllo

36 Microarray proteici  3 Per il momento (ed in attesa di tecniche di analisi automatica attendibili) è più semplice utilizzare i chip genetici come base, per puntare verso lo studio delle proteine di interesse Una volta ristretto il campo, le analisi proteomiche su piccoli sottoinsiemi di proteine verranno effettuate su chip proteici realizzati appositamente

37 Progettazione di inibitori e di farmaci  1
Una delle principali applicazioni della bioinformatica è la ricerca di agenti farmaceutici efficaci per prevenire e curare malattie dell’uomo Lo sviluppo ed il test di un nuovo farmaco sono dispendiosi sia in termini di tempo  spesso occorrono fino a 15 anni , sia di denaro  con costi di centinaia di milioni di dollari La genomica funzionale, la bioinformatica e la proteo-mica promettono di ridurre il lavoro associato a questo processo, accelerando i tempi ed abbassando i costi di sviluppo di nuovi farmaci

38 Progettazione di inibitori e di farmaci  2
Mentre le fasi esatte dello sviluppo di un farmaco sono variabili, il procedimento complessivo si divide nei due passi fondamentali di scoperta e test Il processo di test, che coinvolge prove precliniche e cliniche, non è generalmente soggetto a miglioramenti significativi per l’utilizzo di metodi automatici Il processo di scoperta, che è invece laborioso e co-stoso ed offre un terreno fertile per la ricerca bioinfor-matica, può essere suddiviso in diverse fasi Identificazione del bersaglio Scoperta ed ottimizzazione di un composto “guida” Tossicologia e farmacocinetica (che studia quantitativa-mente l’assorbimento, la distribuzione, il metabolismo e l’eliminazione dei farmaci)

39 Progettazione di inibitori e di farmaci  3
L’obiettivo dell’identificazione del bersaglio consiste nell’isolare una molecola biologica che sia essenziale per la sopravvivenza o la proliferazione di un parti-colare agente causa di una malattia, detto patogeno Identificato il bersaglio, l’obiettivo della progettazione di farmaci (drug design) consiste nello sviluppo di una molecola che si leghi al bersaglio e lo inibisca Dato che la funzione del bersaglio è essenziale per il processo vitale del patogeno, l’inibizione del bersaglio ferma la proliferazione del patogeno o lo distrugge Comprendere la struttura e la funzione delle proteine è una componente fondamentale nello sviluppo di far-maci, in quanto le proteine sono comuni bersagli dei farmaci stessi

40 Progettazione di inibitori e di farmaci  4
Esempio La HIV proteasi è una proteina prodotta dal virus umano dell’immunodeficienza (HIV)  il patogeno che causa l’AIDS  nel contesto di una cellula umana ospite La HIV proteasi è essenziale per la proliferazione del virus: l’inibizione della proteina annienta l’efficacia del virus e la sua capacità di trasmissione

41 Progettazione di inibitori e di farmaci  5
Come potrebbe una molecola inibire l’azione di un enzima, quale la HIV proteasi? Le proteasi sono proteine che digeriscono altre proteine, come gli enzimi di restrizione utilizzati per tagliare in modo specifico la molecola di DNA Molte delle proteine di cui l’HIV ha bisogno per soprav-vivere e proliferare in un ospite umano vengono prodotte come una singola, lunga, catena polipeptidica Questo polipeptide deve poi essere tagliato nelle compo-nenti proteiche funzionali dalla HIV proteasi Come molti enzimi, la HIV proteasi possiede un sito attivo a cui si legano e su cui operano altre molecole Progettare una molecola che si leghi nel sito attivo della HIV proteasi, in modo da impedirne il normale funziona-mento

42 Screening di ligandi  1 Il primo passo verso la scoperta di un inibitore per una particolare proteina è di solito l’identificazione di uno o più composti guida, che si leghino al sito attivo della proteina bersaglio Tradizionalmente, la ricerca dei composti guida è sem-pre stata un processo trialanderror, durante il quale si testano diversi composti, fino a trovarne un numero sufficiente con effetti inibitori Recentemente, metodologie di screening ad alta pro-duttività (HTS, HighThroughput Screening) hanno reso la procedura molto più efficiente, anche se il processo sotteso resta comunque una ricerca esau-stiva del maggior numero di composti guida

43 Screening di ligandi  2 È noto da tempo che i siti attivi degli enzimi sono ospitati in tasche (cavità) ricavate nella struttura proteica, con specifiche caratteristiche chimicofisiche L’interazione proteinaligando è dettata principalmente dalle caratteristiche di complementarietà dei due com-posti: ligandi idrofobici legheranno regioni idrofobiche, ligandi carichi saranno richiamati da regioni cariche di segno opposto, etc. Gli algoritmi di docking di ligandi e quelli di screening tentano di rendere efficienti i processi di scoperta dei composti guida, muovendosi dal mondo della speri-mentazione in vitro a quello dei modelli astratti e del calcolo automatico

44 Docking di ligandi  1 Il docking è la simulazione in silicio dell’aggancio della proteina con un ligando, ovvero obiettivo del docking è determinare come possono interagire due molecole di struttura nota Geometria delle superfici Interazioni tra residui affini Campi di forza elettrostatici

45 Docking di ligandi  2 In molti casi, la struttura tridimensionale di una protei-na e del suo ligando sono note, ma la struttura del complesso che essi formano è sconosciuta Nella progettazione di farmaci, il docking molecolare viene impiegato per determinare come un particolare farmaco si lega ad un bersaglio o come due proteine interagiscano fra loro a formare un sito di legame Gli approcci di docking molecolare hanno molto in comune con gli algoritmi per il ripiegamento delle proteine Entrambe le problematiche implicano il calcolo dell’ener-gia di una particolare conformazione molecolare e la ricerca della conformazione che minimizza l’energia libera del sistema  Molti gradi di libertà: ricerche euristiche e soluzioni subottime

46 Docking di ligandi  3 Come nel ripiegamento proteico, vi sono due considerazioni principali di cui tenere conto all’atto della progettazione di un algoritmo di docking Formulare una funzione energia per valutare la qualità di un particolare complesso e successivamente utilizzare un algorit-mo per esplorare lo spazio di tutti i possibili modi e conforma-zioni di legame alla ricerca di una struttura con energia minima Gestire la flessibilità sia della proteina sia del ligando putativo L’approccio chiaveserratura assume una struttura proteica rigida a cui si aggancia un ligando con struttura flessibile (approccio computazionalmente vantaggioso) Il docking con adattamento indotto permette la flessibilità sia della proteina che del ligando Compromesso: assumere per la proteina una catena principale rigida, mentre si permette la flessibilità delle catene laterali vicino al sito di legame del ligando

47 Docking di ligandi  4

48 Docking di ligandi  5 AutoDock (http://autodock.scripps.edu/) è un metodo ben noto per il docking di ligandi rigidi o flessibili Per valutare un particolare complesso usa un campo di forza basato su una griglia Il campo di forza viene utilizzato per dare un punteggio al complesso in base alla formazione di interazioni elettrostatiche favorevoli, al numero di legami idrogeno, alle interazioni di van der Waals, etc.

49 Docking di ligandi  6 AutoDock utilizzava originariamente un approccio Monte Carlo/simulated annealing Si inducono cambiamenti casuali nella posizione e conforma-zione corrente del ligando, tenendo quelli che danno origine a conformazioni a più bassa energia rispetto a quella corrente (quando un cambiamento porta ad un aumento di energia, viene scartato) Tuttavia, per permettere all’algoritmo di trovare stati a bassa energia, superando eventuali barriere energetiche, i cambia-menti che portano ad energie più alte, talvolta, vengono ac-cettati (con una frequenza alta all’inizio del processo di ottimiz-zazione, che decresce lentamente per iterazioni successive) Le versioni più recenti utilizzano algoritmi genetici, programmi di ottimizzazione che emulano la dinamica della selezione naturale su una popolazione di soluzioni in competizione

50 Screening di database  1
Una delle considerazioni principali nel progettare algoritmi di docking è il bilanciamento tra la necessità di una completa ed accurata ricerca di tutte le possibili conformazioni e modalità di legame del ligando e la necessità di realizzare un algoritmo di complessità computazionale “ragionevole” Per lo screening di database di possibili farmaci, gli algoritmi devono infatti effettuare il docking di migliaia di ligandi al sito attivo di una proteina e, pertanto, hanno bisogno di un efficienza elevata

51 Screening di database  2
Metodi progettati specificamente per lo screening di database, come l’algoritmo SLIDE, spesso riducono il numero di composti considerati, utilizzando tecniche di indicizzazione del database per scartare, a priori, i composti guida che è altamente improbabile che leghino il sito attivo del bersaglio SLIDE caratterizza il sito attivo del bersaglio in accordo con la posizione di potenziali donatori ed accettori di legami idrogeno e con i punti di interazione idrofobica del ligando, formando un modello Ogni potenziale ligando nel database viene caratte-rizzato nello stesso modo e viene costruito un insieme di indici

52 Screening di database  3
L’operazione di indicizzazione permette a SLIDE di scartare rapidamente i ligandi che sono, per esempio, troppo grandi o troppo piccoli per adattarsi al modello Attraverso la riduzione del numero di ligandi che vengono sottoposti alla procedura di docking, compu-tazionalmente onerosa, SLIDE (e algoritmi simili) possono sondare grandi database di potenziali ligandi in giorni, o ore, rispetto a tempistiche di mesi

53 Screening di database  4

54 Strutture cristalline risolte ai raggi X  1
Anche la più potente tecnica microscopica è insufficiente per determinare le coordinate molecolari di ciascun atomo di una proteina La scoperta dei raggi X da parte di W. C. Roentgen (1895) ha invece permesso lo sviluppo di un potente strumento per l’analisi della struttura proteica: la cristallografia a raggi X Nel 1912, M. von Laue scoprì che i cristalli, strutture solide formate da un reticolo regolare di atomi o molecole, dif-frangono i raggi X in motivi (pattern) regolari e prevedibili All’inizio degli anni ‘50, scienziati pionieristici come D. Hodgkin furono in grado di cristallizzare alcune molecole organiche complesse e di determinare la loro struttura osservando come esse diffrangessero un fascio di raggi X Oggi, la cristallografia a raggi X è stata impiegata per determinare la struttura di circa proteine ad un alto livello di risoluzione

55 Strutture cristalline risolte ai raggi X  2
Source: PDB statistics

56 Strutture cristalline risolte ai raggi X  3
Il primo passo nella determinazione cristallografica della struttura di una proteina è la crescita del relativo cristallo La cristallizzazione è un processo molto delicato ed impegnativo, ma l’idea di base è semplice Proprio come i cristalli di zucchero possono essere fatti crescere attraverso la lenta evaporazione di una soluzione di zucchero ed acqua, i cristalli di proteine vengono fatti crescere attraverso l’evaporazione di una soluzione di proteina pura I cristalli delle proteine, però, sono generalmente molto piccoli (da circa 0.3mm ad 1.5mm in ogni dimensione) e sono fatti circa al 70% di acqua, con una consistenza più simile alla gelatina che ai cristalli di zucchero

57 Strutture cristalline risolte ai raggi X  4
La crescita dei cristalli di proteine generalmente richiede condizioni attentamente controllate ed una grande quantità di tempo: per raggiungere le opportune condi-zioni di cristallizzazione di una sin-gola proteina possono essere ne-cessari mesi o anche anni di esperimenti Una volta ottenuti, i cristalli proteici vengono caricati all’interno di un tubo capillare ed esposti ad un fascio di raggi X, che viene diffratto dal cristallo della proteina

58 Strutture cristalline risolte ai raggi X  5
Originariamente, il pattern di diffrazione veniva cattu-rato su una pellicola radio-grafica I moderni strumenti per la cristallografia utilizzano ri-levatori di raggi X che tra-sferiscono il pattern di dif-frazione direttamente su computer, per la successiva analisi Una volta ottenuti i dati di diffrazio-ne, si utilizzano metodi numerici e modelli proteici per determinare la struttura tridimensionale della pro-teina

59 Strutture cristalline risolte ai raggi X  6
Più in dettaglio… Dallo spettro di diffrazione dei raggi X dei cristalli, i cristallografi sono in grado di calcolare mappe di densità elettronica, le quali, in pratica, sono immagini delle molecole che formano il cristallo ingrandite circa cento milioni di volte Si esaminano le mappe di densità elettronica con la grafica computerizzata e se ne verifica l’accordo (fitting) con un modello molecolare Dopo le fasi di affinamento si riesce ad ottenere un mo-dello molecolare che ha un errore medio sulle coordinate di 0.30.5 Å e che permette un esame molto dettagliato della struttura tridimensionale delle proteine

60 Strutture cristalline risolte ai raggi X  7
Infine, si noti che la struttura cristallografica è essen-zialmente mediata su più copie di un singolo cristallo proteico e sul tempo durante il quale il cristallo è esposto ai raggi X Le proteine cristallizzate non sono completamente rigide e la mobilità di un atomo specifico in una proteina rende “confuso” il segnale cristallografico La posizione delle molecole di acqua nel cristallo (che spesso sono incluse nelle entry dei database proteici) è difficile da risolvere e provoca “rumore” Tuttavia, la cristallografia è attualmente il metodo principale per ottenere la visione della struttura tridimensionale delle proteine a risoluzione atomica

61 Strutture cristalline risolte ai raggi X  8
La Protein Data Bank (PDB, è la principale banca dati in cui sono depositate le strutture di proteine derivate dalla cristallografia a raggi X

62 Strutture NMR  1 La tecnica spettroscopica della risonanza magnetica nuclea-re fornisce un metodo alternativo per determinare la struttura delle macromolecole Alla base della tecnica NMR (Nuclear Magnetic Resonance) vi è il fatto che gli atomi di alcuni elementi  come l’idrogeno e gli isotopi radioattivi del carbonio e dell’azoto  vibrano, o risuonano, quando le molecole a cui appartengono sono immerse in un campo magnetico statico ed esposte ad un secondo campo magnetico oscillante I nuclei atomici tentano di allinearsi con il campo magnetico statico in maniera parallela o antiparallela e quando il campo magnetico oscillante fornisce loro un’energia pari alla differenza energetica fra i due stati, si verifica il fenomeno della risonanza, che può essere rilevata attraverso sensori esterni, come gli spettrometri NMR

63 Strutture NMR  2 Il comportamento di ogni atomo è influenzato princi-palmente dagli atomi vicini, posti cioè in residui adiacenti L’analisi e l’interpretazione dei dati richiede tecniche numeriche complesse e limita, di per sé, l’utilità del-l’approccio per ogni proteina o dominio proteico (un’unità globulare o fibrosa formata da catene poli-peptidiche ripiegate in più regioni compatte le quali costituiscono divisioni della struttura terziaria) più lungo di 200 aminoacidi I metodi NMR non presuppongono la cristallizzazione: sono molto vantaggiosi nel caso di proteine che non possono essere cristallizzate (specialmente proteine integrali di membrana)

64 Strutture NMR  3 Il risultato di un esperimento NMR è un insieme di vincoli sulle distanze interatomiche all’interno di una struttura macromolecolare Detti vincoli possono essere poi utilizzati, insieme alla sequenza proteica, per descrivere un modello della struttura tridimensionale della proteina Tuttavia, generalmente, più di un modello proteico può effettivamente soddisfare i vincoli ottenuti dalla tecni-ca NMR, perciò le strutture NMR solitamente conten-gono diversi modelli di una proteina, cioè diversi insiemi di coordinate, mentre le strutture cristallo-grafiche, solitamente, ne contengono solo uno La PDB contiene circa strutture di proteine derivate dalla NMR

65 Strutture NMR  4 Source: PDB statistics

66 PDB  1 Le strutture contenute nella PDB sono memorizzate in formato testo Una linea del file PDB contiene le coordinate (x,y,z) in angstrom (1010 m) di ogni atomo di una proteina (con altre informazioni utili) Si può inoltre ottenere un’immagine della struttura tridimensionale della proteina Ad ogni struttura nella banca dati PDB è assegnato un codice a quattro caratteri Esempio: 2APR contiene le coordinate molecolari della rizopuspepsina, una proteasi aspartica I file in formato PDB sono generalmente chiamati XXXX.pdb o pdbXXXX.ent, dove XXXX è il codice a quattro lettere della struttura

67 PDB  2

68 Rappresentazioni della struttura terziaria
Il metodo a cartoon evidenzia le regioni di struttura secondaria La rappresentazione della superficie mo-lecolare rivela la for-ma complessiva del-la proteina La rappresenta-zione filiforme e a ball and stick illu-stra le interazioni molecolari

69 Metodi empirici e tecniche predittive  1
Problema: realizzare un algoritmo che, data la struttura tridimensionale di una proteina, predica quali sono i residui che più probabilmente sono coinvolti in un’interazione proteinaproteina Importante perché molte proteine sono attive solo quando sono associate ad altre proteine in complessi multienzimatici Soluzione: dalle strutture presenti nel PDB, selezionare un insieme di strutture esempio che presentano due o più proteine che formano un complesso Vi saranno residui interfacciali, coinvolti nella superficie di contatto, e residui non interfacciali Per ogni residuo, occorre selezionare un insieme di feature da misurare e da usare per risolvere il problema di predizione

70 Metodi empirici e tecniche predittive  2
Possibili feature: Numero di residui in un intorno di raggio stabilito rispetto al residuo in esame Carica netta del residuo e dei residui vicini Livello di idrofobicità Potenziale dei legami idrogeno Costruzione di un vettore di feature descrittive del dato residuo In concomitanza con il vettore di feature, si ha il target che attesta l’appartenenza o meno del particolare residuo all’interfaccia proteinaproteina Utilizzo di un metodo di apprendimento automatico

71 Predizione delle modificazioni posttraduzionali
L’ampia varietà di strutture e funzioni proteiche è dovuta, in parte, al fatto che le proteine sono sotto-poste ad un’ampia varietà di modificazioni dopo essere state tradotte Rimozione di segmenti della proteina Formazione di legami covalenti alla superficie dei residui con zuccheri, fosfati o gruppi solfati Formazione di legami incrociati tra residui all’interno di una proteina (formazione di legami disolfuro) Molte di queste modificazioni sono effettuate da altre proteine, che devono riconoscere specifici residui superficiali, appropriati per innescare la modificazione Tecniche di predizione basate su reti neurali

72 Smistamento delle proteine  1
La presenza di compartimenti interni circondati da membra-ne è una caratteristica delle cellule eucariotiche L’ambiente chimico all’interno dei diversi compartimenti può differire notevolmente, come può essere molto diversa la loro popolazione proteica È un imperativo funzionale ed energetico che gli eucarioti trasportino le proteine nei loro compartimenti appropriati Per esempio, gli istoni  proteine legate al DNA associate con la cromatina  sono funzionalmente utili solo all’interno dei nuclei delle cellule eucariotiche, dove si trovano i cromosomi Altre proteine  come le proteasi, che si trovano dentro i perossisomi (comparti metabolici specializzati)  sarebbero addirittura pericolose per la cellula se si trovassero in qualsiasi altro posto al suo interno

73 Smistamento delle proteine  2
Sembra che le cellule eucariotiche considerino le proteine come appartenenti a due classi distinte in base alla loro localizzazione: proteine non associate/ associate alle membrane Il primo insieme di proteine è tradotto esclusivamente dai ribosomi, che si trovano sospesi, o “fluttuanti”, dentro al citoplasma

74 Smistamento delle proteine  3

75 Smistamento delle proteine  4
Gli mRNA tradotti dai ribosomi fluttuanti possono quindi rimanere nel citoplasma o essere trasportati: nel nucleo nei mitocondri nei cloroplasti nei perossisomi

76 Smistamento delle proteine  5
Risiedere dentro il citoplasma sembra essere lo stato di default per le proteine; al contrario il trasporto delle proteine nei diversi compartimenti separati da mem-brane richiede la presenza ed il riconoscimento di specifici segnali di localizzazione

77 Smistamento delle proteine  6
Le proteine nucleari sono destinate al nucleo grazie al fatto che possiedono una sequenza di localizzazione nucleare: una regione interna lunga da 7 a 41 ami-noacidi ricca di lisine e/o arginine Le proteine mitocondriali possiedono tutte un’elica anfipatica (che contiene sia un gruppo idrofilico sia uno idrofobico) lunga da 12 a 30 aminoacidi al loro Nterminale Questa sequenza segnale mitocondriale è riconosciuta da un recettore sulla superficie dei mitocondri e viene spesso rimossa per attivare la proteina appena viene trasportata all’interno dei mitocondri

78 Smistamento delle proteine  7
Le proteine dei cloroplasti, codificate da geni nucleari, possiedono una sequenza di transito al cloroplasto (circa 25 aminoacidi posti all’Nterminale) che viene similmente riconosciuta da recettori proteici posti sulla superficie dei cloroplasti Infine, le proteine destinate ai perossisomi possiedono uno dei due segnali di destinazione perossisomiale riconosciuti da recettori che assicurano il loro trasporto alla destinazione corretta

79 Smistamento delle proteine  8
Il secondo insieme di proteine è tradotto dai ribosomi legati alla membrana che sono associati con il reticolo endoplasmatico (ER, Endoplasmic Reticulum) Il reticolo endoplasmatico è una rete di membrane intimamente associata con l’apparato di Golgi dove avviene l’elaborazione ulteriore delle proteine (come la glicosilazione e l’acetilazione) Tutte le proteine tradotte dai ribosomi dell’ER, in realtà, iniziano ad essere tradotte dai ribosomi flut-tuanti nel citoplasma Quando i primi 1530 aminoacidi da tradurre corri-spondono ad una particolare sequenza segnale, una particella che la riconosce si lega alla proteina e ne ferma la traduzione finché il ribosoma ed il suo mRNA non vengono trasportati all’ER

80 Smistamento delle proteine  9
Anche se non è evidente nessuna particolare sequenza consenso per la sequenza segnale, quasi sempre si riscontra una sequenza idrofobica lunga 1015 residui che termina con uno o più aminoacidi con carica positiva Quando la traduzione riprende, il nuovo polipeptide viene estruso attraverso un poro della membrana dell’ER nel lumen (spazio interno) dello stesso ER Un peptidasi segnale taglia dalla proteina la sequenza target dell’Nterminale (a meno che non debba essere mantenuta permanentemente come una proteina legata alla membrana) Reti neurali:

81 Taglio proteolitico  1 Sia i procarioti che gli eucarioti possiedono numerosi enzimi responsabili del taglio e della degradazione delle proteine e dei peptidi Esistono molteplici esempi di taglio proteico Rimozione del residuo di metionina presente all’inizio di ogni polipeptide (poiché il codone d’inizio codifica anche per la metionina) Rimozione dei peptidi segnale

82 Taglio proteolitico  2 Qualche volta il segnale di taglio può essere corto quanto un singolo residuo La chimotripsina taglia i polipeptidi all’estremità Ctermi-nale dei voluminosi residui aromatici (contenenti un anello) come la fenilalanina La tripsina taglia il legame peptidico sul lato carbossilico dei residui di arginina e di lisina L’elastasi taglia il legame peptidico sul lato Cterminale di piccoli residui, come la glicina e l’alanina In molti casi, comunque, il motivo di sequenza è più lungo e più ambiguo Reti neurali: livello di accuratezza di predizione >98% (http://www.paproc.de)

83 Glicosilazione  1 La glicosilazione è il processo che lega permanente-mente un oligosaccaride (una breve catena di zucche-ri) alla catena laterale di un residuo sulla superficie proteica La presenza di residui glicosilati può avere un effetto significativo sul ripiegamento delle proteine, la loro localizzazione, l’attività biologica e l’interazione con altre proteine Negli eucarioti: Nglicosilazione Oglicosilazione

84 Glicosilazione  2 La Nglicosilazione è l’aggiunta di un oligosaccaride ad un residuo di asparagina durante la traduzione della proteina Il segnale principale che indica che un residuo di asparagina (Asn) deve essere glicosilato è la sequenza aminoacidica locale AsnXSer o AsnXThr, dove X corrisponde ad un qualsiasi residuo tranne la prolina Tuttavia, tale sequenza da sola non è sufficiente a determinare la glicosilazione (come si osserva in natura)

85 Glicosilazione  3 La Oglicosilazione è un processo posttraduzionale in cui l’enzima Nacetilglucosaminil transferasi attacca un oligosaccaride ad un atomo di ossigeno di un resi-duo di serina o di treonina Diversamente dalla Nglicosilazione, non si conoscono motivi di sequenza che segnalino un sito per la Oglicosilazione, ma solo la presenza di residui di prolina e valina vicino alla Ser o Thr che deve essere glicosilata Reti neurali: accuratezza del 75% per Nglicosilazione e superiore all’85% per Oglicosilazione

86 Fosforilazione  1 La fosforilazione (attacco di un gruppo fosfato) dei residui superficiali è probabilmente la modificazione posttraduzionale più comune nelle proteine animali Le chinasi, gli enzimi responsabili della fosforilazione, sono coinvolte in un’ampia varietà di percorsi regolatori e di trasmissione dei segnali Dato che la fosforilazione serve frequentemente come segnale di attivazione per un enzima, essa rappresenta spesso una condizione temporanea Le fosfatasi sono gli enzimi responsabili della rimozione dei gruppi fosfato dai residui fosforilati

87 Fosforilazione  2 Dato che la fosforilazione dei residui chiave di tirosina, serina e treonina serve come meccanismo regolatore in un’ampia varietà di processi molecolari, i vari tipi di chinasi coinvolte in ogni processo devono avere un’alta specificità nel riconoscimento di particolari enzimi Nessuna sequenza consenso singola identifica un residuo come un target della fosforilazione Reti neurali: accuratezza 70% (http://www.cbs.dtu.dk/services/NetPhos)

88 Concludendo…  1 Mentre la genomica sta rapidamente diventando un’area di ricerca molto sviluppata, le tecniche proteo-miche iniziano solo ora ad identificare le proteine codificate nel genoma e le loro varie interazioni La caratterizzazione del proteoma di un organismo promette di colmare il varco tra la nostra conoscenza del genoma e gli effetti fisiologici e morfologici dei geni che esso contiene Varie tassonomie sono state sviluppate per classificare ed organizzare le proteine secondo la funzione enzi-matica, la similarità della sequenza e la struttura tridimensionale

89 Concludendo…  2 Provvisti di database di famiglie, superfamiglie e ripie-gamenti proteici, insieme con tecniche sperimentali come l’elettroforesi bidimensionale e la spettrometria di massa, gli analisti sono in grado di separare, purificare ed identificare le varie proteine espresse da una cellula in un dato momento Un’importante applicazione delle informazioni proteo-miche è la progettazione di farmaci I progressi nella conoscenza della struttura delle proteine e nella cristallografia a raggi X hanno permesso la realizzazione di metodi automatici per lo screening ed il docking di ligandi proteici e per contribuire al processo di scoperta dei farmaci

90 Concludendo…  3 Anche se la struttura tridimensionale delle proteine è la chiave di volta per capirne la funzione e l’interazione con le altre proteine, alcune utili informazioni possono essere ottenute anche dalla sola sequenza La localizzazione delle proteine e le varie modificazioni posttraduzionali sono segnalate attraverso motivi di sequenza conservati nella struttura primaria delle proteine Le modificazioni posttraduzionali danno conto del fatto che lo stesso gene può codificare per più proteine


Scaricare ppt "Proteomica “La cosa più bella che possiamo sperimentare è il mistero; è la fonte di ogni vera arte e di ogni vera scienza.” (A. Einstein)"

Presentazioni simili


Annunci Google