Si tratta di un metodo di separazione e identificazione di proteine in un certo campione sfruttando due dimensioni orientate fra loro a 90°. Questo permette di avere a disposizione un’area ampia di separazione, aumentando la risoluzione. Questa tecnica è utilizzata in proteomica ed è il passo fondamentale per la separazione delle proteine che verranno poi caratterizzate ed identificate in spettrometria di massa.
Cosa intendiamo per proteomica? Identificazione, caratterizzazione e quantificazione di tutte le proteine presenti in una particolare via metabolica, in un organello, cellula, tessuto, organo o organismo che possono essere studiate in modo da fornire dati accurati e comprensibili del sistema studiato. The PROTEin complement of the genOME.
Definita anche come: “l’analisi dell’intero patrimonio proteico in una certa cellula, tessuto o organismo”. La proteomica inoltre “chiarisce le attività, modifiche, localizzazione e interazioni delle proteine nei vari sistemi.” Il proteoma di diversi organismi presenta differenze intrinseche alla specie in base a vari fattori quali la crescita
La proteomica si propone due scopi fondamentali: Identificazione su larga scala di tutte le proteine di un campione. Questo è tanto più semplice se l’organismo è sequenziato perché in questo modo le singole proteine sono identificate più rapidamente in spettrometria di massa. Il secondo utilizzo è l’espressione differenziale di proteine nel confronto fra due campioni (es: una proteina modificata in una patologia)
Il proteoma comprende tutte le proteine espresse nello stesso momento in una cellula allo stesso tempo, incluse tutte le isoforme e le modificazioni posttraduzionali*. Mentre il genoma è costante per una data cellula ed identico per tutte le cellule di un organismo, e non cambia molto all’interno della specie, il proteoma è molto dinamico nel tempo e in risposta a fattori esterni, e differisce in maniera sostanziale tra i diversi tipi cellulari. *Modificazioni post-traduzionali Acetilazione, metilazione Acetilazione, metilazione Fosforilazione Fosforilazione Glicosilazione (enzimatica) Glicosilazione (enzimatica) Glicazione (non enzimatica) Glicazione (non enzimatica) Cleavage Cleavage Protein splicing Protein splicing Tagging Tagging
L’elettroforesi bidimensionale (2-DE) è tradizionalmente uno dei migliori strumenti sperimentali per la separazione efficace di migliaia di proteine in un singolo gel. L’identificazione di proteine mediante spettrometria di massa è diventato uno strumento utilissimo nell’analisi delle proteine ed una tecnologia chiave nel campo emergente della proteomica. I ”Protein microarrays” forniscono rapidamente informazioni su un gran numero di interazioni molecolari proteina-proteina. Molti esperimenti di microarray sono accoppiati alla spettrometria di massa. TECNOLOGIE CORRELATE ALLA PROTEOMICA Elettroforesi bidimensionale (elettroforesi 2-DE) Elettroforesi bidimensionale (elettroforesi 2-DE) Visualizzazione degli spots proteici Visualizzazione degli spots proteici Analisi d’immagine Analisi d’immagine Prelievo degli spots proteici Prelievo degli spots proteici Digestione enzimatica delle proteine Digestione enzimatica delle proteine Spettrometria di massa Spettrometria di massa TECNOLOGIE CORRELATE ALLA PROTEOMICA Elettroforesi bidimensionale (elettroforesi 2-DE) Elettroforesi bidimensionale (elettroforesi 2-DE) Visualizzazione degli spots proteici Visualizzazione degli spots proteici Analisi d’immagine Analisi d’immagine Prelievo degli spots proteici Prelievo degli spots proteici Digestione enzimatica delle proteine Digestione enzimatica delle proteine Spettrometria di massa Spettrometria di massa
L’elettroforesi bidimensionale è un processo multi-step che porta alla separazione di centinaia-migliaia di proteine con alta risoluzione. Separa le proteine in base al loro pI in una dimensione utilizzando un gradiente immobilizzato di pH e poi nella seconda dimensione in base al peso molecolare
I due passi fondamentali sono quindi I. Focalizzazione isoelettrica(IEF) nella prima dimensione II. SDS-PAGE nella seconda dimensione L’intera procedura è nota come ISO-DALT: iso per isoelectric focusing e dalt per dalton weight
Vantaggi Possibilità di caricare campioni non purificati Risoluzione estremamente alta I gel 2 –DE sono collettori di frazioni proteiche molto efficienti Proteine sono protette all’interno della matrice del gel Svantaggi Gradiente di pH Limiti nel determinare proteine poco rappresentate Capacità di caricare campione Proteine idrofobiche Proteine ad alto peso molecolare
SVANTAGGI L’elevata precisione della tecnica porta a scarsa riproducibilità Sovrapposizione degli spots Lenta e noiosa Elevata possibilità di contaminazione PROGRESSI Analisi in spettrometria di massa Gel con gradienti di pH immobilizzati Procedure di riconoscimento più precise Computer software
1. Per una buona preparazione del campione le proteine devono essere completamente solubilizzate e denaturate con i seguenti accorgimenti Utilizzare tessuti e campioni freschi Non maneggiare troppo il campione e usare sempre i guanti Tenere in consderazione proprietà del campione quali elevata quantità di sali o lipidi Presenza di proteasi nel campione
Lavorare con le quantità corrette di campine senza spreco, specie se prezioso Possibilità di arricchimento di una frazione di organelli con centrifugazione Prefrazionamento proteico nel caso in cui nel campione ci sia un’elevata quantità di proteina che maschera le altre (es:. Albumina nel siero) Distruzione meccanica del tessuto Sonicazione Mortaio Omogeneizzazione
Quali sono i componenti del buffer di lisi ideale? Caotropo: urea e tiourea Riducente: DTT, Tris(2-carboxyethyl) phosphine (TCEP), tributyl phosphine (TBP) Detergente: CHAPS, triton x-100 Anfoliti Inibitori delle proteasi
Caotropo: Caotropo: Urea è il caotropo di prima scelta. Ha la funzione di distruggere I legami idrofobici e idrogeno senza alterare la carica della proteina. Riducente: Riducente: Allo scopo di denaturare le proteine è necessario rompere ogni legame S-S che esista fra parti diverse della proteina o leghi subunità diverse. DTT migra verso l’anodo durante l’IEF depauperando il terminale basico del gel. A.DTT B.TBP C.TCEP A.DTT B.TBP C.TCEP
Detergente: I detergenti aiutano a solubilizzare i lipidi, e delipidare leproteine legate a vescicole o membrane. Le interazioni idrofobiche possono giocare un ruolo importante nell’integrità strutturale della proteina e nelle interazioni fra proteine diverse e idetergenti sono l’ideale per spezzare queste interazioni. I detergeneti utilizzati non devono avere carica per l’IEF e quindi l’SDS è escluso assolutamente. Inibitori delle proteasi: le proteasi possono rappresentare un grave problema. Le proprietà denaturanti del buffer sono in genere sufficienti a inibire molte proteasi. In aggiunta si usa EDTA, chelante del calcio per le proteasi calcio-dipendenti e un cocktail (SIGMA).
Anfoliti: L’aggiunta di anfoliti al buffer di solubilizzazione (da 0.5% a 2%) ha lo scopo di migliorare la solubiltà delle proteine, sottrarre ioni cianato e facilitare la precipitazione degli acidi nucleici durante la centrifugazione. Sembra inoltre che inibiscano le interazioni fra proteine. La miscela di anfoliti utilizzata deve rispecchiare l’intervallo di pH del gel in corsa per l’IEF.
Prima di procedere al caricamento del campione bisogna conoscere la quantità di proteina presente, cioé dosare le proteine. Uno dei metodi più utilizzati è il Bradford. Questa tecnica ha dei limiti di risoluzione che sono: 1-20 µg (micro assay) µg (macro assay)
Il dosaggio permette di misurare la concentrazione di proteine in soluzione. Il metodo si basa sulla formazione di un complesso tra il colorante, Coomassie Brilliant Blue G-250 e l’Arg e i residui aromatici presenti delle proteine in soluzione. Il complesso proteina-colorante causa uno spostamento nel valore max di assorbimento del colorante da 465 a 595nm.
Vantaggi Veloce e relativamente poco costoso Veloce e relativamente poco costoso Molto sensibile Molto sensibile Compatibile con un ampio spettro di sostanze Compatibile con un ampio spettro di sostanze Il complesso è stabile per circa 1 ora Il complesso è stabile per circa 1 ora Svantaggi *Curva di titolazione non- lineare su intervalli ampi *Curva di titolazione non- lineare su intervalli ampi Risposta a diverse proteine variabile, per cui la scelta dello standard è molto importante Risposta a diverse proteine variabile, per cui la scelta dello standard è molto importante
IEF è un metodo elettroforetico che separa le proteine sulla base del loro punto isoelettrico (pI). Le proteine sono molecole anfoteriche che portano sia cariche positive che negative o carica netta zero, in base al valore di pH a cui si trovano. La carica netta di una proteina è la somma di tutte le cariche positive e negative di tutti i suoi aa. Il pI è il valore di pH a cui la carica netta della proteina è ZERO. Le proteine sono cariche positivamente a pH inferiori al pI e sono cariche negativamente a pH superiori al pI
IEF strips: IEF strips: Sono molecole con una struttura chimica simile a quella dell’acrilamide che gli permette di polimerizzare e quindi fissarsi alla matrice gelatinosa creando un gradiente di pH immobilizzato (IPG). Esistono in commercio gel di immobiline che coprono svariati range di pH. I gel sono venduti disidratati e congelati a –20°C. Range di pH: L. e NL., 4- 7, 6- 11; , 4- 5, , 5- Dimensioni: 7, 11, 18, 24 cm I gradienti espansi e le dimensioni delle strisce di immobiline producono una migliore risoluzione del campione da analizzare. La scelta iniziale deve però cadere sul tipo di intervallo più ampio e solo in seguito scegliere intervalli più stretti.
Positive (anode) electrode area Negative (cathode) electrode area Control panel Five strip holder lengths are available— 7,11,13, 18, and 24 cm—one for each IPG strip length.
basic end of the strip acidic end of the strip
Il tempo minimo di focalizzazione deve essere determinato empiricamente in quanto dipendente da vari fattori come: Il campione Il campione Composizione della soluzione di reidratazione Composizione della soluzione di reidratazione Lunghezza delle strisce Lunghezza delle strisce Tipo di gradiente Tipo di gradiente
Un tipico protocollo per la prima dimensione potrebbe essere il seguente: Reidratazione:1 hr a 20˚C Corrente max per strip50 µA
SDS-PAGE (SDS-polyacrylamide gel electrophoresis) consente la separazione delle proteine sulla base del peso mplecolare. I polipeptidi migrano in presenza di un campo elettrico su un supporto di acrilamide e sono separati in base alla loro mobilità relativa (Mr) che in questo caso è dipendente dal peso molecolare. Affinché la separazione tenga conto solo delle dimensioni della proteina bisogna che le proteine abbiano tutte la stessa carica e forma devono cioè essere completamente denaturate. A questo scopo si usa sodio dodecil solfato SDS*. Detergente anionico forte che solubilizza quasi tutte le proteine denaturandole Fornisce alle proteine una carica netta costante per unità di massa pari a 1.4 g SDS / 1 g proteina. "Maschera" la carica apportata dagli aminoacidi della proteina. Rompe i legami idrogeno e le interazioni idrofobiche distruggendo le strutture secondarie e terziarie Può essere aggiunto alla soluzione di polimerizzazione.
Va notato che oltre a SDS viene aggiunto alla soluzione anche un agente riducente come il dithiotreitolo (DTT) con lo scopo di rompere tutti I legami S-S presenti nelle proteine. Inoltre prima di procedere alla seconda dimensione le strip devono essere riequilibrate in DTT e iodoacetamide.
L A REAZIONE PROCEDE CON LA FORMAZIONE DI RADICALI LIBERI E QUINDI È DI FONDAMENTALE IMPORTANZA NON OSSIGENARE LA SOLUZIONE ESSENDO L ’ OSSIGENO ALTAMENTE REATTIVO CON I RADICALI LIBERI
Le dimensioni delle maglie può essere perfettamente controllata conoscendo la concentrazione totale di acrilamide (T) e la concentrazione del cross-legante (C) espressi come percentuale. Mantenendo costante C e cambiando la concentrazione di T, cambiamo in maniera inversa le dimensione dei pori. Gel con pori di dimensioni ridotte (alta % T) Sono restrittivi per le proteine di grande dimensione, a tal punto che alcune di esse possono anche non entrare nel gel. Migliorano la separazione delle proteine a basso peso molecolare Gel con pori di grandi dimensioni (bassa % T) Sono meno restrittivi per le proteine di grande dimensione, e ne migliorano la separazione. Proteine a basso peso molecolare migrano con il fronte del gel e non si separano Gel con pori di dimensioni ridotte (alta % T) Sono restrittivi per le proteine di grande dimensione, a tal punto che alcune di esse possono anche non entrare nel gel. Migliorano la separazione delle proteine a basso peso molecolare Gel con pori di grandi dimensioni (bassa % T) Sono meno restrittivi per le proteine di grande dimensione, e ne migliorano la separazione. Proteine a basso peso molecolare migrano con il fronte del gel e non si separano
Per la separazione di campioni complessi è vantaggioso utilizzare gradienti: Aumenta l l’intervallo di separazione dei MW Separa sia proteine ad alto che a basso peso molecolare
Vediamo quali sono le componenti principali del buffer di equilibrazione prima della corsa: Soluzione base (50 mM Tris-HCl, pH 8.8) mantiene le strip in un intervallo di pH appropriato per l’elettroforesi Urea (6 M) insieme al glicerolo aumenta la viscosità del buffer. Si riduce così un fenomeneo detto elettroendosmosi dovuto alla presenza di cariche fisse sulle strips che potrebbero interferire con il passaggio di proteine dalla strip al gel. Sodium dodecyl sulfate (SDS) denatura le proteine e conferisce carica negativa ai complessi SDS-proteina
DTT mantiene lo stato completamente ridotto delle proteine denaturate Iodoacetamide alchila i gruppi tiolici sulle proteine impedendo la riossidazione durante l’elettroforesi che può dare effetti di strisciamento sul gel. Colorante tracciante (BBF) monitora il fronte della corsa elettroforetica. Carico negativamente e di piccole dimensioni
La maggior parte dei metodi utilizzati per la detection dei gel monodimensionali vale anche per i gel bidimensionali Le caratteristiche richieste sono: elevata sensibilità elevato range di sensibilità compatibilità con la spettrometria di massa bassa tossicità “ecologico”
1. Coomassie staining da 50- a 100-volte meno sensbile della colorazine argento ma relativamente semplice e più quantitativo. Il blu di Coomassie è migliore per la spettrometria di massa perché la colorazione argentica è incompatibile. 2. Silver staining è il metodo non-radioattivo più sensibile (sotto 1 ng). Si tratta però di un processo multi-step complesso che ha alcuni passaggi critici. 3. Fluorescent staining SYPRO™ ha una sensibiltà intermeia fra le due colorazioni precedenti. Richiede l’utilizzo di uno scanner per fluorescenza ed è compatibile con la spettrometria di massa.
2DE map of human liver
Abbiamo visto come arrivare fino a qui ??
Scanning del gel Image processing Riconoscimento e quantificazione degli spot Matching* fra i diversi gel e analisi dati Creazione di database 2DE *Analisi comparativa della variazione di espressione dei diversi spot
Cosa intendiamo esattamente per analisi dei dati? Determinazione qualitativa la normalizzazione dell’intensità dei singoli spot è basata sull’intensità media dell’immagine del gel Determinazione quantitativa determinazione delle variazioni quantitative dell’espressione delle diverse proteine
Spot removal: è importantissimo prima di fare qualunque altra cosa essere sicuri che il gel da cui si tagliano gli spot sia stato ben ripulito da tutti i solventi che possono inficiare l’analisi in spettrometria.
L’identificazione in MS delle proteine può essere effettuata con: Peptide mass fingerprinting (Maldi MS) Identificazione basata sulla sequenza (MS/MS) Identificazione e quantificazione in MS Marcatura dei campioni (e.g. ICAT, iTRAQ) for Identificazione delle modifiche posttraduzionali
Digestione delle proteine Tipicamente si utilizza tripsina che taglia al C- terminale di Arg e Lys Analisi dei peptidi Massa totale di un peptide Frammentazione dei peptidi (massa dei singoli aa)
Modificazione dei residui di Cys: il motivo per cui si tiene conto di questo è che le Cys devono essere uniformi e devono essere note le masse molecolari. L’analisi in MS si basa su un’accurata determinazione della massa e se non si conosce la massa esatta delle Cys del peptide analizzato non si può predire accuratamente la massa dei peptidi che contengono residui di Cys.
Prima di tutto il gel deve essere asciugato per eliminare acqua, buffer etc. Dapprima si usa un solvente e poi si procede ad una completa deidratazione in SpeedVac Il motivo per cui il gel deve essere asciutto è di assicurare che la tripsina possa diffondere nel gel per la digestione delle proteine Va tenuto presente che l’aggiunta di troppe proteasi può peggiorare il risultato perché questo si traduce in un aumento di proteine del campione. Le proteasi non si limitano a digerire le proteine del campione ma possono autodigerirsi producendo frammenti noti con il nome di prodotti di autolisi
La spettrometria di massa misura la massa molecolare di un campione. Per campioni di grosse dimensioni comele biomolecole, i pesi molecolari possono essere misurati con un’accuratezza dello 0.01% (un errore di 4 Daltons per un campione di Daltons). Questo è sufficiente per evidenziare anche minime variazioni di massa dovute ad esempio ad una modifica post-traduzionale o alla sostituzione di un aa.
Gli spettrometri di massa comprendono tre parti fondamentali: sorgente di ionizzazione (MALDI, ESI) analizzatore detector
Il principio di base è che il campione deve ssere ionizzato perché gli ioni sono entità più facili da manipolare che le molecole neutre (ad esempio sono sensibili ad un campo elettrico). Questi ioni sono guidati verso l’analizzatore dello spettrometro dove sono separati in base al rapporto massa (m)-carica (z) (m/z). Gli ioni separati sono riconosciuti e il segnale è inviato ad un sistema automatizzato di analisi che raggruppa i rapporti m/z e ne calcola l’abbondanza relativa per formare uno spettro m/z.
L’analizzatore e il detector sono mantenuti sotto vuoto e spesso anche la fonte di ionizzazione in modo che gli ioni abbiano un’elevata probabilità di muoversi senza interagire con le molecole d’aria.
Si tratta di una tecnica di largo impiego per l’analisi di proteine, peptidi, glicoproteine, oligosaccaridi e oligonucleotidi. Si basa sul bombardamento di un campione con una luce laser che determina ionizzazione del campione. Il campione viene precedentemente mescolato con una matrice caratterizzata da elevato assorbimento che garantisce risultati più affidabili. La matrice trasforma l’energia de laser in energia di eccitazione per il campione che determina il distacco di molecole di campione e matrice dalla superficie.
La matrice che viene utilizzata ha due funzioni fondamentali: Assorbe energia fotonica dal raggio laser e la trasferisce sotto forma di energia di eccitamento per il sistema Serve come solvente per il campione da analizzare in modo che le forze intermolecolari siano ridotte e l’aggregazione fra le molecole di campione sia ridotta al minimo.
Le carattristiche della matrice ideale sono: Elevata proprietà di assorbimento alla lunghezza d’onda del laser Elevata capacità di co-cristallizzare con il campione Solubile nei solventi in cui è disciolto il campione Una bassa temperatura di sublimazione (da solido a gas) che facilita il deadsorbimento dei complessi matrice-campione durante l’illuminazione con il laser. Essere stabile in vuoto
MALDI di mioglobina tripsinizzata: esempio di spettro
Quando si è ottenuta la lista dei picchi è possibile interrogare i vari database per identificare le proteine. La prima cosa da decidere è quale motore di ricerca utilizzare: MS-Fit MS-Fit Mascot Mascot Peptident Peptident Profound Profound sono solo alcuni. L’identificazione si basa sul riconoscimento per peptide mass fingerprint (PMF).
Cosa intendiamo per PMF? PMF di una proteina è l’impronta digitale vera e propria di una proteina che viene frammentata da una proteasi nota (tripsina) in piccoli peptidi la cui massa viene misurata in MALDI o con un altro spettrometro. Lo spettro di peptidi ottenuti è unico per ogni proteina.
Trypsin, that is unmodified trypsin, cuts directly downstream of the two basic amino acids lysine (K) and arginine (R), which are fairly common residues. As different proteases cleave at different amino acid residues the PMF of the protein will depend on the protease used, but will always be the same for each one. This means that as long as the digestion in complete, that is the molecule is cleaved at all the possible sites it will produce a set of peptides, of varying masses, that are characteristic of that protein. The mass of each peptide will be the sum of the amino acids present including any modifications that those amino acids might have undergone.
L’uso di PMF per identificare le proteine non è sempre possibile perché tale sistema si basa sulla capacità di trovare dati già presenti nei vari database
Se non esiste alcun materiale disponibile PMF non porta a risultati e, a meno che la proteina non sia altamente conservata rispetto a quella di altre specie per cui esistono informazioni, non si arriva a nessun risultato. Quindi in poche parole NESSUNA SEQUENZA NEI DATABASE, NESSUNA IDENTIFICAZIONE.
Protease used: The next thing they all ask you is what enzyme you used, which is fairly straightforward. You will also probably be asked to give a maximum number for missed cleavages. Missed cleavaged occur when the protein is not digested to completion. Databases to search: Some search engines will ask you for the species that the sample came from and often they give a list of the various organisms that have substantial database entries Cysteine modification: As we mentioned earlier any modifications to the cysteine residues will have a profound effect on the mass of cysteine bearing peptides. In this window you will be asked for any modifications Masses: Obviously they all have a window where you put your list of monoisotopic masses. Searching: So now you’ve pressed start and the search engine has gone off to find a match for your PMF fingerprint. What it is doing now is going through the databases you have selected, theoretically digesting every protein within the search parameters that you set, and recording those that match your set of theoretical peptides most closely.
Strategy of protein identification