La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Basi molecolari dell’attività biologica delle proteine:

Presentazioni simili


Presentazione sul tema: "Basi molecolari dell’attività biologica delle proteine:"— Transcript della presentazione:

1 Basi molecolari dell’attività biologica delle proteine:
Dottorato di ricerca in Biologia Computazionale (XVI ciclo) Dott.ssa Costantini Susan Basi molecolari dell’attività biologica delle proteine: l’approccio computazionale e bioinformatico alla comprensione della relazione Struttura-Funzione 20 dicembre 2004

2 Sequenza – Struttura - Funzione
Strutture-proteine Genoma MYSFPNSFRFGWSQAGFQSEMGTPGSEDPNTDWYKWVHDPENMAAGLVSGDLPENGPGYWGNYKTFHDNAQKMGLKIARLNVEWSRIFPNPLPRPQNFDESKQDVTEVEINENELKRLDEYANKDALNHYREIFKDLKSRGLYFILNMYHWPLPLWLHDPIRVRRGDFTGPSGWLSTRTVYEFARFSAYIAWKFDDLVDEYSTMNEPNVVGGLGYVGVKSGFPPGYLSFELSRRHMYNIIQAHARAYDGIKSVSKKPVGIIYANSSFQPLTDKDMEAVEMAENDNRWWFFDAIIRGEITRGNEKIVRDDLKGRLDWIGVNYYTRTVVKRTEKGYVSLGGYGHGCERNSVSLAGLPTSDFGWEFFPEGLYDVLTKYWNRYHLYMYVTENGIADDADYQRPY YLVSHVYQVHRAINSGADVRGYLHWSLADNYEWASGFSMRFGLLKVDYNTKRLYWRPSALVYREIATNGAITDEIEHLNSVPPVKPLRH Sequenze-proteine Funzioni Meccanismo d’azione Specificità per ligandi Interazioni proteina-proteina 20 dicembre 2004

3 Struttura tridimensionale delle proteine
Metodi Sperimentali Diffrazione ai Raggi X (RX) Risonanza Magnetica Nucleare (NMR) Metodi Computazionali Riconoscimento di fold Folding ab-initio Modellamento Comparativo Modellamento Comparativo 20 dicembre 2004

4 Modellamento Comparativo
Permette di costruire il modello 3D di una proteina (‘target’) a partire da proteine omologhe (‘template’), la cui struttura è stata caratterizzata sperimentalmente. La percentuale di identità di sequenza tra la proteina target e quelle template deve essere superiore al 20-40%. Alta identità di sequenza buon allineamento delle sequenze buoni modelli ottenuti per omologia 20 dicembre 2004

5 Modellamento Comparativo
Il modellamento per omologia richiede l’utilizzo di numerosi strumenti bioinformatici e computazionali: - per l’estrazione di informazioni da banche dati di sequenze (UNIPROT) e di strutture tridimensionali (PDB) - per il confronto e l’allineamento delle sequenze (BLAST e CLUSTAL) - per la costruzione dei modelli strutturali per la proteina in esame (MODELER,QUANTA, INSIGHT) - per la valutazione della loro qualità (PROCHECK e PROSA). 20 dicembre 2004

6 Modellamento comparativo
TARGET: AQYSKRREVQCSVTDSEKRSLVLVPNSMELHAVM…… PROTEINA TARGET BLAST TEMPLATE: VPIRQLHYRLRDEQQKSLVLSDPYELKALHLNGQN… RICERCA DEL TEMPLATE CLUSTALW ALLINEAMENTO MULTIPLO TARGET-TEMPLATE MODELLER MODELLO DELLA PROTEINA TARGET A PARTIRE DALLA STRUTTURA TEMPLATE PROCHECK VALUTAZIONE DEL MODELLO 20 dicembre 2004

7 Scopo della tesi Applicazioni di metodi computazionali, già noti, per studiare le proprietà strutturali e funzionali delle proteine. Sviluppo di nuovi strumenti di analisi e predizione, al fine di migliorare quelli già esistenti. 20 dicembre 2004

8 Applicazioni dei metodi computazionali
1. Modellamento di complessi tra interleuchine-1b ed i loro recettori. 2. Studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca. 3. Simulazioni, mediante l’utilizzo del modellamento comparativo, dei cambiamenti conformazionali che si verificano quando le proteine interagiscono tra loro. 20 dicembre 2004

9 1. Modellamento di complessi tra interleuchine-1b ed i loro recettori
Interleuchina-1 (IL-1) è un mediatore della risposta immunitaria IL IL-1a , IL-1b, IL-1ra L’attività biologica di IL-1 conseguenza del “binding” con il proprio recettore formazione del complesso IL-1/IL-1R. Esistono due recettori: IL-1RI e IL-1RII 20 dicembre 2004

10 Simulazione del complesso IL-1b (trota)/IL-1RI (topo)
1. Modellamento di complessi tra interleuchine-1b ed i loro recettori Predizione della struttura tridimensionale - di IL-1b di spigola e di trota - dei recettori di tipo I (IL-1RI) di trota e topo. Simulazione dei complessi IL-1b/IL-1RI in trota e topo. Simulazione del complesso IL-1b (trota)/IL-1RI (topo) al fine di dare una interpretazione a livello molecolare dei dati sperimentali circa l’attività biologica di rIL-1b di trota. 20 dicembre 2004

11 IL-1b di spigola e trota Ricerca dei template con BLAST: IL-1b umana [PDB: 1IOB] IL-1b topo [PDB: 2MIB] IL-1b uomo topo trota spigola 100 78 (86) 34 (49) 37 (51) 36 (49) 32 (50) 54 (71) In tabella sono riportate le % di identità di sequenza e tra parentesi le similarità. 20 dicembre 2004

12 IL-1b di spigola IL-1b di trota
N-end C-end b-bulge loop IL-1b di spigola N-end C-end b-bulge loop IL-1b di trota PDB: 1K5L PDB: 1OOX Entrambi sono caratterizzati da una piccola a-elica (5% della sequenza) e da 12 b-strand antiparalleli (40% della sequenza), definendo la struttura come “mainly-beta” con topologia di tipo b-trefoil, in accordo con la classificazione di CATH e SCOP. 20 dicembre 2004

13 IL-1RI di topo e trota Ricerca del template con BLAST: IL-1RI umano [catena B in ITB dove è presente il complesso umano] IL-1RI uomo topo trota 100 64 (81) 22 (40) 20 (39) In tabella sono riportate le % di identità di sequenza e tra parentesi le similarità. 20 dicembre 2004

14 a IL-1RI di trota b IL-1b/IL-1RI trota
C-end N-end Dominio III Dominio II Dominio I a IL-1RI di trota PDB: 1OU1 b IL-1b IL-1RI IL-1b/IL-1RI trota ……anche per topo: è stato simulato il complesso utilizzando IL-1b caratterizzato ai RX [PDB: 2MIB] ed IL-1RI modellato per omologia [PDB: 1OU3]. 20 dicembre 2004

15 Ciò rende rIL-1b di trota meno affine al recettore (IL-1RI) di topo.
Da dati bibliografici …… IL-1b di trota è stata prodotta come proteina ricombinante in Escherichia coli. Test di attività biologica: rIL-1b è risultata capace di aumentare la proliferazione cellulare nelle cellule murine D10.G4.1. Lo stesso livello di proliferazione è stato indotto da rIL-1b umana utilizzandone una quantità 1000 volte più bassa di quella necessaria per rIL-1b di trota. Questo fatto può essere una conseguenza delle differenze strutturali tra IL-1 nei mammiferi e nei pesci. Ciò rende rIL-1b di trota meno affine al recettore (IL-1RI) di topo. Obiettivo: comprensione a livello molecolare del fenomeno biologico. 20 dicembre 2004

16 Complesso IL-1b trota/IL-1RI topo
Complessi Van der Waals Elettrostatico Energia totale IL-1b (trota) / IL-1RI (trota) IL-1b (topo) /IL-1RI (topo) IL-1b (trota) / IL-1RI (topo) IL-1b (trota) / IL-1RI (topo) * Le Energie sono espresse in Kcal/mol 20 dicembre 2004

17 % esposizione con IL-1R di trota % esposizione con IL-1R di topo
Esposizione al solvente degli AA dell’IL-1b di trota nei due complessi AA Posizione % esposizione con IL-1R di trota % esposizione con IL-1R di topo Differenze ALA 153 36,5 93,3 -56,8 SER 6 7,2 47,7 -40,5 GLU 11 6,9 37,8 -30,9 THR 117 41,6 69,8 -28,2 MET 138 14,8 42,4 -27,6 5 6,2 33,7 -27,5 91 68 91,8 -23,8 GLY 39 64,3 87,6 -23,3 ..... .... ... .. ASP 141 27,2 10,9 16,3 61 39,7 23,3 16,4 PRO 55 82,9 65,4 17,5 ASN 166 50,8 19 ILE 58 23,7 3,5 20,2 86 31,5 11,3 60 38,6 15,7 22,9 25 25,4 0,9 24,5 26 62,4 29,6 32,8 20 dicembre 2004

18 - Risultati - L’energia di interazione nell’eterocomplesso tra IL-1b (trota) e IL-1RI (topo) è risultata più alta di quella nell’omocomplesso, indicando che il legame tra IL-1b di trota ed IL-1RI di topo è molto debole. Le interazioni elettrostatiche sono risultate molto ridotte nell’eterocomplesso e questa è probabilmente una conseguenza delle differenze amminoacidiche, che provocano una perdita di catene laterali cariche e, quindi, di ponti salini. Misurando l’esposizione al solvente degli amminoacidi di IL-1b di trota nell’omocomplesso e nell’eterocomplesso, abbiamo anche verificato come alcuni residui hanno valori completamente differenti una diversa capacità dell’IL-1b di trota di legarsi ai due recettori, in accordo con quanto riportato in letteratura. Scapigliati G, Costantini S, Colonna G, Facchiano A, Buonocore F, Bossù P, Cunningham C, Holland JW and Secombes CJ. (2004) Modelling of fish interleukin-1 and its receptor. Dev. Comp. Immunol. 28, 20 dicembre 2004

19 2. Studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca
La celiachia si manifesta, in individui geneticamente predisposti, in seguito ad ingestione di gliadina, il maggiore costituente del glutine del grano. Essa è associata ai geni dell’HLA codificanti per gli eterodimeri DQ2 e DQ8, che sono esposti sulla superficie delle cellule APC (Cellule Presentanti l’Antigene). Queste molecole legano in modo non covalente i peptidi di gliadina ( ) e li espongono al riconoscimento dei linfociti T (CD4+). 20 dicembre 2004

20 Un peptide antigenico (peptide di gliadina) si lega in modo più efficace alle molecole DQ2 o DQ8 quando possiede dei residui amminocidici con carica negativa in determinate posizioni di ancoraggio. Recettore Cellule T Peptide Sollid LM Ann Rev Immunol 2000: 53-81 DQ2 I peptidi di gliadina non hanno molti amminoacidi carichi negativamente. Ma se sono sottoposti a reazioni di deammidazione o nell’ambiente acido dello stomaco o ad opera della transglutaminasi tissutale, alcuni residui di glutammina sono convertiti in acido glutammico. 20 dicembre 2004

21 2. Studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca
Modellamento per omologia della struttura 3D del dimero DQ2, presente in individui celiaci. Simulazione del complesso con vari peptidi di glutine per investigare le basi molecolari di questa interazione. Simulazione degli effetti della deammidazione di residui di glutammina nelle posizioni di ancoraggio e di altre modifiche al fine di dare una spiegazione a livello molecolare di risultati sperimentali relativi all’affinità di questi peptidi per il dimero DQ2. 20 dicembre 2004

22 Dimero DQ2 Le sequenze delle due catene del DQ2 sono state modellate per omologia utilizzando come riferimento quelle del dimero DQ8 (percentuale di identità di sequenza del 91%). Domini C-terminali Dominio N-terminale – catena a Sito di legame Dominio N-terminale – catena b PDB: 1NBN 20 dicembre 2004

23 Peptidi di glutine usati nelle simulazioni
P P9 | | Peptide PDB LVEALYLVCGERGG Alfa-I QLQPFPQPQLPY Alfa-II PQPQLPYPQPQ Alfa-III PYPQPQLPY Glia-a FRPQQPYPQ Glia-g PYPQQPQQP Gamma-I PQQPQQSFPQQQRP Gamma-II IIQPQQPAQ Gamma-III FPQQPQQPYPQQP Gamma-IV FSQPQQQFPQPQ Glt PFSQQQQSPF Glt PFSQQQQPV I residui di glutammina che vengono deammidati sono riportati in rosso. Le sequenze dei peptidi di glutine usati nelle simulazioni sono allineate a quella del peptide di insulina presente nel modello del DQ8 usato come riferimento (template) [PDB: 1JK8]. 20 dicembre 2004

24 Energie di interazione tra il dimero DQ2 ed i peptidi di glutine
Alfa-I Alfa-II Alfa-III Glia-a20 Glia-g2 Gamma-I Gamma-II Gamma-III Glt-156 Gamma-IV Glt-17 Alfa-I P6 Energie di interazione tra il dimero DQ2 ed i peptidi di glutine Alfa-II P4 Q P P7 P9 Q Q Q Gamma-I Le barre rappresentano la differenza di energia di interazione tra il peptide naturale e quelli modificati. 20 dicembre 2004

25 Dettaglio della superficie del sito di legame del dimero DQ2 con il peptide alfa II.
Region N-terminale del peptide Regione C-terminale del peptide Posizione P4 Posizione P7 Lys b71 20 dicembre 2004

26 - Risultati (1) - La deammidazione dei peptidi nelle posizioni p4, p6 e p7 rende i complessi più stabili. La presenza di una carica positiva (Lys) in p6 e p7 nei peptidi riduce la loro affinità per il dimero. I nostri risultati confermano in gran parte i dati sperimentali riportati in letteratura. I nostri risultati ci danno delle informazioni riguardo altri peptidi (gamma-III, gamma-IV e glt-156) per i quali non ci sono analoghi dati sperimentali: 1. le loro probabili posizioni di ancoraggio. 2. la sostituzione glutammina-glutammico può migliorare l’interazione DQ2/peptide per questi peptidi 20 dicembre 2004

27 - Risultati (2) - S. Costantini, G. Colonna, M. Rossi, A.M. Facchiano: “Binding of gluten peptides to the coeliac disease-associated HLA-DQ2 molecule by computational methods”, In Proceedings of the 8th Gluten Workshop, edited by D. La Fiandra, S. Masci and R. D’Ovidio, The Royal Society of Chemistry, Cambridge, UK, 2004, pp Susan Costantini, Mauro Rossi, Giovanni Colonna, and Angelo M. Facchiano: "Modelling of HLA-DQ2 and of its interaction with gluten peptides to explain molecular recognition in celiac disease”, submitted 20 dicembre 2004

28 IL-1b umana complessata con il suo recettore [PDB: 1ITB]
3. Simulazioni mediante l’utilizzo del modellamento comparativo dei cambiamenti conformazionali che si verificano quando le proteine interagiscono tra loro Ad esempio le IL-1b IL-1b umana da sola [PDB: 1IOB] IL-1b umana complessata con il suo recettore [PDB: 1ITB] 20 dicembre 2004

29 Se usiamo come template entrambi i modelli sperimentali di IL-1b?
Differenze tra i modelli ottenuti per omologia usando template diversi. Se usiamo come template l’IL-1b da sola? Se usiamo come template l’IL-1b complessata? Se usiamo come template entrambi i modelli sperimentali di IL-1b? 20 dicembre 2004

30 ● Confronto tra i due complessi teorici e quello sperimentale.
3. Simulazioni mediante l’utilizzo del modellamento comparativo dei cambiamenti conformazionali che si verificano quando le proteine interagiscono tra loro | | | | | | | human APVRSLNCTLRDSQQKSLVMSGPYELKALHLQGQDMEQQVVFSMSFVQGEESNDKIPVAL 1IOB 1ITBA human GLKEKNLYLSCVLKDDKPTLQLESVDPKNYPKKKMEKRFVFNKIEINNKLEFESAQFPNW | | | | human YISTSQAENMPVFLGGTKGGQDITDFTMQFVSS ● Confronto tra le due strutture umane di IL-1b riportate nella banca dati PDB. ● Modello teorico umano ottenuto per omologia utilizzando entrambe le strutture sperimentali (indicato come h-ThM). ● Simulazione dei complessi del modello sperimentale [PDB: 1IOB] e di quello teorico h-ThM con il recettore, sulla base del complesso sperimentale umano [PDB: 1ITB]. ● Confronto tra i due complessi teorici e quello sperimentale. 20 dicembre 2004

31 Energie di interazione tra IL-1b e IL-1RI
Complessi ASA all’interfaccia (Å2) Numero di legami ad idrogeno 1IOB/1ITBB 31 1ITB 36 h-ThM/1ITBB 33 Complessi ASA all’interfaccia (Å2) Numero di legami ad idrogeno 1IOB/1ITBB 31 1ITB 36 h-ThM/1ITBB 33 * ASA è l’area di superficie accessibile al solvente all’interfaccia per l’interleuchina 20 dicembre 2004

32 - Risultati (1) - La migliore interazione è quella relativa al complesso sperimentale. L’ interazione nel complesso con h-ThM è migliore di quella nel complesso con 1IOB. Le differenze conformazionali tra i due modelli sperimentali di IL-1b hanno effetto sull’interazione con il recettore. Il complesso con h-ThM risente del fatto che è stato ottenuto da entrambe le strutture sperimentali. 20 dicembre 2004

33 Simulazione dell’interazione IL-1b/IL-1RI in trota e topo:
● Modellamento per omologia delle sequenze di IL-1b di topo e trota usando come template i due modelli sperimentali umani, 1IOB e 1ITBA. trota t-ThF e t-ThC topo m-ThF e m-ThC ● Simulazione per ciascun organismo dei complessi tra il recettore ed i due modelli di IL-1b ottenuti. trota t-ThCOMPL-F e t-ThCOMPL-C topo m-ThCOMPL-F e m-ThCOMPL-C 20 dicembre 2004

34 Energie di interazione IL-1b/IL-1RI nei complessi in topo e trota
m-ThCOMPL-F t-ThCOMPL-F t-ThCOMPL-C m-ThCOMPL-C I complessi ottenuti usando l’IL-1b umana nella forma complessata (t-ThCOMPL-C e m-ThCOMPL-C) hanno valori di energia di interazione più favorevoli. 20 dicembre 2004

35 Complessi in topo e trota ASA all’interfaccia (Å2)
Numero di legami ad idrogeno Complessi in topo m-ThCOMPL-F 26 m-ThCOMPL-C 32 Complessi in trota t-ThCOMPL-F 40 t-ThCOMPL-C 41 Le conformazioni di IL-1b di topo e trota, ottenute utilizzando come riferimento la struttura sperimentale della proteina umana nella sua forma complessata, sono quelle più adatta ad interagire con il recettore. 20 dicembre 2004

36 - Risultati (2) - Il modellamento comparativo può essere applicato con migliori risultati per predire i modelli di proteine, che devono essere utilizzati per approfondire studi di interazione proteina-proteina, quando come riferimento viene utilizzata la struttura tridimensionale di una proteina omologa nello stato complessato. Susan Costantini, Giovanni Colonna and Angelo M. Facchiano: “Comparative modelling simulates conformational changes occurring in protein-protein interaction”, submitted. 20 dicembre 2004

37 Scopo della tesi Applicazioni di metodi computazionali, già noti, per studiare le proprietà strutturali e funzionali delle proteine. Sviluppo di nuovi strumenti di analisi e predizione, al fine di migliorare quelli già esistenti. 20 dicembre 2004

38 Sviluppo di nuovi strumenti di analisi e predizione
a. Propensità degli amminoacidi per i vari tipi di struttura secondaria in proteine che appartengono a differenti classi strutturali. b. Frequenze di coppie di amminoacidi nelle proteine. 20 dicembre 2004

39 a. Propensità degli amminoacidi
Set di 2168 proteine derivato dalla lista PDBselect (non ridondante e con percentuale di identità di sequenza minore del 25%). La struttura secondaria è stata assegnata mediante il programma DSSP considerando “H”, “G” ed “I” come eliche, “B” ed “E” come struttura beta e le altre come “coil”. Le propensità degli amminoacidi nei differenti tipi di struttura secondaria (Pij) rapporto tra la frequenza con cui un dato residuo si trova in eliche, b-strand e “coil” rispetto alla frequenza con cui tale residuo si trova nel set di proteine considerato. dove nij è il numero dei residui di tipo i in struttura di tipo j, ni è il numero totale di residui di tipo i, Nj è il numero totale di residui in struttura di tipo j ed NT è il numero totale di residui. 20 dicembre 2004

40 Predizione della struttura secondaria
A partire dalla regione N-terminale di ogni sequenza proteica, noi abbiamo considerato una running window di n amminoacidi Per n=7 AELMDPRSTWMNALEATGFQE ………… AELMDPRSTWMNALEATGFQE ………… AELMDPRSTWMNALEATGFQE ………… AELMDPRSTWMNALEATGFQE ………… valore più alto tra <Pa>, <Pb>, <Pc> con <Pa>, <Pb> e <Pc> indichiamo il valore medio delle propensità in elica, b-strand e coil. Queste propensità sono state calcolate usando finestre di lunghezza differente per i tre tipi di struttura secondaria (wa, wb, wc), che sono state, poi, moltiplicate per differenti coefficienti (coeffa, coeffb, coeffc). 20 dicembre 2004

41 La qualità delle nostre predizioni è stata valutata ……..
Resubstitution test Gli elementi di struttura secondaria per ciascuna proteina nel set studiato vengono predetti usando le propensità derivate dallo stesso set. Jackknife test Gli elementi di struttura secondaria per ciascuna “proteina test” vengono predetti dalle propensità calcolate da un set di proteine che include tutte tranne la stessa “proteina test”. 20 dicembre 2004

42 Accuratezza predittiva
dove k rappresenta le regioni in elica, beta e “coil” nella proteina, nk è il numero di residui predetti correttamente nello stato k e Nk è il numero totale di residui nello stato conformazionale k nella proteina. dove NT è il numero totale di residui nella proteina ed Nx è il numero totale di residui predetti in modo non corretto nella proteina. Metodi 60.0 52.7 55.9 56.7 60.1 52.5 55.3 48.2 50.9 51.9 Metodi Qa Qb Qcoil Q3 Resubstitution test 60.0 52.7 55.9 56.7 Jackknife test 60.1 52.5 Chou e Fasman 55.3 48.2 50.9 51.9 dove Qa, Qb e Qcoil sono rispettivamente le percentuali di residui predetti correttamente in eliche, b-strand e “coil”; Q3 è la percentuale totale di residui predetti correttamente. 20 dicembre 2004

43 Assegnazione classe strutturale
Secondo Nakashima et al.(1986) Proteine alfa: contenuto di eliche >15% e b-strand <10% Proteine beta: contenuto di eliche <15% e b-strand >10% Proteine alfa-beta: contenuto di eliche >15% e b-strand >10% Secondo Chou (1995) Proteine alfa: contenuto di eliche >40% e b-strand <5% Proteine beta: contenuto di eliche <5% e b-strand >40% Proteine alfa-beta: contenuto di eliche >15% e b-strand >15% 20 dicembre 2004

44 Per ogni classe: ● Propensità degli amminoacidi nei tre tipi di struttura secondaria (eliche, b-strand e coil). ● Predizione degli elementi di struttura secondaria: resubstitution test jackknife test ● Valutazione dell’accuratezza predittiva. ● Confronto con le predizioni di Chou e Fasman. 20 dicembre 2004

45 Accuratezza predittiva
Classi Qa Qb Qcoil Q3 Alfa Resubstitution test 69.7 47.3 49.2 62.2 Jackknife test 69.5 47.0 62.0 Chou e Fasman 54.7 45.3 47.7 52.1 Classi Qa Qb Qcoil Q3 Alfa (627) Resubstitution test 69.7 47.3 49.2 62.2 Jackknife test 69.5 47.0 62.0 Chou e Fasman 54.7 45.3 47.7 52.1 Beta (552) Resubstitution test 44.2 58.0 58.6 57.1 Jackknife test 43.9 57.0 Chou e Fasman 47.2 46.8 55.3 51.1 Beta Resubstitution test 44.2 58.0 58.6 57.1 Jackknife test 43.9 57.0 Chou e Fasman 47.2 46.8 55.3 51.1 Alfa-beta (912) Resubstitution test 60.2 55.1 55.2 57.0 Jackknife test 60.1 Chou e Fasman 56.5 49.4 49.8 52.2 Alfa-beta Resubstitution test 60.2 55.1 55.2 57.0 Jackknife test 60.1 Chou e Fasman 56.5 49.4 49.8 52.2 Classificazione secondo Nakashima et al. (1986) 20 dicembre 2004

46 Accuratezza predittiva
Classi Qa Qb Qcoil Q3 Alfa Resubstitution test 70.5 47.0 43.1 62.2 Jackknife test 43.9 42.7 62.1 Chou e Fasman 54.6 41.8 46.3 52.1 Classi Qa Qb Qcoil Q3 Alfa (470) Resubstitution test 70.5 47.0 43.1 62.2 Jackknife test 43.9 42.7 62.1 Chou e Fasman 54.6 41.8 46.3 52.1 Beta (167) Resubstitution test 35.9 66.3 57.8 61.3 Jackknife test 33.3 66.0 57.4 61.0 Chou e Fasman 40.2 46.2 57.3 50.9 Beta Resubstitution test 35.9 66.3 57.8 61.3 Jackknife test 33.3 66.0 57.4 61.0 Chou e Fasman 40.2 46.2 57.3 50.9 Alfa-beta (696) Resubstitution test 59.2 55.3 56.5 57.2 Jackknife test 59.1 57.1 Chou e Fasman 57.0 49.2 50.1 52.3 Alfa-beta Resubstitution test 59.2 55.3 56.5 57.2 Jackknife test 59.1 57.1 Chou e Fasman 57.0 49.2 50.1 52.3 Classificazione secondo Chou (1995) 20 dicembre 2004

47 - Risultati (1) - ● Le propensità degli amminoacidi sono differenti nelle tre classi strutturali (alfa, beta ed alfa-beta). ● Se per una data proteina può essere assegnata la classe strutturale, gli elementi di struttura secondaria per quella proteina possono essere predetti con migliori risultati, usando le propensità degli amminoacidi calcolate per la sua stessa classe e valori ottimizzati di coefficienti e finestre. 20 dicembre 2004

48 - Risultati (2) - Nell’ambito di questo studio è stato necessario sviluppare dei software che automaticamente e velocemente fossero in grado di analizzare un numero così alto di proteine. Susan Costantini, Giovanni Colonna and Angelo M. Facchiano: “The amino acid conformation potentials in proteins belonging to different secondary structural classes”, in preparation. 20 dicembre 2004

49 b. Frequenze di coppie di amminoacidi nelle proteine
Utilizzando il set di 2168 proteine, suddiviso nelle tre classi strutturali ● Frequenza dei doppietti valutata come rapporto tra il numero di volte in cui il residuo x si trova vicino a quello a, Sx(a), ed il numero totale di coppie possibili (ntot) Per le proteine, classificate secondo Nakashima et al. (1986), alfa AA, AL, EL, LA, LE ed LK, beta SG, GK, DG, VT e GS alfa-beta AA, AL, LA, LL 20 dicembre 2004

50 Confrontando le frequenze dei doppietti nelle tre classi:
I doppietti AA, AL, LA, LE ed LL sono più frequenti nelle proteine alfa che in quelle beta ed alfa-beta. I doppietti GS, SG, SS, VT, TV sono più presenti nelle proteine beta. È possibile sfruttare questa informazione per predire la Classe Strutturale di proteine? 20 dicembre 2004

51 Predizione della Classe Strutturale
Per ciascuna proteina è stata predetta la classe strutturale, utilizzando il metodo della regressione lineare. Sono stati calcolati i coefficienti di correlazione tra l’insieme dei valori relativi alle frequenze delle coppie di residui per la proteina in esame e per le proteine classificate come alfa, beta ed alfa-beta. Frequenze dei doppietti: Alfa Beta Alfa-beta rx/alfa rx/beta rx/alfa-beta Proteina in esame La classe strutturale è assegnata in base al valore più alto tra i tre coefficienti. 20 dicembre 2004

52 Accuratezza predittiva
Proteineclass Proteinepred Q% jackknife Nakashima alfa 627 444 71 68 beta 552 375 65 alfa-beta 912 538 59 56 65% Chou alfa 470 361 77 73 beta 167 124 74 64 alfa-beta 696 445 61 70% 20 dicembre 2004

53 - Risultati - I risultati ottenuti dalle predizioni di classe strutturale sono incoraggianti, anche perché si basano solo sulle frequenze dei doppietti nelle proteine. Dalla sola sequenza amminoacidica di una proteina, è possibile ottenere sempre più informazioni riguardo il suo fold. Questo studio può essere molto utile per migliorare l’accuratezza dei metodi di predizione di struttura secondaria. 20 dicembre 2004

54 - Conclusioni - Il lavoro svolto suggerisce come l’applicazione dei metodi computazionali sia ormai diventata di estrema utilità per fornire chiarimenti strutturali e funzionali riguardo le proteine e per formulare ipotesi sulla loro attività biologica, anche se qualunque applicazione pratica di quanto ipotizzato può essere realizzata solo mediante ulteriori studi di tipo sperimentale. Questo lavoro mostra la necessità di sviluppare sempre nuovi strumenti di analisi e di predizioni, capaci di migliorare quelli esistenti, anche nella prospettiva di dover gestire l’impressionante quantità di informazioni, derivate dalla ricerca genomica e proteomica. 20 dicembre 2004

55 Comunicazioni a Congressi
♦ Susan Costantini, Angelo M. Facchiano, Giovanni Colonna: “Prediction of the three-dimensional structures of proteins by Homology Modelling”, Gruppo di Cooperazione Bioinformatica tra il 15 e il 17 marzo 2002. ♦ S. Costantini, A.M. Facchiano, G. Colonna: “Metodi computazionali e bioinformatici per la predizione della struttura tridimensionale di proteine”, Giornate Scientifiche della Facoltà di Medicina, Seconda Università di Napoli, 4-6 giugno 2002. ♦ S. Costantini, G. Colonna, A.M. Facchiano: “Coeliac disease: studying the interaction of HLA-DQ2 molecule with gluten peptides by computational methods”, Meeting “Gruppo di Cooperazione Bioinformatica” - Frascati – March 28-29, 2003. ♦ Costantini S., Facchiano A.M. and Colonna G.: “Studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca mediante metodi computazionali”, Giornate Scientifiche della Facoltà di Medicina, 4-6 giugno 2003. ♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “Folding ab-initio di proteine: un approccio topologico”, Giornate Scientifiche della Facoltà di Medicina, Seconda Università di Napoli, 4-6 giugno 2003. ♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “Computational issues of a topological approach to protein folding”, Sheffield, July 2003. ♦ Susan Costantini, Giovanni Colonna, Mauro Rossi and Angelo M. Facchiano: “Binding of gluten peptides to the celiac disease associated HLA-DQ2 molecule by computational methods”, 8th Gluten Workshop, Viterbo, 8-10 settembre 2003. ♦ Costantini S., Facchiano A.M. and Colonna G.: “Analysis of the three-dimensional structure of Il-1beta/IL-1 receptor complexes by computational methods”, SIB2003, Ferrara, Settembre 2003. ♦ Susan Costantini, Giovanni Colonna and Angelo M. Facchiano: “Comparative modelling for predicting the different conformations assumed by a protein during its different activities”, Bits 2004, Padova March 2004. ♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “A geometrical approach for protein secondary structure simulations: computational issues”, 2-5 April 2004, Neuchatel, Switzerland. ♦ S. Costantini, G. Colonna and A.M. Facchiano: “Comparative modelling for predicting the different conformations assumed by a protein during its different activities”, SIB-Proteine 2004, Viterbo May 2004. ♦ E. Randelli, M. Forlenza, S. Meloni, S. Benedetti, C.J. Secombes, J. Zou, G. Scapigliati, S. Costantini, A. Facchiano, F. Buonocore: “Potential application of sea bass recombinant interleukin-1 in fish vaccination”, SIB-Proteine 2004. ♦ Costantini S., Facchiano A.M., Rossi M., Colonna G.: “Metodi computazionali per lo studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca”, Giornate Scientifiche della Facoltà di Medicina, 9-11 giugno 2004. ♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “Un approccio ab-initio per la simulazione di strutture secondarie di proteine”, Giornate Scientifiche della Facoltà di Medicina, 9-11 giugno 2004. ♦ Angelo M. Facchiano, Susan Costantini, Mauro Rossi, Giovanni Colonna: “Simulation of the Interaction of Gluten Peptides with HLA-DQ2 Molecule to Investigate the Molecolar Basis of Coeliac Disease” ISMB-ECCB 2004, Glasgow, Scotland, UK, July 31-August 4, 2004. ♦ Susan Costantini, Giovanni Colonna, Angelo M. Facchiano: “Prediction of the secondary structure of proteins: the amino acid propensities in proteins belonging to deifferent secondary structural classes”, Nettab 2004 – Network Tools and Applications in Biology, Camerino, Italy, September 5-7, 2004. Comunicazioni a Congressi ♦ Susan Costantini, Angelo M. Facchiano, Giovanni Colonna: “Prediction of the three-dimensional structures of proteins by Homology Modelling”, Gruppo di Cooperazione Bioinformatica tra il 15 e il 17 marzo 2002. ♦ S. Costantini, A.M. Facchiano, G. Colonna: “Metodi computazionali e bioinformatici per la predizione della struttura tridimensionale di proteine”, Giornate Scientifiche della Facoltà di Medicina, Seconda Università di Napoli, 4-6 giugno 2002. ♦ S. Costantini, G. Colonna, A.M. Facchiano: “Coeliac disease: studying the interaction of HLA-DQ2 molecule with gluten peptides by computational methods”, Meeting “Gruppo di Cooperazione Bioinformatica” - Frascati – March 28-29, 2003. ♦ Costantini S., Facchiano A.M. and Colonna G.: “Studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca mediante metodi computazionali”, Giornate Scientifiche della Facoltà di Medicina, 4-6 giugno 2003. ♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “Folding ab-initio di proteine: un approccio topologico”, Giornate Scientifiche della Facoltà di Medicina, Seconda Università di Napoli, 4-6 giugno 2003. ♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “Computational issues of a topological approach to protein folding”, Sheffield, July 2003. ♦ Susan Costantini, Giovanni Colonna, Mauro Rossi and Angelo M. Facchiano: “Binding of gluten peptides to the celiac disease associated HLA-DQ2 molecule by computational methods”, 8th Gluten Workshop, Viterbo, 8-10 settembre 2003. ♦ Costantini S., Facchiano A.M. and Colonna G.: “Analysis of the three-dimensional structure of Il-1beta/IL-1 receptor complexes by computational methods”, SIB2003, Ferrara, Settembre 2003. ♦ Susan Costantini, Giovanni Colonna and Angelo M. Facchiano: “Comparative modelling for predicting the different conformations assumed by a protein during its different activities”, Bits 2004, Padova March 2004. ♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “A geometrical approach for protein secondary structure simulations: computational issues”, 2-5 April 2004, Neuchatel, Switzerland. ♦ S. Costantini, G. Colonna and A.M. Facchiano: “Comparative modelling for predicting the different conformations assumed by a protein during its different activities”, SIB-Proteine 2004, Viterbo May 2004. ♦ E. Randelli, M. Forlenza, S. Meloni, S. Benedetti, C.J. Secombes, J. Zou, G. Scapigliati, S. Costantini, A. Facchiano, F. Buonocore: “Potential application of sea bass recombinant interleukin-1 in fish vaccination”, SIB-Proteine 2004. ♦ Costantini S., Facchiano A.M., Rossi M., Colonna G.: “Metodi computazionali per lo studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca”, Giornate Scientifiche della Facoltà di Medicina, 9-11 giugno 2004. ♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “Un approccio ab-initio per la simulazione di strutture secondarie di proteine”, Giornate Scientifiche della Facoltà di Medicina, 9-11 giugno 2004. ♦ Angelo M. Facchiano, Susan Costantini, Mauro Rossi, Giovanni Colonna: “Simulation of the Interaction of Gluten Peptides with HLA-DQ2 Molecule to Investigate the Molecolar Basis of Coeliac Disease” ISMB-ECCB 2004, Glasgow, Scotland, UK, July 31-August 4, 2004. ♦ Susan Costantini, Giovanni Colonna, Angelo M. Facchiano: “Prediction of the secondary structure of proteins: the amino acid propensities in proteins belonging to deifferent secondary structural classes”, Nettab 2004 – Network Tools and Applications in Biology, Camerino, Italy, September 5-7, 2004.

56 Dott. Francesco Buonocore Università della Tuscia
- Ringraziamenti - Tutor: Prof. Giovanni Colonna Dott. Angelo Facchiano - SUN ISA-CNR, Avellino Dott. Francesco Buonocore Università della Tuscia Dott. Mauro Rossi ISA – CNR, Avellino Marilù Chiusano Gruppo di Bioinformatica dell’ISA-CNR, Avellino Gruppo di ricerca del prof. Malorni del CESMA-ProBio, Avellino 20 dicembre 2004


Scaricare ppt "Basi molecolari dell’attività biologica delle proteine:"

Presentazioni simili


Annunci Google