Basi molecolari dell’attività biologica delle proteine:

Slides:



Advertisements
Presentazioni simili
Struttura delle proteine
Advertisements

Training On Line - CONP. 2 Richiesta Da Menu: Conferimenti ad inizio anno termico > Agosto > Pluriennali > Nuova Richiesta Si accede alla pagina di Richiesta.
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Caduta non guidata di un corpo rettangolare in un serbatoio Velocità e rotazione.
1 MeDeC - Centro Demoscopico Metropolitano Provincia di Bologna - per Valutazione su alcuni servizi erogati nel.
1 Pregnana Milanese Assessorato alle Risorse Economiche Bilancio Preventivo P R O P O S T A.
Frontespizio Economia Monetaria Anno Accademico
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
LA LAUREA MAGISTRALE IN BIOINFORMATICA Università degli studi
Scoperta Spiegazione di anomalie proprietà applicazioni
Bioinformatica Prof. Mauro Fasano
Implementazione dell algortimo di Viterbi attraverso la soluzione del problema di cammino mi- nimo tramite software specifico. Università degli studi di.
Analisi Bivariata & Esercizi Analisi Univariata
Analisi Bivariata & Esercizi Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°4.
XXIV Congresso ACOI 2005 Montecatini Terme Maggio 2005
Come nasce la Bioinformatica? Progetti di sequenziazione del genoma Sforzi sperimentali per determinare la struttura e le funzioni di molecole biologiche.
MALATTIE DA ESPANSIONE (instabile) DI BREVI TRATTI RIPETUTI
Valutazione delle Prestazioni di un Classificatore
Obiettivi del corso di Statistica Medica.
Le moli Il peso di una millimole di (NH4)2HPO4 è … 132 g 114 g
ELEZIONI REGIONALI 2010 PRIMI RISULTATI E SCENARI 14 aprile 2010.
Canale A. Prof.Ciapetti AA2003/04
Indagine trimestrale sulla industria manifatturiera in provincia di Ravenna - Imprese con oltre 10 addetti - II trimestre e I semestre 2003 Ravenna, 15.
Ufficio Studi UNIONCAMERE TOSCANA 1 Presentazione di Riccardo Perugi Ufficio Studi UNIONCAMERE TOSCANA Firenze, 19 dicembre 2000.
Già primario f.f. U.O. di neurochirurgia
Metodi basati sulle similitudini per dedurre la funzione di un gene
Master universitario di II livello in Ingegneria delle Infrastrutture e dei Sistemi Ferroviari Anno Accademico 2012/2013 Cultura dimpresa, valutazione.
La partita è molto combattuta perché le due squadre tentano di vincere fino all'ultimo minuto. Era l'ultima giornata del campionato e il risultato era.
Dopo un anno di trattamento
MP/RU 1 Dicembre 2011 ALLEGATO TECNICO Evoluzioni organizzative: organico a tendere - ricollocazioni - Orari TSC.
Cos’è un problema?.
Bioinformatica Andrea G. B. Tettamanzi.
CALCIO SKY 2007 – 2008 PROFILO DI ASCOLTO. 2 INDICE DEGLI ARGOMENTI Profilo di ascolto CALCIO SERIE A 2007 – 2008 Totale campionato (tutte le partite)……………………………………………….
Gli italiani e il marketing di relazione: promozioni, direct marketing, digital marketing UNA RICERCA QUANTITATIVA SVOLTA DA ASTRA RICERCHE PER ASSOCOMUNICAZIONE.
La struttura delle proteine (questa versione è priva delle immagini)
STILI DI APPRENDIMENTO ED EVOLUZIONE INTERFACCE
CHARGE PUMP Principio di Funzionamento
Settimana: 3-7 marzo Orariolunedimartedi Mercoledi 5 Giovedi 6 Venerdi lezione intro alla fis mod DR lezione intro alla fis mod DR.
Q UESTIONI ETICHE E BIOETICHE DELLA DIFESA DELLA VITA NELL AGIRE SANITARIO 1 Casa di Cura Villa San Giuseppe Ascoli Piceno 12 e 13 dicembre 2011.
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE.
UNIVERSITA’ DEGLI STUDI DI GENOVA
ISTITUTO COMPRENSIVO “G. BATTAGLINI” MARTINA FRANCA (TA)
Struttura delle proteine
DOMANDE FINALI 1) Cosè un campo elettromagnetico? 2) Che cosa si intende per frequenza di un campo elettromagnetico? 3) Che differenza esiste tra alte.
Esistono 3 metodi principali di predizione:
Come si può studiare la struttura di una proteina
Un trucchetto di Moltiplicazione per il calcolo mentale
21 marzo 2002 (ri-)Avvisi: Giovedi 28 marzo la lezione e sospesa. Nuovo indirizzo di Spedire messaggi e esercizi solo.
LE PROTEINE Relatori: Regolo Matteo Scavuzzo Pasquale
Prima rilevazione sullo stato di attuazione della riforma degli ordinamenti nelle istituzioni scolastiche in LOMBARDIA Attuazione del D.L. 59/2003 a.s.
GLI OBIETTIVI DELLA RICERCA
Esempi risolti mediante immagini (e con excel)
Classificazione (aka Cluster Analysis)
INTERPRETAZIONE DELL’ EMOGASANALISI PER INFERMIERI
PIANO DI INFORMAZIONE E FORMAZIONE SULLINDAGINE OCSE-PISA E ALTRE RICERCHE NAZIONALI E INTERNAZIONALI PIANO DI INFORMAZIONE E FORMAZIONE SULLINDAGINE OCSE-PISA.
NO WASTE Progetto continuità scuola primaria scuola secondaria Salorno a.s. 2013_
I chicchi di riso e la sfida al Bramino
Un’analisi dei dati del triennio
Mercato del lavoro e condizione giovanile: la crisi si acuisce
Il numero più grande Accademia dei Lincei
Le PROTEINE o PROTIDI I protidi o proteine sono composti quaternari in quanto formati essenzialmente da 4 elementi: C (carbonio), H (idrogeno), O (ossigeno)
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
Determinazione della fase
Informatica e Bioinformatica – A. A Un altro grande database è UniProt, The Universal Protein Resource ( nel quale.
AMMINOACIDI E PROTEINE
CONFORMAZIONE organizzazione spaziale degli atomi in una proteina STRUTTURA NATIVA conformazione funzionale di una proteina La FUNZIONE di una proteina.
  Disegno assistito dal computer STRATEGIE PER LA RICERCA DEI NUOVI LEADS Computer-assisted design utilizza la chimica computazionale per al scoperta.
Predizione della Struttura Terziaria. Perchè predire la struttura terziaria? In cifre: – sequenze proteiche –~ 30,000 strutture, ~ 7,000.
PARAGONE CON I RISULTATI SPERIMENTALI Dobbiamo correlare i parametri  ed s con variabili sperimentali. Per fare questo assumiamo che la costante di equilibrio.
Transcript della presentazione:

Basi molecolari dell’attività biologica delle proteine: Dottorato di ricerca in Biologia Computazionale (XVI ciclo) Dott.ssa Costantini Susan Basi molecolari dell’attività biologica delle proteine: l’approccio computazionale e bioinformatico alla comprensione della relazione Struttura-Funzione 20 dicembre 2004

Sequenza – Struttura - Funzione Strutture-proteine Genoma MYSFPNSFRFGWSQAGFQSEMGTPGSEDPNTDWYKWVHDPENMAAGLVSGDLPENGPGYWGNYKTFHDNAQKMGLKIARLNVEWSRIFPNPLPRPQNFDESKQDVTEVEINENELKRLDEYANKDALNHYREIFKDLKSRGLYFILNMYHWPLPLWLHDPIRVRRGDFTGPSGWLSTRTVYEFARFSAYIAWKFDDLVDEYSTMNEPNVVGGLGYVGVKSGFPPGYLSFELSRRHMYNIIQAHARAYDGIKSVSKKPVGIIYANSSFQPLTDKDMEAVEMAENDNRWWFFDAIIRGEITRGNEKIVRDDLKGRLDWIGVNYYTRTVVKRTEKGYVSLGGYGHGCERNSVSLAGLPTSDFGWEFFPEGLYDVLTKYWNRYHLYMYVTENGIADDADYQRPY YLVSHVYQVHRAINSGADVRGYLHWSLADNYEWASGFSMRFGLLKVDYNTKRLYWRPSALVYREIATNGAITDEIEHLNSVPPVKPLRH Sequenze-proteine Funzioni Meccanismo d’azione Specificità per ligandi Interazioni proteina-proteina 20 dicembre 2004

Struttura tridimensionale delle proteine Metodi Sperimentali Diffrazione ai Raggi X (RX) Risonanza Magnetica Nucleare (NMR) Metodi Computazionali Riconoscimento di fold Folding ab-initio Modellamento Comparativo Modellamento Comparativo 20 dicembre 2004

Modellamento Comparativo Permette di costruire il modello 3D di una proteina (‘target’) a partire da proteine omologhe (‘template’), la cui struttura è stata caratterizzata sperimentalmente. La percentuale di identità di sequenza tra la proteina target e quelle template deve essere superiore al 20-40%. Alta identità di sequenza buon allineamento delle sequenze buoni modelli ottenuti per omologia 20 dicembre 2004

Modellamento Comparativo Il modellamento per omologia richiede l’utilizzo di numerosi strumenti bioinformatici e computazionali: - per l’estrazione di informazioni da banche dati di sequenze (UNIPROT) e di strutture tridimensionali (PDB) - per il confronto e l’allineamento delle sequenze (BLAST e CLUSTAL) - per la costruzione dei modelli strutturali per la proteina in esame (MODELER,QUANTA, INSIGHT) - per la valutazione della loro qualità (PROCHECK e PROSA). 20 dicembre 2004

Modellamento comparativo TARGET: AQYSKRREVQCSVTDSEKRSLVLVPNSMELHAVM…… PROTEINA TARGET BLAST TEMPLATE: VPIRQLHYRLRDEQQKSLVLSDPYELKALHLNGQN… RICERCA DEL TEMPLATE CLUSTALW ALLINEAMENTO MULTIPLO TARGET-TEMPLATE MODELLER MODELLO DELLA PROTEINA TARGET A PARTIRE DALLA STRUTTURA TEMPLATE PROCHECK VALUTAZIONE DEL MODELLO 20 dicembre 2004

Scopo della tesi Applicazioni di metodi computazionali, già noti, per studiare le proprietà strutturali e funzionali delle proteine. Sviluppo di nuovi strumenti di analisi e predizione, al fine di migliorare quelli già esistenti. 20 dicembre 2004

Applicazioni dei metodi computazionali 1. Modellamento di complessi tra interleuchine-1b ed i loro recettori. 2. Studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca. 3. Simulazioni, mediante l’utilizzo del modellamento comparativo, dei cambiamenti conformazionali che si verificano quando le proteine interagiscono tra loro. 20 dicembre 2004

1. Modellamento di complessi tra interleuchine-1b ed i loro recettori Interleuchina-1 (IL-1) è un mediatore della risposta immunitaria IL-1 IL-1a , IL-1b, IL-1ra L’attività biologica di IL-1 conseguenza del “binding” con il proprio recettore formazione del complesso IL-1/IL-1R. Esistono due recettori: IL-1RI e IL-1RII 20 dicembre 2004

Simulazione del complesso IL-1b (trota)/IL-1RI (topo) 1. Modellamento di complessi tra interleuchine-1b ed i loro recettori Predizione della struttura tridimensionale - di IL-1b di spigola e di trota - dei recettori di tipo I (IL-1RI) di trota e topo. Simulazione dei complessi IL-1b/IL-1RI in trota e topo. Simulazione del complesso IL-1b (trota)/IL-1RI (topo) al fine di dare una interpretazione a livello molecolare dei dati sperimentali circa l’attività biologica di rIL-1b di trota. 20 dicembre 2004

IL-1b di spigola e trota Ricerca dei template con BLAST: IL-1b umana [PDB: 1IOB] IL-1b topo [PDB: 2MIB] IL-1b uomo topo trota spigola 100 78 (86) 34 (49) 37 (51)   36 (49) 32 (50) 54 (71) In tabella sono riportate le % di identità di sequenza e tra parentesi le similarità. 20 dicembre 2004

IL-1b di spigola IL-1b di trota N-end C-end b-bulge loop IL-1b di spigola N-end C-end b-bulge loop IL-1b di trota PDB: 1K5L PDB: 1OOX Entrambi sono caratterizzati da una piccola a-elica (5% della sequenza) e da 12 b-strand antiparalleli (40% della sequenza), definendo la struttura come “mainly-beta” con topologia di tipo b-trefoil, in accordo con la classificazione di CATH e SCOP. 20 dicembre 2004

IL-1RI di topo e trota Ricerca del template con BLAST: IL-1RI umano [catena B in 1ITB dove è presente il complesso umano] IL-1RI uomo topo trota 100 64 (81) 22 (40)   20 (39) In tabella sono riportate le % di identità di sequenza e tra parentesi le similarità. 20 dicembre 2004

a IL-1RI di trota b IL-1b/IL-1RI trota C-end N-end Dominio III Dominio II Dominio I a IL-1RI di trota PDB: 1OU1 b IL-1b IL-1RI IL-1b/IL-1RI trota ……anche per topo: è stato simulato il complesso utilizzando IL-1b caratterizzato ai RX [PDB: 2MIB] ed IL-1RI modellato per omologia [PDB: 1OU3]. 20 dicembre 2004

Ciò rende rIL-1b di trota meno affine al recettore (IL-1RI) di topo. Da dati bibliografici …… IL-1b di trota è stata prodotta come proteina ricombinante in Escherichia coli. Test di attività biologica: rIL-1b è risultata capace di aumentare la proliferazione cellulare nelle cellule murine D10.G4.1. Lo stesso livello di proliferazione è stato indotto da rIL-1b umana utilizzandone una quantità 1000 volte più bassa di quella necessaria per rIL-1b di trota. Questo fatto può essere una conseguenza delle differenze strutturali tra IL-1 nei mammiferi e nei pesci. Ciò rende rIL-1b di trota meno affine al recettore (IL-1RI) di topo. Obiettivo: comprensione a livello molecolare del fenomeno biologico. 20 dicembre 2004

Complesso IL-1b trota/IL-1RI topo Complessi Van der Waals Elettrostatico Energia totale IL-1b (trota) / IL-1RI (trota) - 164.85 - 951.09 - 1115.94 IL-1b (topo) /IL-1RI (topo) - 129.69 - 1039.57 - 1169.26 IL-1b (trota) / IL-1RI (topo) - 155.45 - 583.54 - 738.99 IL-1b (trota) / IL-1RI (topo) - 155.45 - 583.54 - 738.99 * Le Energie sono espresse in Kcal/mol 20 dicembre 2004

% esposizione con IL-1R di trota % esposizione con IL-1R di topo Esposizione al solvente degli AA dell’IL-1b di trota nei due complessi AA Posizione % esposizione con IL-1R di trota % esposizione con IL-1R di topo Differenze ALA 153 36,5 93,3 -56,8 SER 6 7,2 47,7 -40,5 GLU 11 6,9 37,8 -30,9 THR 117 41,6 69,8 -28,2 MET 138 14,8 42,4 -27,6 5 6,2 33,7 -27,5 91 68 91,8 -23,8 GLY 39 64,3 87,6 -23,3 ..... .... ... .. ASP 141 27,2 10,9 16,3 61 39,7 23,3 16,4 PRO 55 82,9 65,4 17,5 ASN 166 50,8 19 ILE 58 23,7 3,5 20,2 86 31,5 11,3 60 38,6 15,7 22,9 25 25,4 0,9 24,5 26 62,4 29,6 32,8 20 dicembre 2004

- Risultati - L’energia di interazione nell’eterocomplesso tra IL-1b (trota) e IL-1RI (topo) è risultata più alta di quella nell’omocomplesso, indicando che il legame tra IL-1b di trota ed IL-1RI di topo è molto debole. Le interazioni elettrostatiche sono risultate molto ridotte nell’eterocomplesso e questa è probabilmente una conseguenza delle differenze amminoacidiche, che provocano una perdita di catene laterali cariche e, quindi, di ponti salini. Misurando l’esposizione al solvente degli amminoacidi di IL-1b di trota nell’omocomplesso e nell’eterocomplesso, abbiamo anche verificato come alcuni residui hanno valori completamente differenti una diversa capacità dell’IL-1b di trota di legarsi ai due recettori, in accordo con quanto riportato in letteratura. Scapigliati G, Costantini S, Colonna G, Facchiano A, Buonocore F, Bossù P, Cunningham C, Holland JW and Secombes CJ. (2004) Modelling of fish interleukin-1 and its receptor. Dev. Comp. Immunol. 28, 429-441. 20 dicembre 2004

2. Studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca La celiachia si manifesta, in individui geneticamente predisposti, in seguito ad ingestione di gliadina, il maggiore costituente del glutine del grano. Essa è associata ai geni dell’HLA codificanti per gli eterodimeri DQ2 e DQ8, che sono esposti sulla superficie delle cellule APC (Cellule Presentanti l’Antigene). Queste molecole legano in modo non covalente i peptidi di gliadina ( ) e li espongono al riconoscimento dei linfociti T (CD4+). 20 dicembre 2004

Un peptide antigenico (peptide di gliadina) si lega in modo più efficace alle molecole DQ2 o DQ8 quando possiede dei residui amminocidici con carica negativa in determinate posizioni di ancoraggio. Recettore Cellule T Peptide Sollid LM Ann Rev Immunol 2000: 53-81 DQ2 I peptidi di gliadina non hanno molti amminoacidi carichi negativamente. Ma se sono sottoposti a reazioni di deammidazione o nell’ambiente acido dello stomaco o ad opera della transglutaminasi tissutale, alcuni residui di glutammina sono convertiti in acido glutammico. 20 dicembre 2004

2. Studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca Modellamento per omologia della struttura 3D del dimero DQ2, presente in individui celiaci. Simulazione del complesso con vari peptidi di glutine per investigare le basi molecolari di questa interazione. Simulazione degli effetti della deammidazione di residui di glutammina nelle posizioni di ancoraggio e di altre modifiche al fine di dare una spiegazione a livello molecolare di risultati sperimentali relativi all’affinità di questi peptidi per il dimero DQ2. 20 dicembre 2004

Dimero DQ2 Le sequenze delle due catene del DQ2 sono state modellate per omologia utilizzando come riferimento quelle del dimero DQ8 (percentuale di identità di sequenza del 91%). Domini C-terminali Dominio N-terminale – catena a Sito di legame Dominio N-terminale – catena b PDB: 1NBN 20 dicembre 2004

Peptidi di glutine usati nelle simulazioni P1 P9 | | Peptide PDB LVEALYLVCGERGG Alfa-I QLQPFPQPQLPY Alfa-II PQPQLPYPQPQ Alfa-III PYPQPQLPY Glia-a20 FRPQQPYPQ Glia-g2 PYPQQPQQP Gamma-I PQQPQQSFPQQQRP Gamma-II IIQPQQPAQ Gamma-III FPQQPQQPYPQQP Gamma-IV FSQPQQQFPQPQ Glt-156 PFSQQQQSPF Glt-17 PFSQQQQPV I residui di glutammina che vengono deammidati sono riportati in rosso. Le sequenze dei peptidi di glutine usati nelle simulazioni sono allineate a quella del peptide di insulina presente nel modello del DQ8 usato come riferimento (template) [PDB: 1JK8]. 20 dicembre 2004

Energie di interazione tra il dimero DQ2 ed i peptidi di glutine Alfa-I Alfa-II Alfa-III Glia-a20 Glia-g2 Gamma-I Gamma-II Gamma-III Glt-156 Gamma-IV Glt-17 Alfa-I P6 Energie di interazione tra il dimero DQ2 ed i peptidi di glutine Alfa-II P4 Q P-2 P7 P9 Q Q Q Gamma-I Le barre rappresentano la differenza di energia di interazione tra il peptide naturale e quelli modificati. 20 dicembre 2004

Dettaglio della superficie del sito di legame del dimero DQ2 con il peptide alfa II. Region N-terminale del peptide Regione C-terminale del peptide Posizione P4 Posizione P7 Lys b71 20 dicembre 2004

- Risultati (1) - La deammidazione dei peptidi nelle posizioni p4, p6 e p7 rende i complessi più stabili. La presenza di una carica positiva (Lys) in p6 e p7 nei peptidi riduce la loro affinità per il dimero. I nostri risultati confermano in gran parte i dati sperimentali riportati in letteratura. I nostri risultati ci danno delle informazioni riguardo altri peptidi (gamma-III, gamma-IV e glt-156) per i quali non ci sono analoghi dati sperimentali: 1. le loro probabili posizioni di ancoraggio. 2. la sostituzione glutammina-glutammico può migliorare l’interazione DQ2/peptide per questi peptidi 20 dicembre 2004

- Risultati (2) - S. Costantini, G. Colonna, M. Rossi, A.M. Facchiano: “Binding of gluten peptides to the coeliac disease-associated HLA-DQ2 molecule by computational methods”, In Proceedings of the 8th Gluten Workshop, edited by D. La Fiandra, S. Masci and R. D’Ovidio, The Royal Society of Chemistry, Cambridge, UK, 2004, pp.391-394. Susan Costantini, Mauro Rossi, Giovanni Colonna, and Angelo M. Facchiano: "Modelling of HLA-DQ2 and of its interaction with gluten peptides to explain molecular recognition in celiac disease”, submitted 20 dicembre 2004

IL-1b umana complessata con il suo recettore [PDB: 1ITB] 3. Simulazioni mediante l’utilizzo del modellamento comparativo dei cambiamenti conformazionali che si verificano quando le proteine interagiscono tra loro Ad esempio le IL-1b IL-1b umana da sola [PDB: 1IOB] IL-1b umana complessata con il suo recettore [PDB: 1ITB] 20 dicembre 2004

Se usiamo come template entrambi i modelli sperimentali di IL-1b? Differenze tra i modelli ottenuti per omologia usando template diversi. Se usiamo come template l’IL-1b da sola? Se usiamo come template l’IL-1b complessata? Se usiamo come template entrambi i modelli sperimentali di IL-1b? 20 dicembre 2004

● Confronto tra i due complessi teorici e quello sperimentale. 3. Simulazioni mediante l’utilizzo del modellamento comparativo dei cambiamenti conformazionali che si verificano quando le proteine interagiscono tra loro 1 20 40 60 | | | | | | | human APVRSLNCTLRDSQQKSLVMSGPYELKALHLQGQDMEQQVVFSMSFVQGEESNDKIPVAL 1IOB 1ITBA 61 80 100 120 human GLKEKNLYLSCVLKDDKPTLQLESVDPKNYPKKKMEKRFVFNKIEINNKLEFESAQFPNW 121 140 | | | | human YISTSQAENMPVFLGGTKGGQDITDFTMQFVSS ● Confronto tra le due strutture umane di IL-1b riportate nella banca dati PDB. ● Modello teorico umano ottenuto per omologia utilizzando entrambe le strutture sperimentali (indicato come h-ThM). ● Simulazione dei complessi del modello sperimentale [PDB: 1IOB] e di quello teorico h-ThM con il recettore, sulla base del complesso sperimentale umano [PDB: 1ITB]. ● Confronto tra i due complessi teorici e quello sperimentale. 20 dicembre 2004

Energie di interazione tra IL-1b e IL-1RI Complessi ASA all’interfaccia (Å2) Numero di legami ad idrogeno 1IOB/1ITBB 2157.62 31 1ITB 2337.15 36 h-ThM/1ITBB 2240.38 33 Complessi ASA all’interfaccia (Å2) Numero di legami ad idrogeno 1IOB/1ITBB 2157.62 31 1ITB 2337.15 36 h-ThM/1ITBB 2240.38 33 * ASA è l’area di superficie accessibile al solvente all’interfaccia per l’interleuchina 20 dicembre 2004

- Risultati (1) - La migliore interazione è quella relativa al complesso sperimentale. L’ interazione nel complesso con h-ThM è migliore di quella nel complesso con 1IOB. Le differenze conformazionali tra i due modelli sperimentali di IL-1b hanno effetto sull’interazione con il recettore. Il complesso con h-ThM risente del fatto che è stato ottenuto da entrambe le strutture sperimentali. 20 dicembre 2004

Simulazione dell’interazione IL-1b/IL-1RI in trota e topo: ● Modellamento per omologia delle sequenze di IL-1b di topo e trota usando come template i due modelli sperimentali umani, 1IOB e 1ITBA. trota t-ThF e t-ThC topo m-ThF e m-ThC ● Simulazione per ciascun organismo dei complessi tra il recettore ed i due modelli di IL-1b ottenuti. trota t-ThCOMPL-F e t-ThCOMPL-C topo m-ThCOMPL-F e m-ThCOMPL-C 20 dicembre 2004

Energie di interazione IL-1b/IL-1RI nei complessi in topo e trota m-ThCOMPL-F t-ThCOMPL-F t-ThCOMPL-C m-ThCOMPL-C I complessi ottenuti usando l’IL-1b umana nella forma complessata (t-ThCOMPL-C e m-ThCOMPL-C) hanno valori di energia di interazione più favorevoli. 20 dicembre 2004

Complessi in topo e trota ASA all’interfaccia (Å2) Numero di legami ad idrogeno Complessi in topo m-ThCOMPL-F 2121.84 26 m-ThCOMPL-C 2259.20 32 Complessi in trota t-ThCOMPL-F 2394.40 40 t-ThCOMPL-C 2764.61 41 Le conformazioni di IL-1b di topo e trota, ottenute utilizzando come riferimento la struttura sperimentale della proteina umana nella sua forma complessata, sono quelle più adatta ad interagire con il recettore. 20 dicembre 2004

- Risultati (2) - Il modellamento comparativo può essere applicato con migliori risultati per predire i modelli di proteine, che devono essere utilizzati per approfondire studi di interazione proteina-proteina, quando come riferimento viene utilizzata la struttura tridimensionale di una proteina omologa nello stato complessato. Susan Costantini, Giovanni Colonna and Angelo M. Facchiano: “Comparative modelling simulates conformational changes occurring in protein-protein interaction”, submitted. 20 dicembre 2004

Scopo della tesi Applicazioni di metodi computazionali, già noti, per studiare le proprietà strutturali e funzionali delle proteine. Sviluppo di nuovi strumenti di analisi e predizione, al fine di migliorare quelli già esistenti. 20 dicembre 2004

Sviluppo di nuovi strumenti di analisi e predizione a. Propensità degli amminoacidi per i vari tipi di struttura secondaria in proteine che appartengono a differenti classi strutturali. b. Frequenze di coppie di amminoacidi nelle proteine. 20 dicembre 2004

a. Propensità degli amminoacidi Set di 2168 proteine derivato dalla lista PDBselect (non ridondante e con percentuale di identità di sequenza minore del 25%). La struttura secondaria è stata assegnata mediante il programma DSSP considerando “H”, “G” ed “I” come eliche, “B” ed “E” come struttura beta e le altre come “coil”. Le propensità degli amminoacidi nei differenti tipi di struttura secondaria (Pij) rapporto tra la frequenza con cui un dato residuo si trova in eliche, b-strand e “coil” rispetto alla frequenza con cui tale residuo si trova nel set di proteine considerato. dove nij è il numero dei residui di tipo i in struttura di tipo j, ni è il numero totale di residui di tipo i, Nj è il numero totale di residui in struttura di tipo j ed NT è il numero totale di residui. 20 dicembre 2004

Predizione della struttura secondaria A partire dalla regione N-terminale di ogni sequenza proteica, noi abbiamo considerato una running window di n amminoacidi Per n=7 AELMDPRSTWMNALEATGFQE ………… AELMDPRSTWMNALEATGFQE ………… AELMDPRSTWMNALEATGFQE ………… AELMDPRSTWMNALEATGFQE ………… valore più alto tra <Pa>, <Pb>, <Pc> con <Pa>, <Pb> e <Pc> indichiamo il valore medio delle propensità in elica, b-strand e coil. Queste propensità sono state calcolate usando finestre di lunghezza differente per i tre tipi di struttura secondaria (wa, wb, wc), che sono state, poi, moltiplicate per differenti coefficienti (coeffa, coeffb, coeffc). 20 dicembre 2004

La qualità delle nostre predizioni è stata valutata …….. Resubstitution test Gli elementi di struttura secondaria per ciascuna proteina nel set studiato vengono predetti usando le propensità derivate dallo stesso set. Jackknife test Gli elementi di struttura secondaria per ciascuna “proteina test” vengono predetti dalle propensità calcolate da un set di proteine che include tutte tranne la stessa “proteina test”. 20 dicembre 2004

Accuratezza predittiva dove k rappresenta le regioni in elica, beta e “coil” nella proteina, nk è il numero di residui predetti correttamente nello stato k e Nk è il numero totale di residui nello stato conformazionale k nella proteina. dove NT è il numero totale di residui nella proteina ed Nx è il numero totale di residui predetti in modo non corretto nella proteina. Metodi 60.0 52.7 55.9 56.7 60.1 52.5 55.3 48.2 50.9 51.9 Metodi Qa Qb Qcoil Q3 Resubstitution test 60.0 52.7 55.9 56.7 Jackknife test 60.1 52.5 Chou e Fasman 55.3 48.2 50.9 51.9 dove Qa, Qb e Qcoil sono rispettivamente le percentuali di residui predetti correttamente in eliche, b-strand e “coil”; Q3 è la percentuale totale di residui predetti correttamente. 20 dicembre 2004

Assegnazione classe strutturale Secondo Nakashima et al.(1986) Proteine alfa: contenuto di eliche >15% e b-strand <10% Proteine beta: contenuto di eliche <15% e b-strand >10% Proteine alfa-beta: contenuto di eliche >15% e b-strand >10% Secondo Chou (1995) Proteine alfa: contenuto di eliche >40% e b-strand <5% Proteine beta: contenuto di eliche <5% e b-strand >40% Proteine alfa-beta: contenuto di eliche >15% e b-strand >15% 20 dicembre 2004

Per ogni classe: ● Propensità degli amminoacidi nei tre tipi di struttura secondaria (eliche, b-strand e coil). ● Predizione degli elementi di struttura secondaria: resubstitution test jackknife test ● Valutazione dell’accuratezza predittiva. ● Confronto con le predizioni di Chou e Fasman. 20 dicembre 2004

Accuratezza predittiva Classi Qa Qb Qcoil Q3 Alfa Resubstitution test 69.7 47.3 49.2 62.2 Jackknife test 69.5 47.0 62.0 Chou e Fasman 54.7 45.3 47.7 52.1 Classi Qa Qb Qcoil Q3 Alfa (627) Resubstitution test 69.7 47.3 49.2 62.2 Jackknife test 69.5 47.0 62.0 Chou e Fasman 54.7 45.3 47.7 52.1 Beta (552) Resubstitution test 44.2 58.0 58.6 57.1 Jackknife test 43.9 57.0 Chou e Fasman 47.2 46.8 55.3 51.1 Beta Resubstitution test 44.2 58.0 58.6 57.1 Jackknife test 43.9 57.0 Chou e Fasman 47.2 46.8 55.3 51.1 Alfa-beta (912) Resubstitution test 60.2 55.1 55.2 57.0 Jackknife test 60.1 Chou e Fasman 56.5 49.4 49.8 52.2 Alfa-beta Resubstitution test 60.2 55.1 55.2 57.0 Jackknife test 60.1 Chou e Fasman 56.5 49.4 49.8 52.2 Classificazione secondo Nakashima et al. (1986) 20 dicembre 2004

Accuratezza predittiva Classi Qa Qb Qcoil Q3 Alfa Resubstitution test 70.5 47.0 43.1 62.2 Jackknife test 43.9 42.7 62.1 Chou e Fasman 54.6 41.8 46.3 52.1 Classi Qa Qb Qcoil Q3 Alfa (470) Resubstitution test 70.5 47.0 43.1 62.2 Jackknife test 43.9 42.7 62.1 Chou e Fasman 54.6 41.8 46.3 52.1 Beta (167) Resubstitution test 35.9 66.3 57.8 61.3 Jackknife test 33.3 66.0 57.4 61.0 Chou e Fasman 40.2 46.2 57.3 50.9 Beta Resubstitution test 35.9 66.3 57.8 61.3 Jackknife test 33.3 66.0 57.4 61.0 Chou e Fasman 40.2 46.2 57.3 50.9 Alfa-beta (696) Resubstitution test 59.2 55.3 56.5 57.2 Jackknife test 59.1 57.1 Chou e Fasman 57.0 49.2 50.1 52.3 Alfa-beta Resubstitution test 59.2 55.3 56.5 57.2 Jackknife test 59.1 57.1 Chou e Fasman 57.0 49.2 50.1 52.3 Classificazione secondo Chou (1995) 20 dicembre 2004

- Risultati (1) - ● Le propensità degli amminoacidi sono differenti nelle tre classi strutturali (alfa, beta ed alfa-beta). ● Se per una data proteina può essere assegnata la classe strutturale, gli elementi di struttura secondaria per quella proteina possono essere predetti con migliori risultati, usando le propensità degli amminoacidi calcolate per la sua stessa classe e valori ottimizzati di coefficienti e finestre. 20 dicembre 2004

- Risultati (2) - Nell’ambito di questo studio è stato necessario sviluppare dei software che automaticamente e velocemente fossero in grado di analizzare un numero così alto di proteine. Susan Costantini, Giovanni Colonna and Angelo M. Facchiano: “The amino acid conformation potentials in proteins belonging to different secondary structural classes”, in preparation. 20 dicembre 2004

b. Frequenze di coppie di amminoacidi nelle proteine Utilizzando il set di 2168 proteine, suddiviso nelle tre classi strutturali ● Frequenza dei doppietti valutata come rapporto tra il numero di volte in cui il residuo x si trova vicino a quello a, Sx(a), ed il numero totale di coppie possibili (ntot) Per le proteine, classificate secondo Nakashima et al. (1986), alfa AA, AL, EL, LA, LE ed LK, beta SG, GK, DG, VT e GS alfa-beta AA, AL, LA, LL 20 dicembre 2004

Confrontando le frequenze dei doppietti nelle tre classi: I doppietti AA, AL, LA, LE ed LL sono più frequenti nelle proteine alfa che in quelle beta ed alfa-beta. I doppietti GS, SG, SS, VT, TV sono più presenti nelle proteine beta. È possibile sfruttare questa informazione per predire la Classe Strutturale di proteine? 20 dicembre 2004

Predizione della Classe Strutturale Per ciascuna proteina è stata predetta la classe strutturale, utilizzando il metodo della regressione lineare. Sono stati calcolati i coefficienti di correlazione tra l’insieme dei valori relativi alle frequenze delle coppie di residui per la proteina in esame e per le proteine classificate come alfa, beta ed alfa-beta. Frequenze dei doppietti: Alfa Beta Alfa-beta rx/alfa rx/beta rx/alfa-beta Proteina in esame La classe strutturale è assegnata in base al valore più alto tra i tre coefficienti. 20 dicembre 2004

Accuratezza predittiva   Proteineclass Proteinepred Q% jackknife Nakashima alfa 627 444 71 68 beta 552 375 65 alfa-beta 912 538 59 56 65% Chou alfa 470 361 77 73 beta 167 124 74 64 alfa-beta 696 445 61 70% 20 dicembre 2004

- Risultati - I risultati ottenuti dalle predizioni di classe strutturale sono incoraggianti, anche perché si basano solo sulle frequenze dei doppietti nelle proteine. Dalla sola sequenza amminoacidica di una proteina, è possibile ottenere sempre più informazioni riguardo il suo fold. Questo studio può essere molto utile per migliorare l’accuratezza dei metodi di predizione di struttura secondaria. 20 dicembre 2004

- Conclusioni - Il lavoro svolto suggerisce come l’applicazione dei metodi computazionali sia ormai diventata di estrema utilità per fornire chiarimenti strutturali e funzionali riguardo le proteine e per formulare ipotesi sulla loro attività biologica, anche se qualunque applicazione pratica di quanto ipotizzato può essere realizzata solo mediante ulteriori studi di tipo sperimentale. Questo lavoro mostra la necessità di sviluppare sempre nuovi strumenti di analisi e di predizioni, capaci di migliorare quelli esistenti, anche nella prospettiva di dover gestire l’impressionante quantità di informazioni, derivate dalla ricerca genomica e proteomica. 20 dicembre 2004

Comunicazioni a Congressi ♦ Susan Costantini, Angelo M. Facchiano, Giovanni Colonna: “Prediction of the three-dimensional structures of proteins by Homology Modelling”, Gruppo di Cooperazione Bioinformatica tra il 15 e il 17 marzo 2002. ♦ S. Costantini, A.M. Facchiano, G. Colonna: “Metodi computazionali e bioinformatici per la predizione della struttura tridimensionale di proteine”, Giornate Scientifiche della Facoltà di Medicina, Seconda Università di Napoli, 4-6 giugno 2002. ♦ S. Costantini, G. Colonna, A.M. Facchiano: “Coeliac disease: studying the interaction of HLA-DQ2 molecule with gluten peptides by computational methods”, Meeting “Gruppo di Cooperazione Bioinformatica” - Frascati – March 28-29, 2003. ♦ Costantini S., Facchiano A.M. and Colonna G.: “Studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca mediante metodi computazionali”, Giornate Scientifiche della Facoltà di Medicina, 4-6 giugno 2003. ♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “Folding ab-initio di proteine: un approccio topologico”, Giornate Scientifiche della Facoltà di Medicina, Seconda Università di Napoli, 4-6 giugno 2003. ♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “Computational issues of a topological approach to protein folding”, Sheffield, 20-22 July 2003. ♦ Susan Costantini, Giovanni Colonna, Mauro Rossi and Angelo M. Facchiano: “Binding of gluten peptides to the celiac disease associated HLA-DQ2 molecule by computational methods”, 8th Gluten Workshop, Viterbo, 8-10 settembre 2003. ♦ Costantini S., Facchiano A.M. and Colonna G.: “Analysis of the three-dimensional structure of Il-1beta/IL-1 receptor complexes by computational methods”, SIB2003, Ferrara, 15-18 Settembre 2003. ♦ Susan Costantini, Giovanni Colonna and Angelo M. Facchiano: “Comparative modelling for predicting the different conformations assumed by a protein during its different activities”, Bits 2004, Padova 26-27 March 2004. ♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “A geometrical approach for protein secondary structure simulations: computational issues”, 2-5 April 2004, Neuchatel, Switzerland. ♦ S. Costantini, G. Colonna and A.M. Facchiano: “Comparative modelling for predicting the different conformations assumed by a protein during its different activities”, SIB-Proteine 2004, Viterbo 20-22 May 2004. ♦ E. Randelli, M. Forlenza, S. Meloni, S. Benedetti, C.J. Secombes, J. Zou, G. Scapigliati, S. Costantini, A. Facchiano, F. Buonocore: “Potential application of sea bass recombinant interleukin-1 in fish vaccination”, SIB-Proteine 2004. ♦ Costantini S., Facchiano A.M., Rossi M., Colonna G.: “Metodi computazionali per lo studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca”, Giornate Scientifiche della Facoltà di Medicina, 9-11 giugno 2004. ♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “Un approccio ab-initio per la simulazione di strutture secondarie di proteine”, Giornate Scientifiche della Facoltà di Medicina, 9-11 giugno 2004. ♦ Angelo M. Facchiano, Susan Costantini, Mauro Rossi, Giovanni Colonna: “Simulation of the Interaction of Gluten Peptides with HLA-DQ2 Molecule to Investigate the Molecolar Basis of Coeliac Disease” ISMB-ECCB 2004, Glasgow, Scotland, UK, July 31-August 4, 2004. ♦ Susan Costantini, Giovanni Colonna, Angelo M. Facchiano: “Prediction of the secondary structure of proteins: the amino acid propensities in proteins belonging to deifferent secondary structural classes”, Nettab 2004 – Network Tools and Applications in Biology, Camerino, Italy, September 5-7, 2004. Comunicazioni a Congressi ♦ Susan Costantini, Angelo M. Facchiano, Giovanni Colonna: “Prediction of the three-dimensional structures of proteins by Homology Modelling”, Gruppo di Cooperazione Bioinformatica tra il 15 e il 17 marzo 2002. ♦ S. Costantini, A.M. Facchiano, G. Colonna: “Metodi computazionali e bioinformatici per la predizione della struttura tridimensionale di proteine”, Giornate Scientifiche della Facoltà di Medicina, Seconda Università di Napoli, 4-6 giugno 2002. ♦ S. Costantini, G. Colonna, A.M. Facchiano: “Coeliac disease: studying the interaction of HLA-DQ2 molecule with gluten peptides by computational methods”, Meeting “Gruppo di Cooperazione Bioinformatica” - Frascati – March 28-29, 2003. ♦ Costantini S., Facchiano A.M. and Colonna G.: “Studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca mediante metodi computazionali”, Giornate Scientifiche della Facoltà di Medicina, 4-6 giugno 2003. ♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “Folding ab-initio di proteine: un approccio topologico”, Giornate Scientifiche della Facoltà di Medicina, Seconda Università di Napoli, 4-6 giugno 2003. ♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “Computational issues of a topological approach to protein folding”, Sheffield, 20-22 July 2003. ♦ Susan Costantini, Giovanni Colonna, Mauro Rossi and Angelo M. Facchiano: “Binding of gluten peptides to the celiac disease associated HLA-DQ2 molecule by computational methods”, 8th Gluten Workshop, Viterbo, 8-10 settembre 2003. ♦ Costantini S., Facchiano A.M. and Colonna G.: “Analysis of the three-dimensional structure of Il-1beta/IL-1 receptor complexes by computational methods”, SIB2003, Ferrara, 15-18 Settembre 2003. ♦ Susan Costantini, Giovanni Colonna and Angelo M. Facchiano: “Comparative modelling for predicting the different conformations assumed by a protein during its different activities”, Bits 2004, Padova 26-27 March 2004. ♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “A geometrical approach for protein secondary structure simulations: computational issues”, 2-5 April 2004, Neuchatel, Switzerland. ♦ S. Costantini, G. Colonna and A.M. Facchiano: “Comparative modelling for predicting the different conformations assumed by a protein during its different activities”, SIB-Proteine 2004, Viterbo 20-22 May 2004. ♦ E. Randelli, M. Forlenza, S. Meloni, S. Benedetti, C.J. Secombes, J. Zou, G. Scapigliati, S. Costantini, A. Facchiano, F. Buonocore: “Potential application of sea bass recombinant interleukin-1 in fish vaccination”, SIB-Proteine 2004. ♦ Costantini S., Facchiano A.M., Rossi M., Colonna G.: “Metodi computazionali per lo studio della struttura e dell’interazione tra le proteine coinvolte nella malattia celiaca”, Giornate Scientifiche della Facoltà di Medicina, 9-11 giugno 2004. ♦ Ceci G., Mucherino A., D’Apuzzo M., di Serafino D., Costantini S., Facchiano A.M. and Colonna G.: “Un approccio ab-initio per la simulazione di strutture secondarie di proteine”, Giornate Scientifiche della Facoltà di Medicina, 9-11 giugno 2004. ♦ Angelo M. Facchiano, Susan Costantini, Mauro Rossi, Giovanni Colonna: “Simulation of the Interaction of Gluten Peptides with HLA-DQ2 Molecule to Investigate the Molecolar Basis of Coeliac Disease” ISMB-ECCB 2004, Glasgow, Scotland, UK, July 31-August 4, 2004. ♦ Susan Costantini, Giovanni Colonna, Angelo M. Facchiano: “Prediction of the secondary structure of proteins: the amino acid propensities in proteins belonging to deifferent secondary structural classes”, Nettab 2004 – Network Tools and Applications in Biology, Camerino, Italy, September 5-7, 2004.

Dott. Francesco Buonocore Università della Tuscia - Ringraziamenti - Tutor: Prof. Giovanni Colonna Dott. Angelo Facchiano - SUN - ISA-CNR, Avellino Dott. Francesco Buonocore Università della Tuscia Dott. Mauro Rossi ISA – CNR, Avellino Marilù Chiusano Gruppo di Bioinformatica dell’ISA-CNR, Avellino Gruppo di ricerca del prof. Malorni del CESMA-ProBio, Avellino 20 dicembre 2004