Predizione della Struttura Terziaria. Perchè predire la struttura terziaria? In cifre: –2.000.000+ sequenze proteiche –~ 30,000 strutture, ~ 7,000.

Slides:

Advertisements

Presentazioni simili

Misure ed Errori Prof Valerio CURCIO.

Advertisements

Struttura delle proteine

I protidi o proteine Le proteine sono i costituenti fondamentali degli organismi viventi e occupano una posizione primaria nell'architettura e nelle funzioni.

RISPOSTA DI SISTEMI ANELASTICI

Gestione della memoria centrale

ANNO SCOLASTICO 2009/2010 QUARTA PROVA ESAME DI STATO ANALISI DI ALCUNI QUESITI.

Marcatori Molecolari Introduzione Marcatori proteici DNA

Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Ontologie Lessicali Multilingua:

Perchè predire la struttura terziaria?

PROSITE contiene anche pattern ad ALTA OCCORRENZA, corti e aspecifici (modifiche post-traduzionali) Es. phosphorylation by CK2 [ST]-x(2)-[DE]

Esercizio 1 Un condensatore piano di area A=40 cm2 e distanza tra i piatti d=0.1 mm, e` stato caricato collegandolo temporaneamente ad un generatore di.

Analisi Fattoriale Esplorativa

Predizione della Struttura Terziaria.

Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.

BASI DI DATI BIOLOGICHE - 3

Teoria dei Sistemi - Esercitazioni TEORIA DEI SISTEMI Dalla descrizione generica di un fenomeno alla costruzione di un modello SD 1. Front office / back.

La forma normale di un’equazione di secondo grado è la seguente:

Dinamica di corpi deformabili basata sulle posizioni

UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA DIPARTIMENTO DI INFORMATICA E SISTEMISTICA MODEL BASED CONTROL ALESSANDRO DE CARLI ANNO ACCADEMICO

MODELLAZIONE DELLA RISPOSTA NON LINEARE

Dinamica Molecolare.

Studente Claudia Puzzo

Metodi basati sulle similitudini per dedurre la funzione di un gene

Analisi dei gruppi – Cluster Analisys

Metodi numerici per l’approssimazione

Metodi numerici per lapprossimazione Laboratorio di Metodi Numerici a.a. 2008/2009 Prof. Maria Lucia Sampoli.

Allineamento Metodo bioinformatico che date due o più sequenze ne mette in evidenza similarità/diversità, supponendo che le sequenze analizzate abbiano.

Parametri di un motore passo-passo

Homology modelling L’omology modeling delle proteine è il tipo di predizione di struttura terziaria più semplice ed affidabile. Viene richiesta soltanto.

Struttura delle proteine

Esistono 3 metodi principali di predizione:

Come si può studiare la struttura di una proteina

Unita’ Naturali.

Fisica Computazionale applicata alle Macromolecole

INGEGNERIA PROTEICA.

Applicazioni Matematiche e tecnologie delle macchine automatiche

Tutorial per l’utilizzo di k ScanProsite

MUTAZIONE: cambio di un bit Viene effettuata con bassa frequenza, ad es. 1bit ogni 1000 Ha la funzione di recupero di eventuali perdite di informazione.

Whole-body dynamic behavior and control of human-like robots. Analisi di un articolo del dipartimento di scienze informatiche dell’università di Stanford.

Esempio di utilizzo del programma BLAST disponibile all’NCBI

Misure ed Errori.

Determinazione della fase

Il residuo nella predizione

Microsoft Access Chiavi, struttura delle tabelle.

Sistemi basati su conoscenza Metodi di ricerca informata Prof. M.T. PAZIENZA a.a

Sistemi basati su conoscenza Metodi di ricerca informata Prof. M.T. PAZIENZA a.a

1 Laboratorio di Introduzione alla Programmazione §II MODULO §3 crediti §Esame e voto unico (su 6 crediti totali)

1 Laboratorio di Introduzione alla Programmazione §II MODULO §3 crediti §Esame e voto unico (su 6 crediti totali)

Allineamento di sequenze

Una volta stabilito che un insieme di proteine sono tra di loro omologhe posso procedere ad un allineamento multiplo. Il programma più usato a questo scopo.

Allineamento di sequenze Perché è importante? Le caratteristiche funzionali delle molecole biologiche dipendono dalle conformazione tridimensionale che.

Sistema di ricerca Entrez Insieme di banche dati contenenti svariati tipi di informazioni biomediche, interrogabile mediante un’unica interfaccia Concetto.

CONFORMAZIONE organizzazione spaziale degli atomi in una proteina STRUTTURA NATIVA conformazione funzionale di una proteina La FUNZIONE di una proteina.

A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle Prof.

Proprietà macromolecolari Il calcolo delle proprietà macromolecolari implica l’utilizzo della statistica della catena polimerica in termini di distanze.

STRUTTURE DI MACROMOLECOLE & BANCHE DATI STRUTTURALI.

GEOGEBRA PER LA SCUOLA GEOGEBRA PER LA SCUOLA CORSO INTRODUTTIVO A GEOGEBRA Sergio Zoccante Maria Angela Chimetto Padova, 24 marzo GeoGebra Institute.

  Disegno assistito dal computer STRATEGIE PER LA RICERCA DEI NUOVI LEADS Computer-assisted design utilizza la chimica computazionale per al scoperta.

MetrologiaVittore Carassiti - INFN FE1 METROLOGIA.

Struttura degli anticorpi Gli anticorpi sono costituiti da polipeptidi che presentano regioni costanti e variabili. Le catene pesanti e leggere di una.

Esempio di allineamento Due regioni simili delle proteine di Drosophila melanogaster Slit e Notch SLIT_DROME FSCQCAPGYTGARCETNIDDCLGEIKCQNNATCIDGVESYKCECQPGFSGEFCDTKIQFC..:.:

Clonaggio funzionale Clonaggio posizionale Conoscenza proteina Malattia genetica Determinazione sequenza amminoac.Mappatura genetica con marcatori polimorfici.

INTRODUZIONE ALL’ANALISI DELLA VARIANZA

Filament Winding Tradizionale

Allineamenti Multipli Problema Durante l’evoluzione i residui importanti per il mantenimento della struttura e della funzione sono conservati. Come riconoscere.

V. Carassiti - INFN FE 1 Calcolo con Elementi Finiti.

Se A e B sono variabili random statisticamente indipendenti P (2) (B,A)=P(B)P(A) P(A)=probabilità che la variabile stocastica A assuma un certo valore.

Le frazioni A partire da N vogliamo costruire un nuovo insieme numerico nel quale sia sempre possibile eseguire la divisione. Per fare ciò dobbiamo introdurre.

Servizi web per la bioinformatica strutturale

Protein Structure Prediction

Transcript della presentazione:

Predizione della Struttura Terziaria

Perchè predire la struttura terziaria? In cifre: – sequenze proteiche –~ 30,000 strutture, ~ 7,000 uniche –La distanza tra sequenze e strutture note si sta allargando. Metodi computazionali –Veloci (minuti o ore), poco costosi (PC) –Soluzioni corrette ca. nel 60% dei casi. –Risoluzione più bassa, però spesso sufficiente per spiegare la funzione proteica Osservazione: La sequenza si evolve più rapidamente della struttura ( Chothia & Lesk, 1986 ) –Numero limitato di fold (< 1,000 ?) SequenzeComparative ModelsStrutture

Metodi predittivi »Comparative modeling > 30% similitudine »Threading/Fold recognition 0 – 30% similitudine »Ab initio nessun omologo

Qualità del modello comparativo Identità di sequenza: %Confrontabile con NMR media qualita’ Specificità di substrato 30-60%Molecular replacement in cristallografia Partenza per site-directed mutagenesis <30%Gravi errori

Building by homology (Homology modelling) G Y M A A A A K S T A A G G G Y F F Y L E D A V V V V L V I L S E D S Allineamento con proteine a struttura nota Modello strutturale

Fold recognition (Threading) Sequenza: + Motivi strutturali noti SLVAYGAAM Modello strutturale

Ab initio Sequenza SLVAYGAAM Modello strutturale

General Flowchart

Un numero grandissimo di polipeptidi si struttura in un numero finito (e relativamente piccolo) di folds Almeno una proteina su due di quelle presenti nel database ha un omologo (identità > 30%) che quasi sempre ha lo stesso fold. Building by homology

Allineamento Ricerca in database per trovare sequenze omologhe con struttura nota. Assegna le posizioni di residui equivalenti fra target e templato. Determina inserzioni e delezioni. L‘allineamento determina la qualità del modello che si sta costruendo. L‘allineamento di sequenza non è sempre ottimale per construire i modelli.

Costruire il modello comparativo 1)Cercare il massimo numero di omologhi che possiedano una entry nel PDB. Strumenti che utilizzano PSSM sono più sensibili. In questo caso vengono utilizzate sequenze senza struttura per costruire la PSSM. 2)Costruire un accurato allineamento multiplo tra la sequenza da modellare e tutte le entries che verranno utilizzate come templato.

Costruzione del pre-modello La struttura del templato viene utilizzata come “stampo“ per costruire il modello seguendo l‘allineamento. Le coordinate 3D dei residui strutturalmente conservati si possono copiare direttamente. Le regioni variabili della struttura (generalmente loop) non si possono copiare. flexible conserved

Dalla sequenza al modello Raw model Loop modeling Side chain placement Refinement

Costruire il modello stesso Determinare la struttura secondaria in base all’allineamento Costruire le regioni conservate. Per ciascuna regione possiamo prendere le coordinate del frammento con la maggior similarità di sequenza. Costruire le regioni variabili, solitamente loops.

Loop modeling Al pre-modello possono mancare interi frammenti di catena principale –non conservati nella famiglia proteica –Inserzioni –Delezioni Descrizione del problema: –Si cerca un fold che colleghi il frammento N-terminale (pre- loop) con quello C-terminale (post-loop) tramite k residui –( ,  ) sono gli unici parametri liberi Metodi di database –Estrai frammenti di loop dalla PDB. Scegli il frammento che rispetta meglio i vincoli geometrici. Metodi ab initio –Genera molti frammenti alternativi basati sui vincoli geometrici (angoli torsionali). Seleziona il frammento “migliore“. loop post-looppre-loop

Catene laterali Problema: Applicando le coordinate del templato sulla sequenza del target cambiano tipo, dimensione e posizione delle catene laterali. Rotameri 3 posizioni per angolo torsionale  Interdipendenza, effetto domino L‘RMSD cambia relativamente poco, però possono cambiare le conformazioni di residui importanti (p.es. del sito attivo) Dove possibile è meglio mantenere le conformazioni delle catene laterali del templato. Esistono metodi standard per risolvere questo problema.

SER SER SER Esempio di libreria di rotameri TYR TYR TYR TYR TYR TYR

Trovare strutture di proteine la cui sequenza è simile allineamento Modello strutturale Verifica OK!

Refinement Per ridurre tutti quei piccoli errori che si accumulano durante il processo di modelling si può ricorrere ai campi di forza (p.es. CHARMM o AMBER) per minimizzare l‘energia del modello. –Riducono le collisioni molecolari e rendono il modello “più bello“. –Non modificano significativamente il modello e richiedono relativamente tanto tempo di calcolo. –In caso di eccesso possono incrementare l‘RMSD complessiva del modello.

Catene laterali Scostamento Loops Allineamento erratoTemplato errato Errori tipici

Struttura reale Predizione

SWISS-MODEL Modeller WhatIf 3D-JIGSAW tml CPHmodels SDSC1