Analisi della struttura primaria delle proteine

Slides:



Advertisements
Presentazioni simili
Sintesi proteica Prof. Domenico Ripolo.
Advertisements

RICERCA DI SIMILARITA’ IN BANCHE DATI
Dal DNA alle Proteine: Traduzione del Messaggio Genetico
Biologia.blu B - Le basi molecolari della vita e dell’evoluzione
STRUTTURA DUPLICAZIONE SINTESI DELLE PROTEINE
Proteina intatta Ala-Leu-Thr-Pro Ala-Leu-Thr-Pro Endoproteinasi Arg-C
Sottolineare i diversi elementi chimici presenti nei nucleotidi
Il flusso dell’informazione: l’espressione genica
LICEO SCIENTIFICO STATALE “LEONARDO da VINCI” di FIRENZE
Codice genetico, traduzione, sintesi proteica
La Sintesi Proteica.
Introduzione alla bioinformatica
La struttura delle proteine (questa versione è priva delle immagini)
Array di oligonucleotidi
La mutazione genica La mutazione genica è un cambiamento del materiale ereditario di un gene. Un gene è una sequenza di nucleotidi del DNA, che codifica.
Allineamento Metodo bioinformatico che date due o più sequenze ne mette in evidenza similarità/diversità, supponendo che le sequenze analizzate abbiano.
P. CODICE GENETICO E SINTESI PROTEICA
Cap. 6 L’espressione genica: la traduzione pp
È stimato che oggi sulla terra sono presenti
D N A LA MOLECOLA DELLA VITA.
Software per la Bioinformatica
Struttura delle proteine
Prof. Paolo Abis Speranzina Ferraro - 14 dicembre 2006.
SCAN PROSITE ExPASy proteomic tool.
LA TRASCRIZIONE Nella fase di trascrizione la doppia elica di una porzione di DNA viene dapprima svolta… … ad opera di un enzima detto RNA-Polimerasi.
In questa lezione ci occuperemo
Evoluzione del concetto di gene, codice genetico e trascrizione
UNITA’ DIDATTICA: L’RNA
CORSO DI BIOLOGIA - Programma
CORSO DI BIOLOGIA - Programma
Tutorial per l’utilizzo di k ScanProsite
CORSO DI BIOLOGIA - Programma
RNA Acido Ribonucleico Simile al DNA Desossiribosio rimpiazzato da Ribosio Timina (T) rimpiazzata da Uracile (U) RNA può essere: Singolo filamento,
PROTEINE: “TRASCRIZIONE” e “TRADUZIONE”
Sintesi di una proteina Cos’è il patrimonio genetico
Molti composti possono essere ottenuti da culture batteriche
Acidi nucleici e proteine
P. CODICE GENETICO E SINTESI PROTEICA
La “Gene Ontology” Ontologia: studio dell’essere in quanto tale, e delle sue categorie fondamentali Le categorie sono le “classi supreme di ogni predicato.
La doppia elica del DNA 25 aprile 1953:
PROPRIETA’ PRINCIPALI Q UANTITATIVE S TRUCTURE A CTIVITY R ELATIONSHIPS usati come descrittori in studi di.
DNA – REPLICAZIONE (1) Semiconservativa: Catene genitrici
ESERCIZIO SULLA SINTESI PROTEICA
Tiziano Terrani, Liceo cantonale di Lugano SAVOSA
ALIMENTAZIONE E BENESSERE a cura di dott.ssa Donatella Cirimele
Informatica e Bioinformatica – A. A Un altro grande database è UniProt, The Universal Protein Resource ( nel quale.
Analisi di sequenze Iniziamo con operazioni semplici... Il formato FASTA Uso di ReadSeq Esempi.
Allineamento di sequenze
La sintesi proteica La sintesi proteica è il processo che porta alla formazione delle proteine utilizzando le informazioni contenute nel DNA. Si tratta.
AMMINOACIDI E PROTEINE
Una volta stabilito che un insieme di proteine sono tra di loro omologhe posso procedere ad un allineamento multiplo. Il programma più usato a questo scopo.
GRAM + GRAM -.
Sistema di ricerca Entrez Insieme di banche dati contenenti svariati tipi di informazioni biomediche, interrogabile mediante un’unica interfaccia Concetto.
Annotazione strutturale dei genomi
CONFORMAZIONE organizzazione spaziale degli atomi in una proteina STRUTTURA NATIVA conformazione funzionale di una proteina La FUNZIONE di una proteina.
FILE DEI DATABASE FASTA GBFF XML ASN. Formato FASTA Il formato fasta è forse il più utilizzato dai comuni software di ricerca. Esso consiste in un file.
STRUTTURA DUPLICAZIONE SINTESI DELLE PROTEINE
DIAGNOSI MOLECOLARE DI UNA MALATTIA GENETICA E SVILUPPO DI UNA TERAPIA GIUSEPPINA ANDREOTTI M.VITTORIA CUBELLIS.
La Fabbrica delle Proteine
Sintesi proteica Prof. Domenico Ripolo.
Allineamenti Multipli Problema Durante l’evoluzione i residui importanti per il mantenimento della struttura e della funzione sono conservati. Come riconoscere.
Neutri Acidi Basici Glicina GLY G Triptofano TRP W Ac. Aspartico ASP D
Solomon, Berg, Martin Biologia Capitolo 13. Solomon, Berg, Martin – Biologia – Capitolo – Garrod ipotizza che le persone affette da alcaptonuria.
CI di Biologia Molecolare e Cellulare
Assegnazione dei codoni mediante uso di
Daniele Casagrande Argomenti di biologia.
Mutazioni Una modificazione chimica di una base
Interazioni deboli Legami a idrogeno
Transcript della presentazione:

Analisi della struttura primaria delle proteine

La maggior parte degli strumenti per l’analisi della struttura primaria si trovano on-line sul sito www.expasy.org

Translate: traduzione in silico di sequenze nucleotidiche, con possibilità di scegliere i frames e le diverse visualizzazioni (1 lettera, 3 lettere, carattere diverso per lo stop, degenerazioni) Backtranslation: data una sequenza aminoacidica, cerca di “indovinare” la sequenza nucleotidica chiedendo l’organismo di appartenenza, la tavola di uso dei codoni e altre informazioni utili. Graphical Codon Usage Analyser: analizza la strategia di utilizzo dei codoni per ottenere considerazioni sulla espressività della sequenza codificante. CAI calculator: analizza una sequenza codificante per capire, in base a come utilizza i codoni, quanto il gene sarà espresso (non è linkato in expasy).

Strategia dell’analisi dell’uso dei codoni Anche se il codice genetico è degenerato, non tutti i codoni sinonimi vengono utilizzati allo stesso modo. L’abbondanza relativa dei tRNA che portano un dato codone è altamente specie-specifica, quindi questo influenza l’utilizzo dei codoni in qualla specie. E’ stato dimostrato che esiste una relazione diretta tra l’espressione di una proteina e l’utilizzo dei codoni della sua sequenza codificante: un gene altamente espresso tenderà ad utilizzare i codoni che hanno una maggior rappresentanza di anticodoni, ossia una maggior abbondanza di tRNA. => Se conosco i geni altamente espressi di un organismo, posso analizzare le loro sequenze codificanti alla ricerca dei codoni migliori, e utilizzare questo tabella per predire l’espressività di una qualunque sequenza codificante

MultiIdent tool: permette di individuare una proteina non dalla sequenza ma da dati sperimentali come: - una serie di pesi molecolari originati dalla frammentazione con proteasi - una punto isoelettrico stimato e un peso molecolare stimato - la composizione percentuale dei suoi amino acidi PeptideMass: permette di prevedere il peso dei frammenti che si generano da una digestione con proteasi per una più facile identificazione in spettrometria di massa PeptideCutter: analizza tutti i possibili siti di taglio di proteasi o di trattamenti chimici per decidere come lavorare su una proteina

BLAST: è una serie di link alternativi per tutti i possibili Blast residenti su server diversi da quello della NCBI. MPsrch: ricerca in banche dati modificate usando l’algoritmo di Smith & Waterman FASTA3: ricerca in banca dati usando l’algoritmo FASTA e tutte le sue varianti. PropSearch: ricerca in banca dati per proteine non usando la sequenza, ma una serie di dati che il programma ricava (tipo composizione, struttura se presente, idrofobicità ecc.). Utilizza una rete neurale. SAMBA: usa l’algoritmo di Smith & Waterman, ma fa tutto via hardware, con un array di 128 processori e una architettura dedicata.

InterProScan: permette la ricerca incrociata in tutte le banche dati di profili della InterPro Pfam HMM search: analizza la banca Pfam utilizzando gli Hidden Markov Models. FPAT: cerca nelle banche dati utilizzando le espressioni regolari (in formato ProSite) fornite dall’utente. TEIRESIAS: data una serie di proteine, cerca di generare il maggior numero di pattern proteici possibili condivisi dalla maggior parte di essi. I pattern ottenuti possono poi essere utilizzati per la ricerca in banca dati.

ChloroP, LipoP, SignalP: algortimi per la ricerca di sequenze segnale data la sequenza primaria, disponibili nel centro CBS insieme a molti altri strumenti di predizione. MITOPROT, Plasmit, Predotar: algortimi per la ricerca di sequenze per l’indirizzamento mitocondriale NetAcet, NetOGlyc, NetNGlyc: algortimi per la ricerca di sequenze di modificazione post traduzionale. Psort, TargetP: algortimi per la ricerca di caratteristiche che identifichino il compartimento cellulare in cui una proteina dovrebbe trovarsi (es. citoplasma, membrana, nucleo, organelli).

ProtParam: data la sequenza, analizza moltissime caratteristiche chimico-fisiche intrinseche e produce un’analisi statistica delle proprietà della proteina ProtScale: data la sequenza, costruisce dei grafici di scorrimento utilizzando valori specifici per ogni aminoacido corrispondenti a vari aspetti chimico-fisici e non. REP: identifica le regioni ripetute in una proteina, per vedere se può essersi originata es. da una duplicazione genica. Oppure si può cercare in un alineamento multiplo con delle sequenze modello RandSeq: produce una sequenza casuale di cui si può controllare lunghezza e composizione.

Algoritmi a scorrimento di finestre ProtScale è un esempio di questi algoritmi. Ad ogni amino acido è possibile associare un valore numerico che descriva una qualunque caratteristica. In una proteina l’amino acido in se’ non ha una grande importanza, ma conta la sequenza, cioè come i residui si susseguono. Se un algoritmo scorre lungo una proteina, non ha senso nella maggior parte dei casi guardare il valore del singolo residuo, ma è bene considerare una finestra di dimensioni fissate e per ogni punto (per ogni residuo) associare non tanto il suo valore quanto il valore ottenuto da tutta la finestra (per esempio, sommando i vari punteggi). Inoltre, è opportuno pesare diversamente i residui che si trovano a distanze diverse rispetto al centro della finestra.

- Valori di idrofobicità di Kyte & Dolittle - Valori di idrofobicità di Kyte & Dolittle. - Finestra di 9 residui - Peso finestra: lineare Ala: 1.800 Arg: -4.500 Asn: -3.500 Asp: -3.500 Cys: 2.500 Gln: -3.500 Glu: -3.500 Gly: -0.400 His: -3.200 Ile: 4.500 Leu: 3.800 Lys: -3.900 Met: 1.900 Phe: 2.800 Pro: -1.600 Ser: -0.800 Thr: -0.700 Trp: -0.900 Tyr: -1.300 Val: 4.200 MWIDIGDAFLALHNADHKTISHGDLLCPIMLVTKRVLFY