La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze.

Presentazioni simili


Presentazione sul tema: "Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze."— Transcript della presentazione:

1 Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze

2 RICERCA DI SIMILARITA E ALLINEAMENTO DI SEQUENZE BLAST e PSI-BLAST FASTA oppure

3 Alcune caratteristiche dei tools più usati: BLAST (Basic Local Alignment Search Tool), sviluppato dal National Center for Biotechnology Information, NCBI): - allineamento locale - estremamente veloce - parte cercando brevi frammenti della sequenza, che poi prova ad estendere - usa una matrice di sostituzione in entrambe le fasi del processo di allineamento (scansione del database e estensione della subsequenza): più preciso ha quattro opzioni fondamentali: BLASTP: confronta sequenze proteiche contro un database proteico BLASTN: confronta sequenze nuclotidiche contro un database nucleotidico TBLASTN: confronta una sequenza proteica contro un database nucleotidico, traducendo ciascuna sequenza del database nucleotidico nei suoi 6 frames di lettura BLASTX: confronta una sequenza nucleotidica contro un database proteico, dopo averla tradotta nei suoi 6 frames di lettura.

4 BLAST:

5 BLASTP

6 Penalità assegnata ai gap Dimensione delle parole Scelta della matrice di sostituzione Numero atteso di HSP (High- scoring Segment Pair) valutato su base statistica Seconda parte della pagina di BLAST: I valori di default usati da BLAST sono W=3, T=13, Matrice=BLOSUM 62

7 Terza parte della pagina di BLAST:

8 FASTA: Vari database Sequenza in formato FASTA Ktup: lunghezza delle parole Align: numero di allineamenti finali Open e residue: Penalità per i gap

9 Allineamento di due sequenze : BLAST: bl2seq LALIGN: EMBOSS:

10 LALIGN:

11 ALLINEAMENTO MULTIPLO DI SEQUENZE Informazione biologica maggiore rispetto a quella riportata lallineamento di due sole sequenze: i residui più importanti dal punto di vista strutturale o funzionale saranno estremamente conservati tra tutte le sequenze dellallineamento. Una sequenza amminoacidica fa la timida; un paio di sequenze omologhe sussurrano; molte sequenze allineate gridano. Per essere informativo un allineamento multiplo dovrebbe contenere una distribuzione di sequenze sia strettamente sia lontanamente correlate: Svantaggi: tutte strettamente correlate => ridondanza tutte lontanamente correlate => allineamento inaccurato => inutilità

12 ALLINEAMENTO MULTIPLO DI SEQUENZE

13 Programmi per lallineamento multiplo globale: CLUSTALW: o scaricare il programma eseguibilehttp://www.ebi.ac.uk/clustalw/ KALIGN Multalin TCOFFEE

14 CLUSTAL W: -il tool più comune utilizzato per lallineamento multiplo di sequenza: - potenziato per allineamenti di sequenze proteiche divergenti favorisce lapertura di gaps in regioni in cui è potenzialmente presente un loop piuttosto che una struttura secondaria ordinata (in base a una penalità residuo-specifica e a una penalità ridotta in regioni idrofiliche) favorisce lapertura di gaps nelle stesse posizioni.


Scaricare ppt "Ricerca di similarità di sequenza (FASTA e BLAST) Allineamento di due sequenze Allineamento multiplo di sequenze."

Presentazioni simili


Annunci Google