La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Allineamenti di sequenze Misura della somiglianza di 2 geni o

Presentazioni simili


Presentazione sul tema: "Allineamenti di sequenze Misura della somiglianza di 2 geni o"— Transcript della presentazione:

1 Allineamenti di sequenze Misura della somiglianza di 2 geni o
proteine dalle loro sequenze

2 Evoluzione Molecolare
Proteina originaria QUESTAELASEQUENZADIUNAPROTEINA Duplicazione QUESTAELASEQUENZADIUNAPROTEINA Mutazioni puntiformi QUESTAILASECUENZEDOUNAPROTEINA Delezione QUESTAILASECUENZEDOUNA____INA Inserzione QUESTAILANUOVASECUENZEDOUNAINA

3 Individuazione di una proteina progenitrice
QUESTAILANUOVASECUENZEDOUNAINA Proteina 1 QUESTAELASEQUENZADIUNAPROTEINA Proteina 2 SDFNWEOIRHTLKWEFLKFNLSKDFNSLD

4 Allineamento ACVILPEDPSTRYTT CVISPSDPTTRY ACVILPEDPSTRYTT AVISPSDPTTRY
☻ Matches ☻ Mismatches ACVILPEDPSTRYTT || | || ||| AVISPSDPTTRY

5 Punteggio di Identità ACVILPEDPSTRYTT || | || ||| AVISPDDPTTRY
Proteina 1 QUESTAELASEQUENZADIUNAPROTEINA |||||| || ||| QUESTAILANUOVASECUENZEDOUNAINA Identità = 11 Proteina 2 Proteina 1 QUESTAELASEQUENZADIUNAPROTEINA | | SDFNWEOIAHTLKWEFLDFNLSKDFNSLD Identità = 2 Proteina 3

6 Similarità & Omologia Sequenza Originaria Sequenze Omologhe
Duplicazione e/o Speciazione Sequenze Omologhe Evoluzione Sequenze Omologhe e Simili Evoluzione Sequenze Omologhe ma non Simili Sequenze non Omologhe Evoluzione Convergente Sequenze non Omologhe ma Simili

7 Percentuale di Identità
(Identità*2)/ Numero di aminoacidi ACVLLPEDPSTRYTT | | || ||| AVISPDDPTTRY % di identita = 7*2/27 = 0.52 PDDETTY ||| ||| PDDPTTYR % di identita = 6*2/15 = 0.80

8 Allineamenti possibili
ACVILPEDPSTRYTT || | || ||| AVISPDDPTTRY Identità = 8 ACVILPEDPSTRYTT | | AVISPDDPTTRY Identità = 2

9 Ricerca miglior allineamento
Lunghezza: s1=6 s2=6 Numero confronti s1+s2-1 = Caratteri confrontati s1*s2 = 36 ILVVIV | VLVVII ILVVIV || VLVVII ILVVIV ||| VLVVII ILVVIV |||| VLVVII ILVVIV ||||| 2 VLVVII ILVVIV |||||| 4 VLVVII ILVVIV ||||| 1 VLVVII ILVVIV |||| 2 VLVVII ILVVIV ||| 2 VLVVII ILVVIV || 0 VLVVII ILVVIV | 1 VLVVII

10 Inserzioni (Gaps) ALLINEAMISECIRIESCI ALLINEAANCHEMESECIRIESCI
||||||| ALLINEAANCHEMESECIRIESCI ALLINEAMISECIRIESCI | |||||||||| ALLINEAANCHEMESECIRIESCI Identità = 7 Identità = 11 ALLINEA-----MISECIRIESCI ||||||| | |||||||||| ALLINEAANCHEMESECIRIESCI Identità = 18

11 Significato strutturale
ALFAELICAUNO-----ALFAELICADUE |||||||||||| |||||||||||| ALFAELICAUNOLOOOPALFAELICADUE Loop Alfa elica Alfa elica

12 Allineamenti con gaps ACD EFG E-FG E—FG A-CD EF-G A-C-D AC-D AC--D

13 Matrici di allineamento
YASEN-YMAWEPUENZA I--OTOUN-SOQ Y A S E N M W P U Z I O T Q

14 Allineamenti possibili
U A E Q Z IOSONUNASEQUENZA IONO---UNS--OQ IOSONUNASEQUENZA ION---OU----N--SOQ IOSONU-NA--SEQUENZA IONOUNSOQ Non valido

15 Matrice di punti I O S U N A E Q Z * * = Identità

16 Matrice di punti I O S U N A E Q Z * * = Identità

17 Regioni di identità I O S U N A E Q Z * * = Identità

18 Matrice di punti reale

19 Duplicazioni I Q U E N Z A S * O * = Identità

20 Inversioni I O S U N A E Z Q * * = Identità

21 Analisi delle matrici di punti
Duplicazione Inversione Regioni di identità

22 Ricerca allineamento I O S N U A E Q Z +1 +0 Inizio Punteggi Fine
IOSONUNASEQUENZA || | || | | IONO-UN-SOQ Identità = 7

23 Programmazione dinamica
S N U A E Q Z 1 Punteggi +1 +0

24 Programmazione dinamica
S N U A E Q Z 1 1 Punteggi +1 +0

25 Programmazione dinamica
S N U A E Q Z 1 1 Punteggi 1 +1 +0

26 Programmazione dinamica
S N U A E Q Z 1 1 Punteggi 1 2 +1 +0

27 Ricerca direzione migliore
y x ? d y x ? d + 1 ? = il maggiore fra x y d ? = il maggiore fra x y 2 1 ? = 3 ? = 2 = 2 1 = 1 2 1 3

28 Programmazione dinamica
S N U A E Q Z 1 2 3 Punteggi +1 +0 3

29 Programmazione dinamica
S N U A E Q Z 1 2 3 4 5 6 7 Punteggi +1 +0 IOSONUNASEQUENZA || | || | | IONO-UN-SOQ IOSON-UNASEQUENZA || | || | | IO--NOUN-SOQ

30 Penalità per apertura gaps
a) IOSONOUNASEQUENZA 1) IOSONOUNOSEQUENZO Mutazione 2) IOSONOUNSEQUENZO Delezione a) IOSONOUNASEQUENZA |||||||| ||||||| 1) IOSONOUNOSEQUENZO Identità = 15 a) IOSONOUNASEQUENZA |||||||| ||||||| 2) IOSONOUN-SEQUENZO Identità = 15-2 = 13 GAP insertion penalty = -2 per ogni nuovo gap inserito

31 Penalità per estensione gaps
a) IOSONOUNASEQUENZA 1) ISONOUNSEQENZO 2) IOSONOSEQUENZO a) IOSONOUNASEQUENZA | |||||| ||| ||| 1) I-SONOUN-SEQ-ENZO Identità = 13 – = 7 a) IOSONOUNASEQUENZA |||||| ||||||| 2) IOSONO---SEQUENZO Identità = = 9 GAP extension penalty = -1 per ogni estensione di un gap già presente

32 Significato strutturale
ALFAELICAUNOALFAELICADUE ALFAELICAUNOLALFAELICADUE apertura gap ALFAELICAUNOLOOOPALFAELICADUE estensione gap Apertura gap Estensione gap

33 Penalità per gaps I O S N U A E Q Z IOSON-UNASEQUENZA | || || | |
| || || | | I--ONOUN-SOQ I O S N U A E Q Z

34 PD con gap penalties d y x ? d y x ? 3 2 4 ? 3 2 4 d + 1
? = il maggiore fra x - 2 y - 2 d ? = il maggiore fra x - 2 y - 2 3 2 4 ? 3 = 3 ? = 4 – 2 = 2 2 – 2 = 0 3 2 4

35 PD con gap penalties I O S N U A E Q Z +1 +0 -2 -2 Punteggi
1 2 3 4 Punteggi +1 +0 -2 -2 IOSONUNASEQUENZA || | | IONOUNSOQ

36 Classi di aminoacidi K R H T S L G I C A V P F Y D E W -OH Piccoli
Positivi T S L G I C A Polari V Q P M N F Y Idrofobici D E W Negativi Aromatici

37 Punteggio di similarità
| Aminoacidi identici = 2 punti . Aminoacidi simili = 1 punto Aminoacidi diversi = 0 punti ARVILPEDPSTRYTT ||.|. |.| | AVIVPDQPTTEY Similarità = 6*2 + 3*1 = 15

38 Matrice di sostituzione
F G H I K L M N P Q R S T V W Y 2 1

39 Calcolo con matrice A C D E F 2 1 … Un allineamento AAADE
| .. ADCEC Punteggio = AA + AD + AC + DE + EC =

40 ARVILPEDDPSTRYYYTT AVIVPD-QPTT----EY Punteggio di similarità
5 Coppie identici = 2 punti 3 Coppie simili = 1 punto 4 Coppie diversi = 0 punti 2 Inserzione Gap = -2 punti 3 Estensione Gap = -1 punto Similarità = 5*2 + 3*1 – 2*2 – 3*1 = 6

41 Una vera matrice di sostituzione
F G H I K L M N P Q R S T V W Y 2 -2 -4 1 -1 -6 -3 12 -5 -8 4 3 8 6 5 17 10

42 Needleman & Wunsch I V S N Y E Q W A Punteggi +2 +1 +0

43 Needleman & Wunsch d y x ? d y x ? d y x ? 3 2 7 ? 3 2 7 5 d + 2
= 4 ? = 7 – 2 = 5 2 – 2 = 0 3 2 7 5

44 Needleman & Wunsch I V S N Y E Q W A +2 +1 +0 Punteggi
4 5 3 7 8 9 6 10 12 Punteggi +2 +1 +0 IVSVNYESSVQYENWA ||.| | .||| IVNV-Y-NSVQ IVSVNYESSVQYENWA ||. .||| IVNVYNSVQ

45 Locale e Globale Allineamento globale Allineamento locale
LTGARDWEDIPLWTDWDIEQESDFKTRAFGTANCHE  ||   | |  |   |     |  ||  || | |  TGIPLWTDWDLEQESDNSCNTDHYTREWGTMNAHKAG Punteggio di Identità = 13 Allineamento locale LTGARDWEDIPLWTDWDIEQESDFKTRAFGTANCHKE          |||||||| |||||        TGIPLWTDWDLEQESDNSCNTDHYTREWGTMNAHKAG Punteggio di Identità = 13

46 Significato Biologico
Allineamento globale Allineamento locale

47 Algoritmi locali e globali
S N U A E Q Z IOSONUNASEQUENZA ION---OU----N--SOQ U-NAS NOUNS Globale Locale

48 Smith-Waterman I V S N E Y W A Q 2 4 6 3 8 5 1 Punteggi +2 +0 -2 -2 -2

49 Smith-Waterman I V S N E Y W A Q IVSVNVEYNWAYENWA ||| || IVNV-YNSVQ 2
4 6 3 8 5 1 IVSVNVEYNWAYENWA ||| || IVNV-YNSVQ


Scaricare ppt "Allineamenti di sequenze Misura della somiglianza di 2 geni o"

Presentazioni simili


Annunci Google