La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Allineamenti di sequenze Misura della somiglianza di 2 geni o proteine dalle loro sequenze.

Presentazioni simili


Presentazione sul tema: "Allineamenti di sequenze Misura della somiglianza di 2 geni o proteine dalle loro sequenze."— Transcript della presentazione:

1 Allineamenti di sequenze Misura della somiglianza di 2 geni o proteine dalle loro sequenze

2 Evoluzione Molecolare QUESTAELASEQUENZADIUNAPROTEINA Duplicazione QUESTAELASEQUENZADIUNAPROTEINA Mutazioni puntiformi QUESTAILASECUENZEDOUNAPROTEINA Delezione QUESTAILASECUENZEDOUNA____INA Inserzione QUESTAILANUOVASECUENZEDOUNAINA Proteina originaria

3 Individuazione di una proteina progenitrice QUESTAELASEQUENZADIUNAPROTEINA QUESTAILANUOVASECUENZEDOUNAINA Proteina 1 SDFNWEOIRHTLKWEFLKFNLSKDFNSLD Proteina 2

4 Matches Mismatches ACVILPEDPSTRYTT AVISPSDPTTRY ACVILPEDPSTRYTT || | || ||| AVISPSDPTTRY CVISPSDPTTRY ACVILPEDPSTRYTT Allineamento

5 Punteggio di Identità Identità = 8 ACVILPEDPSTRYTT || | || ||| AVISPDDPTTRY QUESTAELASEQUENZADIUNAPROTEINA |||||| || ||| QUESTAILANUOVASECUENZEDOUNAINA Proteina 1 Proteina 2 | | SDFNWEOIAHTLKWEFLDFNLSKDFNSLD Proteina 3 QUESTAELASEQUENZADIUNAPROTEINA Proteina 1 Identità = 11 Identità = 2

6 Similarità & Omologia Sequenze Omologhe e Simili Sequenze Omologhe Duplicazione e/o Speciazione Evoluzione Sequenza Originaria Sequenze Omologhe ma non Simili Evoluzione Sequenze non Omologhe ma Simili Sequenze non Omologhe Evoluzione Convergente

7 Percentuale di Identità % di identita = 7*2/27 = 0.52 ACVLLPEDPSTRYTT | | || ||| AVISPDDPTTRY PDDETTY ||| ||| PDDPTTYR (Identità*2)/ Numero di aminoacidi % di identita = 6*2/15 = 0.80

8 Allineamenti possibili Identità = 8 ACVILPEDPSTRYTT || | || ||| AVISPDDPTTRY Identità = 2 ACVILPEDPSTRYTT | | AVISPDDPTTRY

9 ILVVIV |||| 0 VLVVII ILVVIV | 1 VLVVII ILVVIV ||||| 1 VLVVII ILVVIV || 0 VLVVII ILVVIV ||||| 2 VLVVII ILVVIV || 1 VLVVII ILVVIV |||| 2 VLVVII ILVVIV | 1 VLVVII ILVVIV |||||| 4 VLVVII ILVVIV ||| 0 VLVVII ILVVIV ||| 2 VLVVII Lunghezza: s1=6 s2=6 Numero confronti s1+s2-1 = 13 Caratteri confrontati s1*s2 = 36 Ricerca miglior allineamento

10 Inserzioni (Gaps) ALLINEAMISECIRIESCI ALLINEAANCHEMESECIRIESCI ALLINEAMISECIRIESCI ||||||| ALLINEAANCHEMESECIRIESCI ALLINEAMISECIRIESCI | |||||||||| ALLINEAANCHEMESECIRIESCI ALLINEA-----MISECIRIESCI ||||||| | |||||||||| ALLINEAANCHEMESECIRIESCI Identità = 7Identità = 11 Identità = 18

11 Significato strutturale ALFAELICAUNO-----ALFAELICADUE |||||||||||| ALFAELICAUNOLOOOPALFAELICADUE Alfa elica Loop

12 Allineamenti con gaps ACD EFG ACD E-FG ACD EFG A-CD EF-G A-C-D EF-G AC-D E-FG A-C-D EFG ACD EF-G ACD EFG AC-D EFG AC--D EFG A-CD EF-G A-CD E-F-G ACD E-F-G AC-D EF-G ACD EF-G ACD EFG AC-D EFG AC--D EFG A-CD E-FG AC-D E-F-G A-C-D EFG AC-D EF-G ACD EFG AC-D EFG A--CD EFG A-CD E-FG A--CD EFG A-C-D E-FG A-CD EF-G ACD EFG A-CD EFG A--CD EFG AC-D E-FG A-CD EFG ACD EF--G ACD E-FG ACD EF-G A-CD EFG ACD E-F-G AC-D E-FG ACD EFG ACD EFG ACD E-FG

13 Matrici di allineamento YASENYMAWEPUENZA I O T O U N S O Q YASEN-YMAWEPUENZA I--OTOUN-SOQ

14 Allineamenti possibili IOSONUNASEQUENZA I O N O U N S O Q IOSONUNASEQUENZA IONO---UNS--OQ IOSONUNASEQUENZA ION---OU----N--SOQ IOSONU-NA--SEQUENZA IONOUNSOQ Non valido

15 Matrice di punti IOSOSUNASEQUENZA I* O** N** O** U** N** S*** O** Q* * = Identità

16 Matrice di punti IOSOSUNASEQUENZA I* O** N** O** U** N** S*** O** Q* * = Identità

17 Regioni di identità IOSOSUNASEQUENZA S*** Q* U** E** N*** Z** A** O** I* * = Identità

18 Matrice di punti reale

19 Duplicazioni IQUENZNASEQUENZA S* Q** U** E*** N**** Z*** A** O I* * = Identità

20 Inversioni IOSOSUNASEAZNEUQ S*** Q* U** E** N** Z** A** O** I* * = Identità

21 Analisi delle matrici di punti Regioni di identità Inversione Duplicazione

22 IOSONUNASEQUENZA I O N O U N S O Q Punteggi Inizio Fine Ricerca allineamento IOSONUNASEQUENZA || | || | | IONO-UN-SOQ Identità = 7

23 Programmazione dinamica IOSONUNASEQUENZA I O N O U N S O Q Punteggi

24 Programmazione dinamica IOSONUNASEQUENZA I O N O U N S O Q Punteggi

25 Programmazione dinamica IOSONUNASEQUENZA I O N O U N S O Q Punteggi

26 Programmazione dinamica IOSONUNASEQUENZA I O N O U N S O Q Punteggi

27 d + 1 ? = il maggiore frax ydyx? = 3 ? =2 = 2 1 = 1 dyx? d ? = il maggiore frax y Ricerca direzione migliore212?2123

28 Programmazione dinamica IOSONUNASEQUENZA I O N O U N S O Q Punteggi

29 Programmazione dinamica IOSONUNASEQUENZA I O N O U N S O Q IOSONUNASEQUENZA || | || | | IONO-UN-SOQ IOSON-UNASEQUENZA || | || | | IO--NOUN-SOQ Punteggi +1 +0

30 Penalità per apertura gaps a) IOSONOUNASEQUENZA |||||||| ||||||| 1) IOSONOUNOSEQUENZO a) IOSONOUNASEQUENZA |||||||| ||||||| 2) IOSONOUN-SEQUENZO Identità = 15 Identità = 15-2 = 13 a) IOSONOUNASEQUENZA 1) IOSONOUNOSEQUENZOMutazione 2) IOSONOUNSEQUENZODelezione GAP insertion penalty = -2 per ogni nuovo gap inserito

31 Penalità per estensione gaps a) IOSONOUNASEQUENZA | |||||| ||| ||| 1) I-SONOUN-SEQ-ENZO Identità = 13 – = 7 a) IOSONOUNASEQUENZA 1) ISONOUNSEQENZO 2) IOSONOSEQUENZO GAP extension penalty = -1 per ogni estensione di un gap già presente a) IOSONOUNASEQUENZA |||||| ||||||| 2) IOSONO---SEQUENZO Identità = = 9

32 Significato strutturale ALFAELICAUNOALFAELICADUE ALFAELICAUNOLALFAELICADUE apertura gap ALFAELICAUNOLOOOPALFAELICADUE estensione gap Apertura gap Estensione gap

33 Penalità per gaps IOSONUNASEQUENZA I O N O U N S O Q IOSON-UNASEQUENZA | || || | | I--ONOUN-SOQ

34 d + 1 ? = il maggiore frax - 2 y - 2 dyx? 3 = 3 ? =4 – 2 = 2 2 – 2= 0 PD con gap penaltiesdyx? d ? = il maggiore frax - 2 y ? 3243

35 PD con gap penalties IOSONUNASEQUENZA I O N O U N S O Q IOSONUNASEQUENZA || | | IONOUNSOQ Punteggi

36 Classi di aminoacidi I L V G A E D FY W K H C P Idrofobici Polari Positivi R S T Aromatici Negativi Piccoli Q N -OH M

37 Punteggio di similarità Similarità = 6*2 + 3*1 = 15 ARVILPEDPSTRYTT ||.|. |.| | AVIVPDQPTTEY | Aminoacidi identici = 2 punti. Aminoacidi simili = 1 punto Aminoacidi diversi = 0 punti

38 Matrice di sostituzione ACDEFGHIKLMNPQRSTVWY A C D21 E2 F G H211 I21111 K21 L2111 M N21111 P211 Q2111 R2 S21 1 T21 V21 W21 Y2

39 Calcolo con matrice ACDEF A21… C2… D21… E2… F… AAADE |.. ADCEC Punteggio = AA + AD + AC + DE + EC = Un allineamento

40 Punteggio di similarità Similarità = 5*2 + 3*1 – 2*2 – 3*1 = 6 ARVILPEDDPSTRYYYTT AVIVPD-QPTT----EY 5 Coppie identici = 2 punti 3 Coppie simili = 1 punto 4 Coppie diversi = 0 punti 2 Inserzione Gap = -2 punti 3 Estensione Gap = -1 punto

41 ACDEFGHIKLMNPQRSTVWY A C D E F G H I K L M N P Q R S T V4-6-2 W170 Y10 Una vera matrice di sostituzione

42 Needleman & Wunsch IVSVNYESSVQYENWA I V N V Y N S V Q Punteggi

43 Needleman & Wunschdyx? d + 2 ? =x - 2 y - 2 d + 1 ? =x - 2 y - 2 d ? =x - 2 y - 2 dyx?dyx? 327? = 4 ? =7 – 2 = 5 2 – 2=

44 Needleman & Wunsch IVSVNYESSVQYENWA I V N V Y N S V Q IVSVNYESSVQYENWA ||.| |.||| IVNV-Y-NSVQ IVSVNYESSVQYENWA ||..||| IVNVYNSVQ Punteggi

45 Locale e Globale LTGARDWEDIPLWTDWDIEQESDFKTRAFGTANCHE || | | | | | || || | | TGIPLWTDWDLEQESDNSCNTDHYTREWGTMNAHKAG LTGARDWEDIPLWTDWDIEQESDFKTRAFGTANCHKE |||||||| ||||| TGIPLWTDWDLEQESDNSCNTDHYTREWGTMNAHKAG Allineamento globale Allineamento locale Punteggio di Identità = 13

46 Significato Biologico Allineamento globale Allineamento locale

47 Algoritmi locali e globali IOSONUNASEQUENZA I O N O U N S O Q IOSONUNASEQUENZA ION---OU----N--SOQ U-NAS NOUNS GlobaleLocale

48 Smith-Waterman IVSVNVEYNWAYENWA I V N V Y N S V Q Punteggi

49 Smith-Waterman IVSVNVEYNWAYENWA I V N V Y N S V Q IVSVNVEYNWAYENWA ||| || IVNV-YNSVQ


Scaricare ppt "Allineamenti di sequenze Misura della somiglianza di 2 geni o proteine dalle loro sequenze."

Presentazioni simili


Annunci Google