La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Allineamenti di sequenze Misura della somiglianza di 2 geni o proteine dalle loro sequenze.

Presentazioni simili


Presentazione sul tema: "Allineamenti di sequenze Misura della somiglianza di 2 geni o proteine dalle loro sequenze."— Transcript della presentazione:

1 Allineamenti di sequenze Misura della somiglianza di 2 geni o proteine dalle loro sequenze

2 Evoluzione Molecolare QUESTAELASEQUENZADIUNAPROTEINA Duplicazione QUESTAELASEQUENZADIUNAPROTEINA Mutazioni puntiformi QUESTAILASECUENZEDOUNAPROTEINA Delezione QUESTAILASECUENZEDOUNA____INA Inserzione QUESTAILANUOVASECUENZEDOUNAINA Proteina originaria

3 Individuazione di una proteina progenitrice QUESTAELASEQUENZADIUNAPROTEINA QUESTAILANUOVASECUENZEDOUNAINA Proteina 1 SDFNWEOIRHTLKWEFLKFNLSKDFNSLD Proteina 2

4 Matches Mismatches ACVILPEDPSTRYTT AVISPSDPTTRY ACVILPEDPSTRYTT || | || ||| AVISPSDPTTRY CVISPSDPTTRY ACVILPEDPSTRYTT Allineamento

5 Punteggio di Identità Identità = 8 ACVILPEDPSTRYTT || | || ||| AVISPDDPTTRY QUESTAELASEQUENZADIUNAPROTEINA |||||| || ||| QUESTAILANUOVASECUENZEDOUNAINA Proteina 1 Proteina 2 | | SDFNWEOIAHTLKWEFLDFNLSKDFNSLD Proteina 3 QUESTAELASEQUENZADIUNAPROTEINA Proteina 1 Identità = 11 Identità = 2

6 Similarità & Omologia Sequenze Omologhe e Simili Sequenze Omologhe Duplicazione e/o Speciazione Evoluzione Sequenza Originaria Sequenze Omologhe ma non Simili Evoluzione Sequenze non Omologhe ma Simili Sequenze non Omologhe Evoluzione Convergente

7 Percentuale di Identità % di identita = 7*2/27 = 0.52 ACVLLPEDPSTRYTT | | || ||| AVISPDDPTTRY PDDETTY ||| ||| PDDPTTYR (Identità*2)/ Numero di aminoacidi % di identita = 6*2/15 = 0.80

8 Allineamenti possibili Identità = 8 ACVILPEDPSTRYTT || | || ||| AVISPDDPTTRY Identità = 2 ACVILPEDPSTRYTT | | AVISPDDPTTRY

9 ILVVIV |||| 0 VLVVII ILVVIV | 1 VLVVII ILVVIV ||||| 1 VLVVII ILVVIV || 0 VLVVII ILVVIV ||||| 2 VLVVII ILVVIV || 1 VLVVII ILVVIV |||| 2 VLVVII ILVVIV | 1 VLVVII ILVVIV |||||| 4 VLVVII ILVVIV ||| 0 VLVVII ILVVIV ||| 2 VLVVII Lunghezza: s1=6 s2=6 Numero confronti s1+s2-1 = 13 Caratteri confrontati s1*s2 = 36 Ricerca miglior allineamento

10 Inserzioni (Gaps) ALLINEAMISECIRIESCI ALLINEAANCHEMESECIRIESCI ALLINEAMISECIRIESCI ||||||| ALLINEAANCHEMESECIRIESCI ALLINEAMISECIRIESCI | |||||||||| ALLINEAANCHEMESECIRIESCI ALLINEA-----MISECIRIESCI ||||||| | |||||||||| ALLINEAANCHEMESECIRIESCI Identità = 7Identità = 11 Identità = 18

11 Significato strutturale ALFAELICAUNO-----ALFAELICADUE |||||||||||| ALFAELICAUNOLOOOPALFAELICADUE Alfa elica Loop

12 Allineamenti con gaps ACD EFG ACD E-FG ACD EFG A-CD EF-G A-C-D EF-G AC-D E-FG A-C-D EFG ACD EF-G ACD EFG AC-D EFG AC--D EFG A-CD EF-G A-CD E-F-G ACD E-F-G AC-D EF-G ACD EF-G ACD EFG AC-D EFG AC--D EFG A-CD E-FG AC-D E-F-G A-C-D EFG AC-D EF-G ACD EFG AC-D EFG A--CD EFG A-CD E-FG A--CD EFG A-C-D E-FG A-CD EF-G ACD EFG A-CD EFG A--CD EFG AC-D E-FG A-CD EFG ACD EF--G ACD E-FG ACD EF-G A-CD EFG ACD E-F-G AC-D E-FG ACD EFG ACD EFG ACD E-FG

13 Matrici di allineamento YASENYMAWEPUENZA I O T O U N S O Q YASEN-YMAWEPUENZA I--OTOUN-SOQ

14 Allineamenti possibili IOSONUNASEQUENZA I O N O U N S O Q IOSONUNASEQUENZA IONO---UNS--OQ IOSONUNASEQUENZA ION---OU----N--SOQ IOSONU-NA--SEQUENZA IONOUNSOQ Non valido

15 Matrice di punti IOSOSUNASEQUENZA I* O** N** O** U** N** S*** O** Q* * = Identità

16 Matrice di punti IOSOSUNASEQUENZA I* O** N** O** U** N** S*** O** Q* * = Identità

17 Regioni di identità IOSOSUNASEQUENZA S*** Q* U** E** N*** Z** A** O** I* * = Identità

18 Matrice di punti reale

19 Duplicazioni IQUENZNASEQUENZA S* Q** U** E*** N**** Z*** A** O I* * = Identità

20 Inversioni IOSOSUNASEAZNEUQ S*** Q* U** E** N** Z** A** O** I* * = Identità

21 Analisi delle matrici di punti Regioni di identità Inversione Duplicazione

22 IOSONUNASEQUENZA I O N O U N S O Q Punteggi +1 +0 Inizio Fine Ricerca allineamento IOSONUNASEQUENZA || | || | | IONO-UN-SOQ Identità = 7

23 Programmazione dinamica IOSONUNASEQUENZA I O N O U N S O Q 000000000000000000 0 0 0 0 0 0 0 0 Punteggi +1 +0 1

24 Programmazione dinamica IOSONUNASEQUENZA I O N O U N S O Q 000000000000000000 0 0 0 0 0 0 0 0 Punteggi +1 +0 1 1

25 Programmazione dinamica IOSONUNASEQUENZA I O N O U N S O Q 000000000000000000 0 0 0 0 0 0 0 0 Punteggi +1 +0 1 1 1

26 Programmazione dinamica IOSONUNASEQUENZA I O N O U N S O Q 000000000000000000 0 0 0 0 0 0 0 0 Punteggi +1 +0 1 1 1 2

27 d + 1 ? = il maggiore frax ydyx? 2 + 1 = 3 ? =2 = 2 1 = 1 dyx? d ? = il maggiore frax y Ricerca direzione migliore212?2123

28 Programmazione dinamica IOSONUNASEQUENZA I O N O U N S O Q 00000000000000000011111 012222 012223 01223 0 0 0 0 0 Punteggi +1 +0 3

29 Programmazione dinamica IOSONUNASEQUENZA I O N O U N S O Q 0000000000000000001111111111111111 01222222222222222 01222333333333444 01223333333333444 01223344444455555 01223445555555666 01233445566666666 01234445566666666 01234445566777777 IOSONUNASEQUENZA || | || | | IONO-UN-SOQ IOSON-UNASEQUENZA || | || | | IO--NOUN-SOQ Punteggi +1 +0

30 Penalità per apertura gaps a) IOSONOUNASEQUENZA |||||||| ||||||| 1) IOSONOUNOSEQUENZO a) IOSONOUNASEQUENZA |||||||| ||||||| 2) IOSONOUN-SEQUENZO Identità = 15 Identità = 15-2 = 13 a) IOSONOUNASEQUENZA 1) IOSONOUNOSEQUENZOMutazione 2) IOSONOUNSEQUENZODelezione GAP insertion penalty = -2 per ogni nuovo gap inserito

31 Penalità per estensione gaps a) IOSONOUNASEQUENZA | |||||| ||| ||| 1) I-SONOUN-SEQ-ENZO Identità = 13 –2 -2 -2 = 7 a) IOSONOUNASEQUENZA 1) ISONOUNSEQENZO 2) IOSONOSEQUENZO GAP extension penalty = -1 per ogni estensione di un gap già presente a) IOSONOUNASEQUENZA |||||| ||||||| 2) IOSONO---SEQUENZO Identità = 13 -2 -1 -1 = 9

32 Significato strutturale ALFAELICAUNOALFAELICADUE ALFAELICAUNOLALFAELICADUE apertura gap ALFAELICAUNOLOOOPALFAELICADUE estensione gap Apertura gap Estensione gap

33 Penalità per gaps IOSONUNASEQUENZA I O N O U N S O Q IOSON-UNASEQUENZA | || || | | I--ONOUN-SOQ

34 d + 1 ? = il maggiore frax - 2 y - 2 dyx? 3 = 3 ? =4 – 2 = 2 2 – 2= 0 PD con gap penaltiesdyx? d ? = il maggiore frax - 2 y - 2 324? 3243

35 PD con gap penalties IOSONUNASEQUENZA I O N O U N S O Q 0000000001000000 00201000 000202011 0010312011 00011322111 11332111 1113331111 12113331111 1211334211 IOSONUNASEQUENZA || | | IONOUNSOQ Punteggi +1 +0 -2 -2

36 Classi di aminoacidi I L V G A E D FY W K H C P Idrofobici Polari Positivi R S T Aromatici Negativi Piccoli Q N -OH M

37 Punteggio di similarità Similarità = 6*2 + 3*1 = 15 ARVILPEDPSTRYTT ||.|. |.| | AVIVPDQPTTEY | Aminoacidi identici = 2 punti. Aminoacidi simili = 1 punto Aminoacidi diversi = 0 punti

38 Matrice di sostituzione ACDEFGHIKLMNPQRSTVWY A21111111 11 C2 1 11 111 1 D21 E2 F21111111 G21111 11 H211 I21111 K21 L2111 M211111 N21111 P211 Q2111 R2 S21 1 T21 V21 W21 Y2

39 Calcolo con matrice ACDEF A21… C2… D21… E2… F… AAADE |.. ADCEC Punteggio = AA + AD + AC + DE + EC = 2 + 0 + 1 + 1 + 0 Un allineamento

40 Punteggio di similarità Similarità = 5*2 + 3*1 – 2*2 – 3*1 = 6 ARVILPEDDPSTRYYYTT AVIVPD-QPTT----EY 5 Coppie identici = 2 punti 3 Coppie simili = 1 punto 4 Coppie diversi = 0 punti 2 Inserzione Gap = -2 punti 3 Estensione Gap = -1 punto

41 ACDEFGHIKLMNPQRSTVWY A2-200-41 -2010-2110-6-3 C12-5 -4-3 -2-5-6-5-4-3-5-40-2 -80 D43-611-20-4-322 00-2-6-4 E4-501-20-3-212 00-2-6-4 F8-5-21-520-4-5 -4-3 06 G5-2-3-2-4-30 -310-6-5 H6-20 2032 -2-30 I5-222 04-5 K5-3011300-2-3-4 L64-3 -2-3 -22 M6-2 0-22-4-2 N21010-2-4-2 P60010-6-5 Q41 -2-5-4 R60-22-4 S21-2-3 T30-5-3 V4-6-2 W170 Y10 Una vera matrice di sostituzione

42 Needleman & Wunsch IVSVNYESSVQYENWA I V N V Y N S V Q Punteggi +1 +0 +2

43 Needleman & Wunschdyx? d + 2 ? =x - 2 y - 2 d + 1 ? =x - 2 y - 2 d ? =x - 2 y - 2 dyx?dyx? 327? 3 + 1 = 4 ? =7 – 2 = 5 2 – 2= 0 3275

44 Needleman & Wunsch IVSVNYESSVQYENWA I V N V Y N S V Q IVSVNYESSVQYENWA ||.| |.||| IVNV-Y-NSVQ 21111 142212112 25342113221 113755311314231 125875421434313 24797654353643 23589986545465 1244689910876556 32356910912109876 IVSVNYESSVQYENWA ||..||| IVNVYNSVQ Punteggi +1 +0 +2

45 Locale e Globale LTGARDWEDIPLWTDWDIEQESDFKTRAFGTANCHE || | | | | | || || | | TGIPLWTDWDLEQESDNSCNTDHYTREWGTMNAHKAG LTGARDWEDIPLWTDWDIEQESDFKTRAFGTANCHKE |||||||| ||||| TGIPLWTDWDLEQESDNSCNTDHYTREWGTMNAHKAG Allineamento globale Allineamento locale Punteggio di Identità = 13

46 Significato Biologico Allineamento globale Allineamento locale

47 Algoritmi locali e globali IOSONUNASEQUENZA I O N O U N S O Q IOSONUNASEQUENZA ION---OU----N--SOQ U-NAS NOUNS GlobaleLocale

48 Smith-Waterman IVSVNVEYNWAYENWA I V N V Y N S V Q Punteggi +0 +2 -2 -2 -2 2 42222 2424222 226464322 2464464322 364348654321 22422365653311 12436435644313 22444444442311

49 Smith-Waterman IVSVNVEYNWAYENWA I V N V Y N S V Q IVSVNVEYNWAYENWA ||| || IVNV-YNSVQ 2 42222 2424222 226464322 2464464322 364348654321 22422365653311 12436435644313 22444444442311


Scaricare ppt "Allineamenti di sequenze Misura della somiglianza di 2 geni o proteine dalle loro sequenze."

Presentazioni simili


Annunci Google