Allineamenti di sequenze Misura della somiglianza di 2 geni o proteine dalle loro sequenze
Evoluzione Molecolare Proteina originaria QUESTAELASEQUENZADIUNAPROTEINA Duplicazione QUESTAELASEQUENZADIUNAPROTEINA Mutazioni puntiformi QUESTAILASECUENZEDOUNAPROTEINA Delezione QUESTAILASECUENZEDOUNA____INA Inserzione QUESTAILANUOVASECUENZEDOUNAINA
Individuazione di una proteina progenitrice QUESTAILANUOVASECUENZEDOUNAINA Proteina 1 QUESTAELASEQUENZADIUNAPROTEINA Proteina 2 SDFNWEOIRHTLKWEFLKFNLSKDFNSLD
Allineamento ACVILPEDPSTRYTT CVISPSDPTTRY ACVILPEDPSTRYTT AVISPSDPTTRY ☻ Matches ☻ Mismatches ACVILPEDPSTRYTT || | || ||| AVISPSDPTTRY
Punteggio di Identità ACVILPEDPSTRYTT || | || ||| AVISPDDPTTRY Proteina 1 QUESTAELASEQUENZADIUNAPROTEINA |||||| || ||| QUESTAILANUOVASECUENZEDOUNAINA Identità = 11 Proteina 2 Proteina 1 QUESTAELASEQUENZADIUNAPROTEINA | | SDFNWEOIAHTLKWEFLDFNLSKDFNSLD Identità = 2 Proteina 3
Similarità & Omologia Sequenza Originaria Sequenze Omologhe Duplicazione e/o Speciazione Sequenze Omologhe Evoluzione Sequenze Omologhe e Simili Evoluzione Sequenze Omologhe ma non Simili Sequenze non Omologhe Evoluzione Convergente Sequenze non Omologhe ma Simili
Percentuale di Identità (Identità*2)/ Numero di aminoacidi ACVLLPEDPSTRYTT | | || ||| AVISPDDPTTRY % di identita = 7*2/27 = 0.52 PDDETTY ||| ||| PDDPTTYR % di identita = 6*2/15 = 0.80
Allineamenti possibili ACVILPEDPSTRYTT || | || ||| AVISPDDPTTRY Identità = 8 ACVILPEDPSTRYTT | | AVISPDDPTTRY Identità = 2
Ricerca miglior allineamento Lunghezza: s1=6 s2=6 Numero confronti s1+s2-1 = 13 Caratteri confrontati s1*s2 = 36 ILVVIV | 1 VLVVII ILVVIV || 1 VLVVII ILVVIV ||| 0 VLVVII ILVVIV |||| 0 VLVVII ILVVIV ||||| 2 VLVVII ILVVIV |||||| 4 VLVVII ILVVIV ||||| 1 VLVVII ILVVIV |||| 2 VLVVII ILVVIV ||| 2 VLVVII ILVVIV || 0 VLVVII ILVVIV | 1 VLVVII
Inserzioni (Gaps) ALLINEAMISECIRIESCI ALLINEAANCHEMESECIRIESCI ||||||| ALLINEAANCHEMESECIRIESCI ALLINEAMISECIRIESCI | |||||||||| ALLINEAANCHEMESECIRIESCI Identità = 7 Identità = 11 ALLINEA-----MISECIRIESCI ||||||| | |||||||||| ALLINEAANCHEMESECIRIESCI Identità = 18
Significato strutturale ALFAELICAUNO-----ALFAELICADUE |||||||||||| |||||||||||| ALFAELICAUNOLOOOPALFAELICADUE Loop Alfa elica Alfa elica
Allineamenti con gaps ACD EFG E-FG E—FG A-CD EF-G A-C-D AC-D AC--D
Matrici di allineamento YASEN-YMAWEPUENZA I--OTOUN-SOQ Y A S E N M W P U Z I O T Q
Allineamenti possibili U A E Q Z IOSONUNASEQUENZA IONO---UNS--OQ IOSONUNASEQUENZA ION---OU----N--SOQ IOSONU-NA--SEQUENZA IONOUNSOQ Non valido
Matrice di punti I O S U N A E Q Z * * = Identità
Matrice di punti I O S U N A E Q Z * * = Identità
Regioni di identità I O S U N A E Q Z * * = Identità
Matrice di punti reale
Duplicazioni I Q U E N Z A S * O * = Identità
Inversioni I O S U N A E Z Q * * = Identità
Analisi delle matrici di punti Duplicazione Inversione Regioni di identità
Ricerca allineamento I O S N U A E Q Z +1 +0 Inizio Punteggi Fine IOSONUNASEQUENZA || | || | | IONO-UN-SOQ Identità = 7
Programmazione dinamica S N U A E Q Z 1 Punteggi +1 +0
Programmazione dinamica S N U A E Q Z 1 1 Punteggi +1 +0
Programmazione dinamica S N U A E Q Z 1 1 Punteggi 1 +1 +0
Programmazione dinamica S N U A E Q Z 1 1 Punteggi 1 2 +1 +0
Ricerca direzione migliore y x ? d y x ? d + 1 ? = il maggiore fra x y d ? = il maggiore fra x y 2 1 ? 2 + 1 = 3 ? = 2 = 2 1 = 1 2 1 3
Programmazione dinamica S N U A E Q Z 1 2 3 Punteggi +1 +0 3
Programmazione dinamica S N U A E Q Z 1 2 3 4 5 6 7 Punteggi +1 +0 IOSONUNASEQUENZA || | || | | IONO-UN-SOQ IOSON-UNASEQUENZA || | || | | IO--NOUN-SOQ
Penalità per apertura gaps a) IOSONOUNASEQUENZA 1) IOSONOUNOSEQUENZO Mutazione 2) IOSONOUNSEQUENZO Delezione a) IOSONOUNASEQUENZA |||||||| ||||||| 1) IOSONOUNOSEQUENZO Identità = 15 a) IOSONOUNASEQUENZA |||||||| ||||||| 2) IOSONOUN-SEQUENZO Identità = 15-2 = 13 GAP insertion penalty = -2 per ogni nuovo gap inserito
Penalità per estensione gaps a) IOSONOUNASEQUENZA 1) ISONOUNSEQENZO 2) IOSONOSEQUENZO a) IOSONOUNASEQUENZA | |||||| ||| ||| 1) I-SONOUN-SEQ-ENZO Identità = 13 –2 -2 -2 = 7 a) IOSONOUNASEQUENZA |||||| ||||||| 2) IOSONO---SEQUENZO Identità = 13 -2 -1 -1 = 9 GAP extension penalty = -1 per ogni estensione di un gap già presente
Significato strutturale ALFAELICAUNOALFAELICADUE ALFAELICAUNOLALFAELICADUE apertura gap ALFAELICAUNOLOOOPALFAELICADUE estensione gap Apertura gap Estensione gap
Penalità per gaps I O S N U A E Q Z IOSON-UNASEQUENZA | || || | | | || || | | I--ONOUN-SOQ I O S N U A E Q Z
PD con gap penalties d y x ? d y x ? 3 2 4 ? 3 2 4 d + 1 ? = il maggiore fra x - 2 y - 2 d ? = il maggiore fra x - 2 y - 2 3 2 4 ? 3 = 3 ? = 4 – 2 = 2 2 – 2 = 0 3 2 4
PD con gap penalties I O S N U A E Q Z +1 +0 -2 -2 Punteggi 1 2 3 4 Punteggi +1 +0 -2 -2 IOSONUNASEQUENZA || | | IONOUNSOQ
Classi di aminoacidi K R H T S L G I C A V P F Y D E W -OH Piccoli Positivi T S L G I C A Polari V Q P M N F Y Idrofobici D E W Negativi Aromatici
Punteggio di similarità | Aminoacidi identici = 2 punti . Aminoacidi simili = 1 punto Aminoacidi diversi = 0 punti ARVILPEDPSTRYTT ||.|. |.| | AVIVPDQPTTEY Similarità = 6*2 + 3*1 = 15
Matrice di sostituzione F G H I K L M N P Q R S T V W Y 2 1
Calcolo con matrice A C D E F 2 1 … Un allineamento AAADE | .. ADCEC Punteggio = AA + AD + AC + DE + EC = 2 + 0 + 1 + 1 + 0
ARVILPEDDPSTRYYYTT AVIVPD-QPTT----EY Punteggio di similarità 5 Coppie identici = 2 punti 3 Coppie simili = 1 punto 4 Coppie diversi = 0 punti 2 Inserzione Gap = -2 punti 3 Estensione Gap = -1 punto Similarità = 5*2 + 3*1 – 2*2 – 3*1 = 6
Una vera matrice di sostituzione F G H I K L M N P Q R S T V W Y 2 -2 -4 1 -1 -6 -3 12 -5 -8 4 3 8 6 5 17 10
Needleman & Wunsch I V S N Y E Q W A Punteggi +2 +1 +0
Needleman & Wunsch d y x ? d y x ? d y x ? 3 2 7 ? 3 2 7 5 d + 2 3 + 1 = 4 ? = 7 – 2 = 5 2 – 2 = 0 3 2 7 5
Needleman & Wunsch I V S N Y E Q W A +2 +1 +0 Punteggi 4 5 3 7 8 9 6 10 12 Punteggi +2 +1 +0 IVSVNYESSVQYENWA ||.| | .||| IVNV-Y-NSVQ IVSVNYESSVQYENWA ||. .||| IVNVYNSVQ
Locale e Globale Allineamento globale Allineamento locale LTGARDWEDIPLWTDWDIEQESDFKTRAFGTANCHE || | | | | | || || | | TGIPLWTDWDLEQESDNSCNTDHYTREWGTMNAHKAG Punteggio di Identità = 13 Allineamento locale LTGARDWEDIPLWTDWDIEQESDFKTRAFGTANCHKE |||||||| ||||| TGIPLWTDWDLEQESDNSCNTDHYTREWGTMNAHKAG Punteggio di Identità = 13
Significato Biologico Allineamento globale Allineamento locale
Algoritmi locali e globali S N U A E Q Z IOSONUNASEQUENZA ION---OU----N--SOQ U-NAS NOUNS Globale Locale
Smith-Waterman I V S N E Y W A Q 2 4 6 3 8 5 1 Punteggi +2 +0 -2 -2 -2
Smith-Waterman I V S N E Y W A Q IVSVNVEYNWAYENWA ||| || IVNV-YNSVQ 2 4 6 3 8 5 1 IVSVNVEYNWAYENWA ||| || IVNV-YNSVQ