Allineamenti di sequenze Misura della somiglianza di 2 geni o

Slides:



Advertisements
Presentazioni simili
Allineamento Pairwise e Multiplo di Bio-Sequenze.
Advertisements

UNIVERSITA’ DI MILANO-BICOCCA LAUREA MAGISTRALE IN BIOINFORMATICA
UNIVERSITA’ DI MILANO-BICOCCA LAUREA MAGISTRALE IN BIOINFORMATICA
MATEMATICA PER L’ECONOMIA
Agenti mutageni Mutazioni puntiformi Aberrazioni cromosomiche
GENE: segmento di DNA che trasporta l’informazione per un determinato
Sequenza-struttura-funzione
gruppi di amminoacidi in base alle catene laterali
RICERCA DI SIMILARITA’ IN BANCHE DATI
Allineamento di sequenze
Bruno Mario Cesana Stefano Calza
Calcolare la formula minima dalla composizione percentuale
LE MUTAZIONI.
Ordini Parziali - Reticoli
I programmi di ricerca in banche dati possono essere oppure essere utilizzabili via web residenti in un calcolatore di cui siamo proprietari o utenti.
Ricerche in banche dati. Ricerche in banche dati UNIPROT PROTEINASCONOSCIUTA Ricerca PROT_ Kinasi PROT_ Fosfatasi PROT_ Prot di.
Migliore Punteggio Lunghezza della sequenza Grandezza banca dati
I diversi tipi di mutazioni
Esercizio 1 Implementare l’algoritmo di Needleman-Wunsch per l’allineamento globale di due sequenze A=a1a2…an e B=b1b2…bm di lunghezza n e m rispettivamente.
Biologia computazionale
I quindicenni italiani e le prove PISA Presentazione generale dei risultati e lettura dei dati sulla base delle variabili di contesto INVALSI
1) Algoritmi di allineamento 2) Algoritmi di ricerca in database
La mutazione genica La mutazione genica è un cambiamento del materiale ereditario di un gene. Un gene è una sequenza di nucleotidi del DNA, che codifica.
Progetto Lauree Scientifiche DINAMICA DI POPOLAZIONI Liceo Statale A. Meucci Aprilia (LT) Anno Scolastico 2007/2008.
ESERCITAZIONE ALLINEAMENTI. CLSSIEQKSNEEG--EHGPEVREDA ACISTIE---NEDGNEDH---VR Calcolare l'identità e la percentuale di identità
Allineamento Metodo bioinformatico che date due o più sequenze ne mette in evidenza similarità/diversità, supponendo che le sequenze analizzate abbiano.
ALLINEAMENTI GLOBALI E LOCALI
FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990)
Allineamenti multipli
Allineamento di sequenze proteiche
4/10/2005 Diego Puppin ISTI-CNR Sequence alignment... in parallel!! Diego Puppin.
WORKING WITH BIOSEQUENCES Alignments and similarity search
Fisica Computazionale applicata alle Macromolecole
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia
Ricerca di similarità di sequenza (FASTA e BLAST)
Tipi di allineamenti.
Piano delle attività Anno scolastico 2012/13 Anno scolastico 2012/13.
I programmi di ricerca in banche dati possono essere
Alcuni esempi di domande di esame
monitoraggio apprendimenti disciplinari scuola primaria "L.Tempesta"
LEGAMI DEBOLI.
Cosa sono i GENI I geni rappresentano l’unità strutturale e funzionale della genetica Un gene è una successione lineare di unità chimiche semplici (nucleotidi)
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
A.A CORSO INTEGRATO DI INFORMATICA E BIOINFORMATICA per il CLT in BIOLOGIA MOLECOLARE Scuola di Scienze, Università di Padova Docenti: Dr.
Esempio di utilizzo del programma BLAST disponibile all’NCBI
Purtroppo non esiste un modo univoco per indicare un gene
A.A CORSO BIOINFORMATICA 2 LM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Dr. Giorgio Valle Dr. Stefania.
A.A CORSO INTEGRATO DI INFORMATICA E BIOINFORMATICA per il CLT in BIOLOGIA MOLECOLARE Scuola di Scienze, Università di Padova Docenti: Roberto.
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
III LEZIONE Allineamento di sequenze
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
III LEZIONE Allineamento di sequenze
WORKING WITH BIOSEQUENCES Alignments and similarity search.
Allineamento di sequenze
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
ALLINEAMENTO DI SEQUENZE
AMMINOACIDI E PROTEINE
Una volta stabilito che un insieme di proteine sono tra di loro omologhe posso procedere ad un allineamento multiplo. Il programma più usato a questo scopo.
Allineamento di sequenze Perché è importante? Le caratteristiche funzionali delle molecole biologiche dipendono dalle conformazione tridimensionale che.
---ATGTTGAAGTTCAAGTATGGTGTGCGGAAC--- --MLKFKYGVRNPPEA-- Che cosa è la bioinformatica? Approccio multidisciplinare al problema della gestione e della elaborazione.
Sistema di ricerca Entrez Insieme di banche dati contenenti svariati tipi di informazioni biomediche, interrogabile mediante un’unica interfaccia Concetto.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle Prof.
STORIA DI UNA TRIPLETTA: BASI VS AMINOACIDI 3 A 1 Il Codice Genetico Metodo didattico: Spaced Learning Prof. M. Della Mea.
Esempio di allineamento Due regioni simili delle proteine di Drosophila melanogaster Slit e Notch SLIT_DROME FSCQCAPGYTGARCETNIDDCLGEIKCQNNATCIDGVESYKCECQPGFSGEFCDTKIQFC..:.:
Allineamenti Multipli Problema Durante l’evoluzione i residui importanti per il mantenimento della struttura e della funzione sono conservati. Come riconoscere.
A.A CORSO INTEGRATO DI INFORMATICA E BIOINFORMATICA per il CLT in BIOLOGIA MOLECOLARE Scuola di Scienze, Università di Padova Docenti: Prof.
Transcript della presentazione:

Allineamenti di sequenze Misura della somiglianza di 2 geni o proteine dalle loro sequenze

Evoluzione Molecolare Proteina originaria QUESTAELASEQUENZADIUNAPROTEINA Duplicazione QUESTAELASEQUENZADIUNAPROTEINA Mutazioni puntiformi QUESTAILASECUENZEDOUNAPROTEINA Delezione QUESTAILASECUENZEDOUNA____INA Inserzione QUESTAILANUOVASECUENZEDOUNAINA

Individuazione di una proteina progenitrice QUESTAILANUOVASECUENZEDOUNAINA Proteina 1 QUESTAELASEQUENZADIUNAPROTEINA Proteina 2 SDFNWEOIRHTLKWEFLKFNLSKDFNSLD

Allineamento ACVILPEDPSTRYTT CVISPSDPTTRY ACVILPEDPSTRYTT AVISPSDPTTRY ☻ Matches ☻ Mismatches ACVILPEDPSTRYTT || | || ||| AVISPSDPTTRY

Punteggio di Identità ACVILPEDPSTRYTT || | || ||| AVISPDDPTTRY Proteina 1 QUESTAELASEQUENZADIUNAPROTEINA |||||| || ||| QUESTAILANUOVASECUENZEDOUNAINA Identità = 11 Proteina 2 Proteina 1 QUESTAELASEQUENZADIUNAPROTEINA | | SDFNWEOIAHTLKWEFLDFNLSKDFNSLD Identità = 2 Proteina 3

Similarità & Omologia Sequenza Originaria Sequenze Omologhe Duplicazione e/o Speciazione Sequenze Omologhe Evoluzione Sequenze Omologhe e Simili Evoluzione Sequenze Omologhe ma non Simili Sequenze non Omologhe Evoluzione Convergente Sequenze non Omologhe ma Simili

Percentuale di Identità (Identità*2)/ Numero di aminoacidi ACVLLPEDPSTRYTT | | || ||| AVISPDDPTTRY % di identita = 7*2/27 = 0.52 PDDETTY ||| ||| PDDPTTYR % di identita = 6*2/15 = 0.80

Allineamenti possibili ACVILPEDPSTRYTT || | || ||| AVISPDDPTTRY Identità = 8 ACVILPEDPSTRYTT | | AVISPDDPTTRY Identità = 2

Ricerca miglior allineamento Lunghezza: s1=6 s2=6 Numero confronti s1+s2-1 = 13 Caratteri confrontati s1*s2 = 36 ILVVIV | 1 VLVVII ILVVIV || 1 VLVVII ILVVIV ||| 0 VLVVII ILVVIV |||| 0 VLVVII ILVVIV ||||| 2 VLVVII ILVVIV |||||| 4 VLVVII ILVVIV ||||| 1 VLVVII ILVVIV |||| 2 VLVVII ILVVIV ||| 2 VLVVII ILVVIV || 0 VLVVII ILVVIV | 1 VLVVII

Inserzioni (Gaps) ALLINEAMISECIRIESCI ALLINEAANCHEMESECIRIESCI ||||||| ALLINEAANCHEMESECIRIESCI ALLINEAMISECIRIESCI | |||||||||| ALLINEAANCHEMESECIRIESCI Identità = 7 Identità = 11 ALLINEA-----MISECIRIESCI ||||||| | |||||||||| ALLINEAANCHEMESECIRIESCI Identità = 18

Significato strutturale ALFAELICAUNO-----ALFAELICADUE |||||||||||| |||||||||||| ALFAELICAUNOLOOOPALFAELICADUE Loop Alfa elica Alfa elica

Allineamenti con gaps ACD EFG E-FG E—FG A-CD EF-G A-C-D AC-D AC--D

Matrici di allineamento YASEN-YMAWEPUENZA I--OTOUN-SOQ Y A S E N M W P U Z I O T Q

Allineamenti possibili U A E Q Z IOSONUNASEQUENZA IONO---UNS--OQ IOSONUNASEQUENZA ION---OU----N--SOQ IOSONU-NA--SEQUENZA IONOUNSOQ Non valido

Matrice di punti I O S U N A E Q Z * * = Identità

Matrice di punti I O S U N A E Q Z * * = Identità

Regioni di identità I O S U N A E Q Z * * = Identità

Matrice di punti reale

Duplicazioni I Q U E N Z A S * O * = Identità

Inversioni I O S U N A E Z Q * * = Identità

Analisi delle matrici di punti Duplicazione Inversione Regioni di identità

Ricerca allineamento I O S N U A E Q Z +1 +0 Inizio Punteggi Fine IOSONUNASEQUENZA || | || | | IONO-UN-SOQ Identità = 7

Programmazione dinamica S N U A E Q Z 1 Punteggi +1 +0

Programmazione dinamica S N U A E Q Z 1 1 Punteggi +1 +0

Programmazione dinamica S N U A E Q Z 1 1 Punteggi 1 +1 +0

Programmazione dinamica S N U A E Q Z 1 1 Punteggi 1 2 +1 +0

Ricerca direzione migliore y x ? d y x ? d + 1 ? = il maggiore fra x y d ? = il maggiore fra x y 2 1 ? 2 + 1 = 3 ? = 2 = 2 1 = 1 2 1 3

Programmazione dinamica S N U A E Q Z 1 2 3 Punteggi +1 +0 3

Programmazione dinamica S N U A E Q Z 1 2 3 4 5 6 7 Punteggi +1 +0 IOSONUNASEQUENZA || | || | | IONO-UN-SOQ IOSON-UNASEQUENZA || | || | | IO--NOUN-SOQ

Penalità per apertura gaps a) IOSONOUNASEQUENZA 1) IOSONOUNOSEQUENZO Mutazione 2) IOSONOUNSEQUENZO Delezione a) IOSONOUNASEQUENZA |||||||| ||||||| 1) IOSONOUNOSEQUENZO Identità = 15 a) IOSONOUNASEQUENZA |||||||| ||||||| 2) IOSONOUN-SEQUENZO Identità = 15-2 = 13 GAP insertion penalty = -2 per ogni nuovo gap inserito

Penalità per estensione gaps a) IOSONOUNASEQUENZA 1) ISONOUNSEQENZO 2) IOSONOSEQUENZO a) IOSONOUNASEQUENZA | |||||| ||| ||| 1) I-SONOUN-SEQ-ENZO Identità = 13 –2 -2 -2 = 7 a) IOSONOUNASEQUENZA |||||| ||||||| 2) IOSONO---SEQUENZO Identità = 13 -2 -1 -1 = 9 GAP extension penalty = -1 per ogni estensione di un gap già presente

Significato strutturale ALFAELICAUNOALFAELICADUE ALFAELICAUNOLALFAELICADUE apertura gap ALFAELICAUNOLOOOPALFAELICADUE estensione gap Apertura gap Estensione gap

Penalità per gaps I O S N U A E Q Z IOSON-UNASEQUENZA | || || | | | || || | | I--ONOUN-SOQ I O S N U A E Q Z

PD con gap penalties d y x ? d y x ? 3 2 4 ? 3 2 4 d + 1 ? = il maggiore fra x - 2 y - 2 d ? = il maggiore fra x - 2 y - 2 3 2 4 ? 3 = 3 ? = 4 – 2 = 2 2 – 2 = 0 3 2 4

PD con gap penalties I O S N U A E Q Z +1 +0 -2 -2 Punteggi 1 2 3 4 Punteggi +1 +0 -2 -2 IOSONUNASEQUENZA || | | IONOUNSOQ

Classi di aminoacidi K R H T S L G I C A V P F Y D E W -OH Piccoli Positivi T S L G I C A Polari V Q P M N F Y Idrofobici D E W Negativi Aromatici

Punteggio di similarità | Aminoacidi identici = 2 punti . Aminoacidi simili = 1 punto Aminoacidi diversi = 0 punti ARVILPEDPSTRYTT ||.|. |.| | AVIVPDQPTTEY Similarità = 6*2 + 3*1 = 15

Matrice di sostituzione F G H I K L M N P Q R S T V W Y 2 1

Calcolo con matrice A C D E F 2 1 … Un allineamento AAADE | .. ADCEC Punteggio = AA + AD + AC + DE + EC = 2 + 0 + 1 + 1 + 0

ARVILPEDDPSTRYYYTT AVIVPD-QPTT----EY Punteggio di similarità 5 Coppie identici = 2 punti 3 Coppie simili = 1 punto 4 Coppie diversi = 0 punti 2 Inserzione Gap = -2 punti 3 Estensione Gap = -1 punto Similarità = 5*2 + 3*1 – 2*2 – 3*1 = 6

Una vera matrice di sostituzione F G H I K L M N P Q R S T V W Y 2 -2 -4 1 -1 -6 -3 12 -5 -8 4 3 8 6 5 17 10

Needleman & Wunsch I V S N Y E Q W A Punteggi +2 +1 +0

Needleman & Wunsch d y x ? d y x ? d y x ? 3 2 7 ? 3 2 7 5 d + 2 3 + 1 = 4 ? = 7 – 2 = 5 2 – 2 = 0 3 2 7 5

Needleman & Wunsch I V S N Y E Q W A +2 +1 +0 Punteggi 4 5 3 7 8 9 6 10 12 Punteggi +2 +1 +0 IVSVNYESSVQYENWA ||.| | .||| IVNV-Y-NSVQ IVSVNYESSVQYENWA ||. .||| IVNVYNSVQ

Locale e Globale Allineamento globale Allineamento locale LTGARDWEDIPLWTDWDIEQESDFKTRAFGTANCHE  ||   | |  |   |     |  ||  || | |  TGIPLWTDWDLEQESDNSCNTDHYTREWGTMNAHKAG Punteggio di Identità = 13 Allineamento locale LTGARDWEDIPLWTDWDIEQESDFKTRAFGTANCHKE          |||||||| |||||        TGIPLWTDWDLEQESDNSCNTDHYTREWGTMNAHKAG Punteggio di Identità = 13

Significato Biologico Allineamento globale Allineamento locale

Algoritmi locali e globali S N U A E Q Z IOSONUNASEQUENZA ION---OU----N--SOQ U-NAS NOUNS Globale Locale

Smith-Waterman I V S N E Y W A Q 2 4 6 3 8 5 1 Punteggi +2 +0 -2 -2 -2

Smith-Waterman I V S N E Y W A Q IVSVNVEYNWAYENWA ||| || IVNV-YNSVQ 2 4 6 3 8 5 1 IVSVNVEYNWAYENWA ||| || IVNV-YNSVQ