CONFRONTO DI SEQUENZE Una delle analisi più informative che si possano compiere utilizzando sequenze nucleotidiche o amminoacidiche è il CONFRONTO FRA.

Slides:



Advertisements
Presentazioni simili
La mutazione genica La mutazione genica è un cambiamento del materiale ereditario di un gene. Un gene è una sequenza di nucleotidi del DNA, che codifica.
Advertisements

Alcuni esempi di domande di esame
Sintesi dell’ RNA.
UD5 Fase I Le Mutazioni Ovvero quando il codice genetico è errato o viene erroneamente decodificato.
Allineamenti Multipli Problema Durante l’evoluzione i residui importanti per il mantenimento della struttura e della funzione sono conservati. Come riconoscere.
Evoluzione Molecolare & Filogenesi Molecolare In tutte le popolazioni naturali si verificano mutazioni nel genoma (mutazioni nel DNA della popolazione)
Laboratorio evoluzione Marcello Sala “STEMMI” [Henry Gee, Tempo profondo, Einaudi 2006]
Programmi per l’ALLINEAMENTO DELLE SEQUENZE La creazione di programmi per l’allineamento delle sequenze richiede la definizione di: *** Un criterio oggettivo.
La cellula eucariote. Le cellule delle piante sono di solito molto più grandi delle cellule degli animali e ciò è dovuto soprattutto alla presenza dei.
RICERCA DI SIMILARITA’ in DB Problema: identificare all’interno di una banca dati di sequenze quelle sequenze che sono più simili ad una sequenza di nostro.
Le mutazioni La struttura del DNA, che è la base della trasmissione dei caratteri ereditari, ha una stabilità relativa e non assoluta. La stabilità garantisce.
La chimica della vita Ogni organismo vivente è una macchina sofisticata, risultato di un complesso insieme di reazioni chimiche. La costruzione e il funzionamento.
Il DNA e il codice genetico
DNA: IL DEPOSITARIO DELL’INFORMAZIONE GENICA
Linkage Can Be a Family-specific phenomenon:
Cromosomi umani condensati
La Fabbrica delle Proteine
Helena Curtis N. Sue Barnes
BIOLOGIA ORGANISMI VIVENTI VEGETALI - ANIMALI ORGANISMI PROCARIOTI
IL GENOMA UMANO Insieme di informazioni genetiche contenute nel DNA delle cellule umane. Due genomi: genoma nucleare, che comprende il 99,9995% dell’informazione.
I MARCATORI MOLECOLARI NEL MIGLIORAMENTO GENETICO
Variazioni del DNA possono interessare una (o poche) bp oppure coinvolgere tratti più o meno estesi del genoma (variazioni su piccola o su larga scala)
Mutazioni Geniche.
13/11/
Il DNA è un polimero di nucleotidi
Le mutazioni geniche e la riparazione del DNA
13/11/
DNA RICOMBINANTE.
LE MUTAZIONI.
AVVISO Il materiale riportato in queste diapositive è di esclusiva proprietà del Prof. Liborio Stuppia. La pubblicazione.
AVVISO Il materiale riportato in queste diapositive è di esclusiva proprietà del Prof. Liborio Stuppia. La pubblicazione.
I GENI:parte funzionale del DNA
DNA: The life molecule La ricerca del materiale genetico (da Eissman a Hershey e Chase) La struttura del DNA (da Chargaff a Watson e Crick) Le funzioni.
Funzione del genoma (DNA)
Funzione del genoma (DNA) Struttura del DNA cromosomale
La cellula come base per la vita
PILLOLE DI GENETICA PARTE 3
Corso di Genetica -Lezione 12- Cenci
LEZIONE 4 Allineamento di sequenze nucleotidiche e proteiche
Gli organismi viventi.
La regolazione genica negli eucarioti
La Fabbrica delle Proteine
Altre indagini di criminalistica… sinergia tra diverse discipline
DNA L'acido desossiribonucleico contiene le informazioni genetiche
Le Proteine.
Approccio all’insegnamento dell’anatomia comparata: i sistemi
13/11/
Il DNA e l’RNA, gli acidi nucleici, sono polimeri di nucleotidi
13/11/
Acidi nucleici.
LE MUTAZIONI DEFINIZIONE: La mutazione è una modificazione della sequenza delle basi del DNA con effetti più o meno gravi, dipendenti dall’entità del danno.
PILLOLE DI GENETICA PARTE 3
Virus, viroidi, prioni, ftoplasmi
Definizione di GENETICA
Programmi per l’ALLINEAMENTO DELLE SEQUENZE
Tutti gli esseri viventi sono costituiti di unità funzionali denominate cellule Anche le Piante sono costituite da cellule; le cellule vegetali sono strutturalmente.
13/11/
Evoluzione Molecolare & Filogenesi Molecolare
LE MUTAZIONI La mutazione è una modificazione della sequenza delle basi del DNA con effetti più o meno gravi, in funzione dell’entità del danno. Hugo De.
13/11/
CONFRONTO DI SEQUENZE Una delle analisi più informative che si possano compiere utilizzando sequenze nucleotidiche o amminoacidiche è il CONFRONTO FRA.
Transcript della presentazione:

CONFRONTO DI SEQUENZE Una delle analisi più informative che si possano compiere utilizzando sequenze nucleotidiche o amminoacidiche è il CONFRONTO FRA 2 O PIU’ SEQUENZE Si possono ricercare SEQUENZE SIMILI o SEQUENZE OMOLOGHE Due sequenze (amminoacidiche o nucleotiche) che si somigliano possono essere il risultato di un fenomeno di convergenza evolutiva (cioè sono divenute simili perché devono svolgere la stessa funzione) oppure possono essere derivate da una stessa sequenza ancestrale attraverso un processo di divergenza. QUESTI PROCESSI SONO ANALOGHI A QUELLI CHE SI VERIFICANO NELL’EVOLUZIONE DEGLI ORGANISMI

Albero filogenetico dei primati

MammiferiUccelliRettili Rettile ancestrale Anfibio ancestrale AnfibiPesci ossei Pesci cartilaginei Pesci ossei Antenato dei vertebrati Antenato dei pesci Dinosauri

PianteAnimaliFunghi Eucariota ancestrale ProtistiArchebatteriEubatteri Antenato comune di Eucarioti e Archea Antenato cellulare

Convergenza: organismi differenti sotto pressioni evolutive simili adottano soluzioni simili Ittiosauri: rettili marini preistorici che assomigliavano ai cetacei attuali

Gli organismi viventi evolvono perché i loro geni e quindi le proteine che essi codificano nel tempo subiscono cambiamenti strutturali e funzionali L’evoluzione macroscopica è il risultato dell’evoluzione molecolare

Due proteine si dicono OMOLOGHE quando hanno un antenato in comune Proteina ancestrale Proteina A Proteina B A e B sono proteine OMOLOGHE L’omologia non è una proprietà quantitativa: o c’è o non c’è; non esistono gradi di omologia.

Proteina Ancestrale 2 Proteina A Proteina B Proteina Ancestrale 1 Proteina C Se A e B sono OMOLOGHE e A e C sono OMOLOGHE allora anche C e B sono OMOLOGHE

Come avviene l’evoluzione molecolare? Mutazioni nelle Sequenze di DNA (durante la replicazione; durante il riparo di danni) Alterazioni della sequenza codificante o delle sequenze di controllo Proteine di sequenza alterata o prodotte in quantità o in tessuti differenti

HO-5’-P—dR—P—dR—P—dR-3’-OH | | | U G A A C T immA T A T G | | | | | | | | HO-3’—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P-5’-OH HO-5’-P—P—P—dR-3’-OH | C dCTP DNA polimerasi

HO-5’-P—dR—P—dR—P—dR—P—dR—3’-OH | | | | U G A C A C T immA T A T G | | | | | | | | HO-3’—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P-5’-OH + HO-5’-P—P-3’-OH pirofosfato

HO-5’-P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR-3’-OH | | | | | | | | T G A C A T A C A C T immA T A T G | | | | | | | | HO-3’—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P-5’-OH

HO-5’-P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR-3’-OH | | | | | | | | T G A C A T A C A C T immA T A T G | | | | | | | | HO-3’—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P-5’-OH

HO-5’-P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR-3’-OH | | | | | | | | T G A C A T A C A C T A T A T G | | | | | | | | HO-3’—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P-5’-OH

HO-5’-P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR-3’-OH | | | | | | | | T G A C A T A C A C T G T A T G | | | | | | | | HO-3’—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P-5’-OH HO-5’-P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR-3’-OH | | | | | | | | T G A T A T A C A C T A T A T G | | | | | | | | HO-3’—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P—dR—P-5’-OH

C = A immino C immino = A T = G enolo T enolo = G Mutazioni puntiformi dette Transizioni GC  AT

C = G A syn = G

T syn = C

C syn = T C = T syn G syn = A G = A syn Mutazioni puntiformi dette Trasversioni GC  TA GC  CG AT  TA

A T G C 4 Trasversioni 2 Transizioni

HNO 2 causa deamminazione di A e C e quindi la trasversione AT  GC

N NH N N NH 2 O R N N N N NH 2 O R CH 3 agenti metilanti Guanina (si appaia con Citosina) O6-metil-Guanina (si appaia con Timina) N NH N N NH 2 O R N HN N N NH 2 O R agenti ossidanti Guanina (si appaia con Citosina) 8-idrossi-Guanina (si appaia con Adenina) O H

5’-TCCGTCTACTAATATATATATATATTCGAATCT-3’ ||||||||||||||||||||||||||||||||| 3’-AGGCAGATGATTATATATATATATAAGCTTAGA-5’ 5’-TCCGTCTACTAATATATATAT  ||||||||||||||||||||| 3’-AGGCAGATGATTATATATATATAAGCTTAGA-5’ 5’-TCCGTCTACTA ATATAT  ||||||||||| |||||| 3’-AGGCAGATGATTATATATATATAAGCTTAGA-5’ TA A T INSERZIONE

5’-TCCGTCTACTAATATATATAT  ||||||||||||||||||||| 3’-AGGCAGATGATTATATATATATAAGCTTAGA-5’ 5’-TCCGTCTACTAATATATATAT  ||||||||||| |||||||| 3’-AGGCAGATGAT TATATATAAGCTTAGA-5’ T A AT 5’-TCCGTCTACTAATATATATATTCGAATCT-3’ ||||||||||||||||||||||||||||| 3’-AGGCAGATGATTATATATATAAGCTTAGA-5’ DELEZIONE

5’..ATGTTTACTGATGGTGGCAAAAAACATATG... Nter M F T D G G K K H M...

5’..ATGTTTACTGATGGTGGCAAAAAACATATG... Nter M F T D G G K K H M... 5’..ATGTTTACTGATGGTGGCAAAAAAAAACATATG... Nter M F T D G G K K K H M... INSERZIONE DI TRE BASI (1CODONE) INSERZIONE DI UN AMMINOACIDO

5’..ATGTTTACTGATGGTGGCAAAAAACATATG... Nter M F T D G G K K H M... 5’..ATGTTTACTGATGGTGGCAAAAAAAACATATG... Nter M F T D G G K K N I... INSERZIONE DI 2 BASI FRAMESHIFT

5’..ATGTTTACTGATGGTGGCAAAAAACATATG... Nter M F T D G G K K H M... 5’..ATGTTTACTGATGGTGGCAAAAAAAACATATG... Nter M F T D G G K K N I... 5’..ATGTTTACTGATGGTGGGCAAAAAAAACATATG... Nter M F T D G G Q K K H M... INSERZIONE DI UNA BASE ULTERIORE RIPRISTINO DEL CODICE DI LETTURA

RIARRANGIAMENTI SU SCALA PIU’ VASTA Delezione genica

RIARRANGIAMENTI SU SCALA PIU’ VASTA Inversione

RIARRANGIAMENTI SU SCALA PIU’ VASTA Traslocazione

RIARRANGIAMENTI SU SCALA PIU’ VASTA Duplicazione genica

RIARRANGIAMENTI SU SCALA PIU’ VASTA Divergenza Creazione di una famiglia genica

Emoglobine di vertebrati = globina  + globina  globina  e globina  umane  sono omologhe fra loro e omologhe a tutte le globine  e  di tutti i vertebrati globina  murina e globina  umana sono ORTOLOGHE (proteine omologhe di organismi diversi ma con la stessa funzione) globina  e globina  umane  sono PARALOGHE (proteine omologhe dello stesso organismo ma con funzioni diverse) globina  murina e globina  umana sono PARALOGHE (proteine omologhe di organismi diversi ma con funzioni diverse)

Come si riconosce l’OMOLOGIA? Le proteine omologhe hanno sequenze primarie simili La similitudine fra due sequenze proteiche si misura: ALLINEANDO le due sequenze e calcolando (i) percentuale di residui identici (ii) percentuale di residui simili__

ERAERNSHNSYN--ISNTDPGLEQIGAGIAGPPD- |:. |:| |: :..|| :| ||||: || | EKSARQSNNTLTAFVRDSDPPVE-IGAGMMGPLDT 31aa nell’allineamento (esclusi i residui in corrispondenza di gap) 14 aa sono identici quindi: %id = (14 / 31) * 100 = 45% Conteggiando anche i residui simili (:) %sim = (20 / 31) * 100 = 64% Conteggiando anche i residui simili (: e.) %sim = (23 / 31) * 100 = 74%

Se due proteine hanno %id > 30% la probabilità che siano omologhe è così alta da essere solitamente considerata una certezza Se si verifica che 20%< %id < 30% si può andare a verificare la %sim Se %sim > 40-50% è probabile ma non sicuro che le proteine siano omologhe

SBL-C QNWATFQQKHIINTPIINCNTIMDNNIYIVGGQCKRVNTFIISSATTVKAICTGV-INMN 59 RC208 QNWATFQQKHITNTSSINCNTIMDNNIYIVGGQCKGVNTFIISSATTVKAICTGV-INMN 59 RC218 QNWATFQEQHITNTSSINCSNIMNNSLYIVGGQCKKVNTFIASSATTVKGICSGV-TDKK 59 RC212 QNWATFQQKHITNTSSINCSNIMNNSLYIVGGQCKKVNTFIASSATTVKGICSGV-TDKK 59 SBL-J QNWAKFQEKHIPNTSNINCNTIMDKSIYIVGGQCKERNTFIISSATTVKAICSGASTNRN 60 RC-RNASEL1 QNWAKFKEKHITSTSSIDCNTIMDKAIYIVGGKCKERNTFIISSEDNVKAICSGVSPDRK 60 ONC QDWLTFQKKHITNTRDVDCDNIMSTNLF----HCKDKNTFIYSRPEPVKAICKGIIASKN 56 ONC-LR1 QDWLTFQKKHLTNTRDVDCNNIMSTNLF----HCKDKNTFIYSRPEPVKAICKGIIASKN 56 RC-RNASE6 QDWDTFQKKHLTDTKKVKCDVEMKKALF----DCKKTNTFIFARPPRVQALCKNIKDNTN 56 RC-RNASE3 QDWETFQKKHLTDTKKVKCDVEMAKALF----DCKKTNTFIYALPGRVKALCKNIRDNTD 56 RC-RNASE2 QNWETFQKKHLTDTRDVKCDAEMKKALF----DCKQKNTFIYARPGRVQALCKNIIVSKN 56 RC-RNASE4 QDWATFKKKHLTDTWDVDCDNLMPTSLF----DCKDKNTFIYSLPGPVKALCRGVIFSAD 56 * *.*:::*:.* :.*. *. ::.** **** *:.:*... SBL-C VLSTTRFQLNTCTRTSITPRPCPYSSRTETNYICVKCENQYPVHFAGIGRCP 111 RC208 VLSTTRFQLNTCTRTSITPRPCPYSSRTENNYICVKCENQYPVHFAGIGRCP 111 RC218 VLSSTKFQLDICTRIFITPRPCPYSSRTETNYICVKCENQYPVHFAGIGQCP 111 RC212 VLSSTKFQLDICTRIFITPRPCPYSSRTETNYICVKCENQYPVHFAGIGQCP 111 SBL-J VLSTTRFQLNTCIRSATAPRPCPYNSRTETNVICVKCENRLPVHFAGIGRC- 111 RC-RNASEL1 ELSTTSFKLNTCIRDSITPRPCPYHPSPDNNKICVKCEKQLPVHFVGIGKC- 111 ONC VLTTSEFYLSDCNVT---SRPCKYKLKKSTNKFCVTCENQAPVHFVGVGSC- 104 ONC-LR1 VLTTSEFYLSDCNVT---SRPCKYKLKKSTNTFCVTCENQAPVHFVGVGHC- 104 RC-RNASE6 VLSRDVFYLPQCNRK---KLPCHYRLDGSTNTICLTCMKELPIHFAGVGKCP 105 RC-RNASE3 VLSRDAFLLPQCDRI---KLPCHYKLSSSTNTICITCVNQLPIHFAGVGSCP 105 RC-RNASE2 VLSTDEFYLSDCNRI---KLPCHYKLKKSSNTICITCENKLPVHFVAVEECP 105 RC-RNASE4 VLSNSEFYLAECNVKP--RKPCKYKLKKSSNRICIRCEHELPVHFAGVGICP 106 *: * * ** *..* :*: * :. *:**..: * ALLINEAMENTO MULTIPLO