A Brief Introduction to Molecular Systematics

Slides:



Advertisements
Presentazioni simili
Malattie genetiche monogeniche
Advertisements

La scambio di materiale
Il DNA.
Genetica dei Microrganismi ed Applicata
Corso di genetica agraria Eredità extranucleare
GENI HOX Solo in questi ultimissimi anni le indagini filogenetiche molecolari hanno avuto come oggetto i geni Hox. Questi ultimi, presenti in tutti i Metazoi,
GENE: segmento di DNA che trasporta l’informazione per un determinato
Sequenza-struttura-funzione
Bioinformatica Prof. Mauro Fasano
Biologia.blu B - Le basi molecolari della vita e dell’evoluzione
Come nasce la Bioinformatica? Progetti di sequenziazione del genoma Sforzi sperimentali per determinare la struttura e le funzioni di molecole biologiche.
Per avere una utilità pratica un marcatore deve essere polimorfico
MUTAZIONE Il termine mutazione, in genetica, si riferisce a cambiamenti trasmissibili del materiale genetico. Può riferirsi al cambiamento di una singola.
L’evoluzione non… Lino Ometto Fondazione Edmund Mach
Evoluzione del genoma Lezione 13 By NA.
Organizzazione del genoma umano III
LICEO SCIENTIFICO TECNOLOGICO Classe 5TB A.S. 2009/2010
Physically-based Animations of 3D Biped Characters with Genetic Algorithms Università di Roma La Sapienza Relatore: Prof. Marco Schaerf Correlatore: Ing.
Le biotecnologie IN QUESTO NUMERO => Cosa sono le biotecnologie?
DNA PROTEINE SISTEMI DI REGOLAZIONE E CONTROLLO SVILUPPO E EVOLUZIONE.
Bioinformatica Andrea G. B. Tettamanzi.
La trasmissione dell’informazione genetica
Caratteri complessi Vincenzo Nigro Dipartimento di Patologia Generale
La mutazione genica La mutazione genica è un cambiamento del materiale ereditario di un gene. Un gene è una sequenza di nucleotidi del DNA, che codifica.
Log (fitness) selezione ricombinazione mutazione.
L’ ALU UN VIAGGIO NEL DNA.
La diversità è un aspetto caratteristico della vita:
Allineamento Metodo bioinformatico che date due o più sequenze ne mette in evidenza similarità/diversità, supponendo che le sequenze analizzate abbiano.
È stimato che oggi sulla terra sono presenti
TASSONOMIA DEI MICOBATTERI
Filogenesi molecolare
Citogenetica evoluzionistica
Cap. 17 Regolazione dell’espressione genica negli Eucarioti. Pp
Alcuni esempi di domande di esame
Laboratorio Giovani Scienziati Cercansi Anno Scolastico Il 2009 è lanno di Darwin. Sono passati 200 anni dalla nascita del grande naturalista.
POLIMORFISMO GENETICO
Sintesi di una proteina Cos’è il patrimonio genetico
Natura della variabilità genetica
A.A CORSO INTEGRATO DI INFORMATICA E BIOINFORMATICA per il CLT in BIOLOGIA MOLECOLARE Scuola di Scienze, Università di Padova Docenti: Dr.
Dip. Scienze Biomolecolari e Biotecnologie
Origin and evolution of the adaptive immune system: genetic events and selective pressures NATURE REVIEWS | Genetics V0LUME 11 | JANUARY 2010 Specializzando:
Laboratorio di Metodo di Studio
DNA – REPLICAZIONE (1) Semiconservativa: Catene genitrici
Esempio di utilizzo del programma BLAST disponibile all’NCBI
L’equilibrio di HW riguarda il modo in cui i gameti si assortiscono due a due a formare gli zigoti, possiamo definirlo quindi un equilibrio diploide L’altro.
TRADUZIONE del RNA.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle.
STRUTTURA  FUNZIONE  EVOLUZIONE STRUTTURA  (FUNZIONE)  EVOLUZIONE Organi, tessuti ecc. Geni o segmenti genomici.
CORSO DI BIOLOGIA - Programma
Allineamento di sequenze
TOSSICOLOGIA GENETICA
Scienze : La genetica : Le mutazioni e la clonazione
Una volta stabilito che un insieme di proteine sono tra di loro omologhe posso procedere ad un allineamento multiplo. Il programma più usato a questo scopo.
Allineamento di sequenze Perché è importante? Le caratteristiche funzionali delle molecole biologiche dipendono dalle conformazione tridimensionale che.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle Prof.
I cambiamenti della sequenza del DNA: Evoluzione
Concetti di base. Per biodiversità si intende l'insieme di tutte le forme viventi geneticamente diverse e degli ecosistemi ad esse correlati Il termine.
Biologia evoluzionistica dello sviluppo “EVODEVO” L’evoluzione è legata a modificazioni trasmissibili dello sviluppo degli organismi Genetica dello sviluppo,
Clonaggio funzionale Clonaggio posizionale Conoscenza proteina Malattia genetica Determinazione sequenza amminoac.Mappatura genetica con marcatori polimorfici.
Definizione di GENETICA
Genetica diretta e Genetica inversa: approcci sperimentali classici e metodologie recenti per lo studio della funzione dei geni.
DNA Barcoding. Cos’è il DNA barcoding? Ottenimento di una breve sequenza di DNA che permette l’identificazione o il riconoscimento di specie all’interno.
Assegnazione dei codoni mediante uso di
Geni o segmenti genomici
Mutazioni Una modificazione chimica di una base
Transcript della presentazione:

A Brief Introduction to Molecular Systematics David S. Horner Dip. Scienze Biomolecolari e Biotecnologie david.horner@unimi.it

Letteratura consigliata Phylogenetic analyses: a brief introduction to methods and their application David S Horner and Graziano Pesole† Expert Rev. Mol. Diagn. 4(3), 339–350 (2004) Phylogeny for the faint of heart:a tutorial Sandra L. Baldauf TRENDS in Genetics Vol.19 No.6 June 2003

ATTENZIONE Computers are like air-conditioning … They stop working if you open Windows

“In Biologia Nulla Ha Senso Se Non è Visto da una Prospettiva Evolutiva” Theodosius Dobzhansky (1900-1975) (“senza questa prospettiva [la biologia] diventa semplicemente un cumulo di fatti scollegati: alcuni sono interessanti, ma non dipingono insieme un quadro coerente”) 4

Tassonomia evolutiva Questa scuola tradizionale era dominante fino agli anni ‘60. È basata sull’assunzione che il modo migliore di ricostruire le relazioni di un gruppo è di studiarlo per tutta la vita. Poi, lo specialista pubblica una filogenesi basata sulle sue impressioni Ha il vantaggio che genera esperti bravi. Ma ha anche lo svantaggio che non è per niente un approccio oggettivo I risultati sono poco riproducibili.

6

7

Molecole come documenti della storia evolutiva “Ci possiamo chiedere dove, nella vita, c’è la quantità più alta di informazione rispetto al passato, e come possiamo estrarla?” “Forse nei vari tipi di macromolecole (sequenze) che portano l’informazione genetica” Emile Zuckerkandl – Linus Pauling 8

Evoluzione Molecolare TUTTI le sequenze molecolari (naturali) sono prodotti di processi evolutivi Possiamo usare sequenze per inferire rapporti evolutivi tra sequenze (e tra organismi) Se riusciamo capire come costretti selettivi influenzano l’evoluzione di diversi tipi di sequenze (geni codificanti, regione promotrice, “junk DNA” etc), magari potremmo PREDIRE il ruolo svolto da sequenze sotto esame.

Perche ci interessa l’evoluzione molecolare? Per capire la storia naturale di organismi e ambienti Per identificare e classificare nuove specie Per capire processi evolutivi Per la predizione e modificazione di funzione/ specificità di geni/enzimi. Studi basasti sull’evoluzione molecolare può aiutarci ad associare i cambiamenti funzionali con le sostituzioni responsabili. Sviluppo di medicine/vaccini (selezione) Biomonitoraggio (ecologia molecolare) 10

Quale è il più stretto parente dei “baci di dama” ? UFO Fragola vampira Gioiello metallaro Space alien 11

12

13

14

L’omologia è….. Omologia: similarita risultando da eredita da un genitore stessa. L’identificazione e l’analisi di omologia sono fundamentale nella sistematica filogenetica. 70% homology? 15

Typical Eukaryote Gene Structure 16

Eredita dei geni Geni vengono ereditati dai genitori La loro sequenza puo cambiare con tempo (mutazione) Cambiamementi possono essere ereditati A volte, geni vengono DUPLICATI opure PERSI Nel arco del tempo evolutivo, solo sequenze “importanti” vengono conservate Possiamo applicare il concetto di omologia a geni

Mutations are random events: their occurrence is independent of their selective value - i.e., they do not occur when they are needed any more often than they would otherwise. Mutations at any single locus are rare events: mutation rates at a typical locus are about 1 in 106 gametes. 18

Some types of mutations. Substitution: one nucleotide is substituted for another, frequently this causes no change in the resulting organism, sometimes the change can be dramatic. Insertion: DNA is inserted into a gene, either one nucleotide or many. Sometimes, entire genes are inserted by viruses and transposable elements. Deletion: DNA bases are removed. Small insertions and deletions can inactivate large stretches of a gene, by causing a frame shift that renders a gene meaningless. Duplication: an entire gene is duplicated. Transposition: DNA is moved to a new place in the genome, frequently this happens because of errors in meiosis or transposable elements. 19

Meccanismi dell’evoluzione sostituzioni puntiformi A G T C Transizioni Transizioni Transversioni Pirimidine Purine 20

Meccanismi dell’evoluzione Transizioni vs Transversioni Le transizioni sono più frequenti delle trasversioni. La frequenza delle mutazioni puntiformi (1 per 10-9 - 10-10 bases incorporate) è molto inferiore di quanto atteso (circa 10-6) a causa dei sistemi di riparazione. 21

Soppressione di “CpG” Modificazione “epigenetica” (metilazione) di residui “C” nella dinucleotide “CG” e diffusa in tanti organismi Il C metilato e sensibile a un processo di “diaminazione” che cambia C>T (U). Dopo replicazione, se l’errore no e messo a posto da proofreading, succede una transizione in una delle eliche prodotte.

Mutazioni PUNTIFORMI: conseguenze Dipendono da: Regione del gene che viene colpita (promotore, regioni trascritte non tradotte, regione codificante…) natura della mutazione Selezione Naturale 1) Esempi di possibili effetti delle mutazioni puntiformi in relazione alla regione colpita: Promotore - efficienza di trascrizione Regioni trascritte non tradotte (UTR) - stabilita’ e traducibilità mRNA Regione strutturale di un gene codificante per rRNA o tRNA - struttura e funzione dell’RNA Regione codificante per una proteina - struttura e funzione della proteina 23

Meccanismi dell’evoluzione Mutazione e Fissazione Per essere geneticamente rilevante una mutazione deve essere ereditata, cioè deve avvenire nella linea germinale e diffondersi in una proporzione significativa della popolazione (fissazione). Nella filogenesi molecolare studiamo mutazioni fissi. 24

Mutazione sinonima Mutazione neutra: il nuovo codone codifica per un aminoacido compatibile. Proteina completa funzionante. Fenotipo selvatico. Mutazione silente: nuovo codone è sinonimo del codone selvatico. 25

Mutazione missenso (nonsinonima) Mutazione missenso: cambiamento di un codone che porta alla sostituzione dell’aminoacido selvatico con un altro aminoacido (che altera la funzione della proteina). Proteina completa ma non funzionante. Fenotipo mutante (completo o “leaky”). Esempio: mutazione missenso nel sesto codone della beta-globina umana è la causa dell’anemia falciforme! 26

Mutazione nonsenso (nonsinonima) Mutazione nonsenso: formazione di un codone di stop al posto di un codone di senso selvatico. Proteina tronca (non funzionante). Fenotipo mutante. 27

Indel nella seq. codificante per una proteina Mutazione frameshift: la fase di lettura scivola di un nucleotide in avanti (inserzione) o indietro (delezione). Tutti i codoni sono diversi dal selvatico a partire dal punto della mutazione e spesso si origina un codone di stop. Proteina con sequenza aminaocidica completamente diversa. Fenotipo mutante completo. Mutazione frameshift 28

La teoria neutrale di Kimura (1968) Geni sono stati, in qualche senso, gia “ottimizzati” dal processo evolutivo La maggior parte delle nuove mutazioni sono deleterie o neutrale. La maggior parte della variazione osservata è neutrale, poichè le mutazioni deleterie vengono rapidamente eliminate. Orologio molecolare 29

Anni ‘70 - Biologia molecolare “moderna” Tomoko Ohta 1973: ha introdotto il concetto di “nearly neutral evolution” (evoluzione quasi neutrale) (mutazioni poco deleterie possono essere fissate nella popolazione). Saul G. Needleman – Christian D. Wunsch 1970 Allineamento ottimale di due sequenze omologhe. Anni ‘70 - Biologia molecolare “moderna” Clonaggio di DNA Sequenziamento di DNA Anni ‘80 PCR micro computer Primi “Tree of life” 30

31

32

33

DNA vs Proteins … Ser Gly Arg His Lys … UCU GGU CGU CAU AAA UCC GGC CGC CAC AAG UCG GGG CGG UCA GGA CGA AGU AGC (much) more evolutionary information is stored in DNA than in protein sequences. Tante sequenze nucleotidiche diverse possono codificare la stessa sequenza proteica 34

Selezione al livello di DNA. Una stima semplice per sequenze codificante Per 2 sequenze: Ka è la proporzione di siti non-sinonimi dove c’e’ stato un sostituzione. Ks è la proporzione di siti sinonimi dove c’e’ stato un sostituzione. Se: Ks / Ka >1 ci sono costretti che preventano sostituzioni aminoacidici Ks / Ka =1 non c’e’ selezione Ks / Ka <1 c’e’ slezione positiva (cambiamenti vengono seletti) 35

DNA vs Proteins Protein : 2 cambiamenti DNA : 52 cambiamenti (much) more evolutionary information is stored in DNA than in protein sequences. DNA : 52 cambiamenti 36

Protein sequence vs structure Spinach and Azotobacter ferredoxins 37

DNA vs Proteine Il grado di conservazione segua l’ordine: DNA < Sequenze Proteiche < Struttura Secondaria Proteica < Struttura Tridimensionale Proteica 38

Esiste un orologio molecolare? L’idea di orologio molecolare fu inizialmente suggerita da Zuckerkandl e Pauling nel 1962 Era basata sull’osservazione che i tassi di sostituzione aminoacidica nelle emoglobine animali erano approssimativamente proporzionali alle distanze temporali - stimate dai reperti fossili 39

*Stolen from a great site nitro.biosci.arizona.edu/.../Lecture47.html Although its importance, relative to Darwininan evolution, is debated, this theory is farily well supported by now. Rates of molecular evolution vary among proteins, and among organisms. Some proteins allow much less neutral variation, and evolve more slowly. Interestingly, population size is not that important for rates of molecular evolution (it cancels out in the math, small populations drift faster, but have fewer mutants per generation) 40

Non esiste un orologio molecolare universale La proposta iniziale vedeva l’orologio come un processo di tipo Poisson con un tasso costante Ora si sa che è più complesso. Differenze nel tasso di sostituzione esistono per: Differenti siti di una stessa molecola Differenti geni Differenti regioni dei genomi Differenti genomi entro una stessa cellula Differenti gruppi tassonomici analizzati per lo stesso gene Non esiste un orologio molecolare universale 41

Multi-gene families: Evolution by gene duplication Gene duplication is the most important mechanism for generating new genes and new biochemical processes. This mechanism has facilitated the evolution of complex organisms: In the genomes of eukaryotes, internal duplications of gene segments have occurred frequently. Many complex genes might have evolved from small primordial genes through internal duplication and subsequent modification. Vertebrate genomes contain many gene families absent in invertebrates. Many gene duplications have occurred in the early evolution of animals (“Biology’s Big Bang”, “Cambrian explosion”, ~570-505 million year ago).

Types of duplication events A duplication may involve a single gene (complete gene duplication) part of a gene (internal or partial gene duplication) part of a chromosome (partial polysomy) an entire chromosome (aneuploidy or polysomy) the whole genome (polyploidy)

Duplicazioni Geniche Subito dopo una duplicazione genica, c’e’ una coppia di geni identici…. Cosa può succedere? 44

Destini dei geni duplicati Possono mantenere la stessa funzione e pattern di espressione Possono accumulare mutazioni (nella regione codificante o nel promotore) e diventare pseudogeni 45

Origine di pseudogeni Tanti geni duplicati diventano PSEUDOGENI e a volte vengono persi dal genoma. PSEUDOGENE : una sequenza di DNA non-funzionale, derivata da un gene funzionale. Alcuni pseudogeni hanno una funzione e altri vengono riabilitate. 46

Origine di subfunzioni: I geni derivati dalla duplicazione assumono diversi aspetti della funzione del gene ancestrale Tali cambiamenti succedono spesso rapidamente dopo la duplicazione. 47

Origine di neofunzioni Cambiamenti funzionali della proteina risultano da sostituzioni nella regione codificante Pattern diversi dell‘esspresione (diversi tissuti/tempi durante lo sviluppo) risultano da sostituzioni nelle regioni regulatrici. 48

Ortologhi e paraloghi paraloghi ortologhi ortologhi a b c C B A Duplicazione ci da 2 copie = paraloghi nello stesso genoma Gene ancestrale 49

Ortologia vs Paralogia hanno entrambe l’implicazione di omologia Sequenze derivate da un gene ancestrale comune dopo un evento di SPECIAZIONE Ortologia Sequenze derivate da un gene ancestrale comune dopo un evento di DUPLICAZIONE GENICA Paralogia 50

Ruolo delle duplicazioni geniche nell‘evoluzione dell‘organismo generano nuovo materiale genetico per l‘evoluzione di nuove funzioni/complessità duplicazioni specie-specifiche possono permettere l‘evoluzione di funzioni specie-specifiche che possono facilitare l‘adattamento all‘ambiente Duplicazioni e generazione di pseudogeni popolazione-specifica contribuiscono all‘isolamento riproduttivo (speciazione) 51

After a Duplication/Speciation AGGGCCCTTG AGGGTCCTTG This is the FIRST substitution event The SECOND event has a 1/20 chance (in this case), of occurring at the SAME position AGGGGCCTTG 52

Saturazione nei dati di sequenza: La saturazione è dovuta a cambiamenti multipli dello stesso sito durante la divergenza (dopo una ramificazione) La maggior parte dei dati contiene alcuni siti che evolvono rapidamente e che sono potenzialmente saturati (es. Nelle sequenze codificanti per proteine la terza posizione dei codoni) Nei casi più eclatanti i dati diventano essenzialmente casuali e non è possibile rintracciare informazioni circa le relazioni evolutive 53

Cambiamenti multipli a un singolo sito - cambiamenti nascosti Seq 1 AGCGAG Seq 2 GCCGAC Numero di cambiamenti A G T G pos 1 3 G C pos 2 1 C A C pos 3 2 54

Distanza Genetica La proporzione osservata di cambiamenti non riflette bene il reale numero di cambiamenti evolutivi quando il livello di divergenza è alto. expected difference Correction Saturation observed difference 55

Introduzione agli alberi filogenetici 56

Phylogenetic systematics Omologia: si riferisce all’evidenza di un progenitore comune (common descent) Usa alberi per indicare relazione Gruppi monofiletici (clades) - contengono organismi (o sequenze) che sono più strettamente imparentate fra di loro di quanto siano imparentate con altre organismi (o sequenze) al di fuori del gruppo. 57

Terminologia I Node/nodo: un punto di ramificazione su un albero filogenetico 58

E. coli Riso Arabidopsis Danio Ratto Topo Nodo Uomo Ramo 59

Terminologia II Taxon: Un livello di classificazione, una specie, un genere, una famiglia. Usato nella filogenesi molecolare anche per descrivere un OTU. OTU (Operational Taxonomic Unit), una “foglia” di un albero filogenetico, può essere una specie oppure una sequenza 60

Taxon/OTU Taxon Nodo Ramo E. coli Riso Arabidopsis Danio Ratto Topo Uomo Ramo 61

Clade/Gruppo monofiletico: un gruppo che contiene tutti gli OTU che sono discesi da un nodo. Gruppo parafiletico: un gruppo tassonomico che NON contiene tutti gli OTU che sono discesi da un nodo. 62

Clade/Gruppo monofiletico Nodo Ancestrale E. coli Riso Arabidopsis Danio Ratto Clade/Gruppo monofiletico Topo Uomo Nodo Ancestrale 63

Arabidopsis Homo Topo Gecco Passero Clade?…..SI Falcone Dinosauro I rettili non costituiscono un gruppo strettamente monofiletico. sono PARAFILETICI 64

Cladogrammi Cladogrammi mostrano l’ordine delle ramificazioni, lunghezze dei rami non significano niente E. coli Riso Arabidopsis Danio Ratto Topo Uomo E. coli Riso Arabidopsis Danio Ratto Topo Uomo 65

Filogrammi Filogrammi le lunghezze dei rami indicano il grado di divergenza E. coli Riso Arabidopsis Danio Ratto Topo Uomo 66

Difficile sapere la direzione ACCTC ACGTC G>C? ACGTC ? ACCTC ACGTC C>G ? ACCTC ? 67

OUTGROUP (Scelta) Una divergenza BASALE al INGROUP Non TROPPO lontano/divergente Meglio provare con piu di un outgroup 68

Alberi e Radici Albero non radicato E. coli Homo Arabdopsis Riso Topo Danio Ratto Topo Homo Arabdopsis Riso 69

Alberi e Radici Radicato da un “outgroup” E.coli OUTGROUP Arabidopsis Gruppo monofiletico Riso Danio Topo Gruppo monofiletico radice Ratto Homo 70

Alberi e Radici Albero non radicato E. coli Homo Arabdopsis Riso Topo Danio Ratto Topo Homo Arabdopsis Riso 71

Alberi e Radici Danio Arabidopsis Gruppo monofiletico Riso E. coli Topo Gruppo monofiletico radice Ratto Homo 72

Alberi di geni e alberi di specie Albero di geni Albero di specie c C Facciamo spesso l’assunzione che sono la stessa cosa….. 73

Ortologhi and paraloghi b c C B A Duplicazione ci da 2 copie = paraloghi nello stesso genoma Gene ancestrale 74

Ortologhi and paraloghi ChimpA* HomoA TopoA TopoB* ChimpB HomoB* Duplicazione ci da 2 copie = paraloghi nello stesso genoma Gene ancestrale 75

Ortologhi and paraloghi ChimpA* HomoA TopoA TopoB* ChimpB HomoB* Duplicazione ci da 2 copie = paraloghi nello stesso genoma Gene ancestrale Pesce 76

Chimp Topo Uomo Ortologhi e paraloghi Pesce Un albero che contiene una selezione non completa di paraloghi e ortologhi 77

Ortologia vs Paralogia hanno entrambe l’implicazione di omologia Sequenze derivate da un gene ancestrale comune dopo un evento di SPECIAZIONE Ortologia Sequenze derivate da un gene ancestrale comune dopo un evento di DUPLICAZIONE GENICA Paralogia 78

L’albero filogenetico questo gene contiene un misto di ortologhi e paraloghi Gene duplication Ratto 1 Topo 1 Homo 1 Danio 1 Topo 2 POLITOMIA Ratto 2 Homo 2 Solanum tuberosum Brassica Riso E.coli Salmonella 79

L’albero filogenetico di questo gene contiene un misto di ortologhi e paraloghi Gene duplication Ratto 1 Topo 1 Homo 1 Danio 1 Topo 2 Danio 2? Ratto 2 Homo 2 Solanum tuberosum Brassica Riso E.coli Salmonella 80

Numero di alberi distinti in funzione del numero di taxa N taxa N trees 10 2*106 22 3*1023 50 3*1074 100 2*10182 1000 2*102860 81

Phylogenetic systematics Omologia: si riferisce all’evidenza di un progenitore comune (common descent) Usa alberi per indicare relazione Gruppi monofiletici (clades) - contengono organismi (o sequenze) che sono più strettamente imparentate fra di loro di quanto siano imparentate con altre organismi (o sequenze) al di fuori del gruppo. 82

Newick Format ((A,B),(C,D)); C D A B C A B D

Multifurcazioni ((A,B,C),(D,E)); E D A B C

Lunghezza di Rami ((A:1,B:1):2,(C:2,D:1):3):0; = C 2 D 1 A B 1 1 3 2