La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

A Brief Introduction to Molecular Systematics David S. Horner Dip. Scienze Biomolecolari e Biotecnologie

Presentazioni simili


Presentazione sul tema: "A Brief Introduction to Molecular Systematics David S. Horner Dip. Scienze Biomolecolari e Biotecnologie"— Transcript della presentazione:

1 A Brief Introduction to Molecular Systematics David S. Horner Dip. Scienze Biomolecolari e Biotecnologie

2 Letteratura consigliata Phylogenetic analyses: a brief introduction to methods and their application David S Horner and Graziano Pesole Expert Rev. Mol. Diagn. 4(3), 339–350 (2004) Phylogeny for the faint of heart:a tutorial Sandra L. Baldauf TRENDS in Genetics Vol.19 No.6 June 2003

3 Computers are like air- conditioning … They stop working if you open Windows ATTENZIONE

4 In Biologia Nulla Ha Senso Se Non è Visto da una Prospettiva Evolutiva Theodosius Dobzhansky ( ) (senza questa prospettiva [la biologia] diventa semplicemente un cumulo di fatti scollegati: alcuni sono interessanti, ma non dipingono insieme un quadro coerente)

5 Questa scuola tradizionale era dominante fino agli anni 60. È basata sullassunzione che il modo migliore di ricostruire le relazioni di un gruppo è di studiarlo per tutta la vita. Poi, lo specialista pubblica una filogenesi basata sulle sue impressioni Ha il vantaggio che genera esperti bravi. Ma ha anche lo svantaggio che non è per niente un approccio oggettivo I risultati sono poco riproducibili. Tassonomia evolutiva

6

7

8 Molecole come documenti della storia evolutiva Ci possiamo chiedere dove, nella vita, cè la quantità più alta di informazione rispetto al passato, e come possiamo estrarla? Forse nei vari tipi di macromolecole (sequenze) che portano linformazione genetica Emile Zuckerkandl – Linus Pauling

9 Evoluzione Molecolare TUTTI le sequenze molecolari (naturali) sono prodotti di processi evolutivi Possiamo usare sequenze per inferire rapporti evolutivi tra sequenze (e tra organismi) Se riusciamo capire come costretti selettivi influenzano levoluzione di diversi tipi di sequenze (geni codificanti, regione promotrice, junk DNA etc), magari potremmo PREDIRE il ruolo svolto da sequenze sotto esame.

10 Perche ci interessa levoluzione molecolare? Per capire la storia naturale di organismi e ambienti Per identificare e classificare nuove specie Per capire processi evolutivi Per la predizione e modificazione di funzione/ specificità di geni/enzimi. Studi basasti sullevoluzione molecolare può aiutarci ad associare i cambiamenti funzionali con le sostituzioni responsabili. Sviluppo di medicine/vaccini (selezione) Biomonitoraggio (ecologia molecolare)

11 Quale è il più stretto parente dei baci di dama ? UFO Gioiello metallaro Fragola vampira Space alien

12

13

14

15 Lomologia è….. Omologia: similarita risultando da eredita da un genitore stessa. Lidentificazione e lanalisi di omologia sono fundamentale nella sistematica filogenetica. 70% homology?

16 Typical Eukaryote Gene Structure

17 Eredita dei geni Geni vengono ereditati dai genitori La loro sequenza puo cambiare con tempo (mutazione) Cambiamementi possono essere ereditati A volte, geni vengono DUPLICATI opure PERSI Nel arco del tempo evolutivo, solo sequenze importanti vengono conservate Possiamo applicare il concetto di omologia a geni

18 Mutations are random events: their occurrence is independent of their selective value - i.e., they do not occur when they are needed any more often than they would otherwise. Mutations at any single locus are rare events: mutation rates at a typical locus are about 1 in 10 6 gametes.

19 Some types of mutations. Substitution: one nucleotide is substituted for another, frequently this causes no change in the resulting organism, sometimes the change can be dramatic. Insertion: DNA is inserted into a gene, either one nucleotide or many. Sometimes, entire genes are inserted by viruses and transposable elements. Deletion: DNA bases are removed. Small insertions and deletions can inactivate large stretches of a gene, by causing a frame shift that renders a gene meaningless. Duplication: an entire gene is duplicated. Transposition: DNA is moved to a new place in the genome, frequently this happens because of errors in meiosis or transposable elements.

20 Meccanismi dellevoluzione sostituzioni puntiformi A G T C Purine Pirimidine Transizioni Transversioni

21 Transizioni vs Transversioni Le transizioni sono più frequenti delle trasversioni. La frequenza delle mutazioni puntiformi (1 per bases incorporate) è molto inferiore di quanto atteso (circa 10 -6) a causa dei sistemi di riparazione. Meccanismi dellevoluzione

22 Soppressione di CpG Modificazione epigenetica (metilazione) di residui C nella dinucleotide CG e diffusa in tanti organismi Il C metilato e sensibile a un processo di diaminazione che cambia C>T (U). Dopo replicazione, se lerrore no e messo a posto da proofreading, succede una transizione in una delle eliche prodotte.

23 Mutazioni PUNTIFORMI: conseguenze Dipendono da: 1)Regione del gene che viene colpita (promotore, regioni trascritte non tradotte, regione codificante…) 2)natura della mutazione 3)Selezione Naturale

24 Mutazione e Fissazione Per essere geneticamente rilevante una mutazione deve essere ereditata, cioè deve avvenire nella linea germinale e diffondersi in una proporzione significativa della popolazione (fissazione). Nella filogenesi molecolare studiamo mutazioni fissi. Meccanismi dellevoluzione

25 Mutazione sinonima

26 Mutazione missenso (nonsinonima)

27 Mutazione nonsenso (nonsinonima)

28 Indel nella seq. codificante per una proteina Mutazione frameshift

29 La teoria neutrale di Kimura (1968) Geni sono stati, in qualche senso, gia ottimizzati dal processo evolutivo La maggior parte delle nuove mutazioni sono deleterie o neutrale. La maggior parte della variazione osservata è neutrale, poichè le mutazioni deleterie vengono rapidamente eliminate. Orologio molecolare

30 Tomoko Ohta 1973: ha introdotto il concetto di nearly neutral evolution (evoluzione quasi neutrale) (mutazioni poco deleterie possono essere fissate nella popolazione). Saul G. Needleman – Christian D. Wunsch 1970 Allineamento ottimale di due sequenze omologhe. Anni 70 - Biologia molecolare moderna –Clonaggio di DNA –Sequenziamento di DNA Anni 80 –PCR –micro computer –Primi Tree of life

31

32

33

34 DNA vs Proteins … Ser Gly Arg His Lys … UCU GGU CGU CAU AAA UCC GGC CGC CAC AAG UCG GGG CGG UCA GGA CGA AGU AGC Tante sequenze nucleotidiche diverse possono codificare la stessa sequenza proteica

35 Selezione al livello di DNA. Una stima semplice per sequenze codificante Per 2 sequenze: K a è la proporzione di siti non-sinonimi dove ce stato un sostituzione. K s è la proporzione di siti sinonimi dove ce stato un sostituzione. Se: K s / K a >1 ci sono costretti che preventano sostituzioni aminoacidici K s / K a =1 non ce selezione K s / K a <1 ce slezione positiva (cambiamenti vengono seletti)

36 DNA vs Proteins DNA : 52 cambiamenti Protein : 2 cambiamenti

37 Spinach and Azotobacter ferredoxins Protein sequence vs structure

38 Il grado di conservazione segua lordine: DNA < Sequenze Proteiche < Struttura Secondaria Proteica < Struttura Tridimensionale Proteica DNA vs Proteine

39 Esiste un orologio molecolare? Lidea di orologio molecolare fu inizialmente suggerita da Zuckerkandl e Pauling nel 1962 Era basata sullosservazione che i tassi di sostituzione aminoacidica nelle emoglobine animali erano approssimativamente proporzionali alle distanze temporali - stimate dai reperti fossili

40 *Stolen from a great site nitro.biosci.arizona.edu/.../Lecture47.htmlnitro.biosci.arizona.edu/.../Lecture47.html Although its importance, relative to Darwininan evolution, is debated, this theory is farily well supported by now. Rates of molecular evolution vary among proteins, and among organisms. Some proteins allow much less neutral variation, and evolve more slowly. Interestingly, population size is not that important for rates of molecular evolution (it cancels out in the math, small populations drift faster, but have fewer mutants per generation)

41 Non esiste un orologio molecolare universale La proposta iniziale vedeva lorologio come un processo di tipo Poisson con un tasso costante Ora si sa che è più complesso. Differenze nel tasso di sostituzione esistono per: –Differenti siti di una stessa molecola –Differenti geni –Differenti regioni dei genomi –Differenti genomi entro una stessa cellula –Differenti gruppi tassonomici analizzati per lo stesso gene Non esiste un orologio molecolare universale

42 Multi-gene families: Evolution by gene duplication Gene duplication is the most important mechanism for generating new genes and new biochemical processes. This mechanism has facilitated the evolution of complex organisms: In the genomes of eukaryotes, internal duplications of gene segments have occurred frequently. Many complex genes might have evolved from small primordial genes through internal duplication and subsequent modification. Vertebrate genomes contain many gene families absent in invertebrates. Many gene duplications have occurred in the early evolution of animals (Biologys Big Bang, Cambrian explosion, ~ million year ago).

43 A duplication may involve a single gene (complete gene duplication) part of a gene (internal or partial gene duplication) part of a chromosome (partial polysomy) an entire chromosome (aneuploidy or polysomy) the whole genome (polyploidy) Types of duplication events

44 Duplicazioni Geniche Subito dopo una duplicazione genica, ce una coppia di geni identici…. Cosa può succedere?

45 Destini dei geni duplicati Possono mantenere la stessa funzione e pattern di espressione Possono accumulare mutazioni (nella regione codificante o nel promotore) e diventare pseudogeni

46 Origine di pseudogeni Tanti geni duplicati diventano PSEUDOGENI e a volte vengono persi dal genoma. PSEUDOGENE : una sequenza di DNA non-funzionale, derivata da un gene funzionale. Alcuni pseudogeni hanno una funzione e altri vengono riabilitate.

47 Origine di subfunzioni : I geni derivati dalla duplicazione assumono diversi aspetti della funzione del gene ancestrale Tali cambiamenti succedono spesso rapidamente dopo la duplicazione.

48 Origine di neofunzioni Cambiamenti funzionali della proteina risultano da sostituzioni nella regione codificante Pattern diversi dellesspresione (diversi tissuti/tempi durante lo sviluppo) risultano da sostituzioni nelle regioni regulatrici.

49 Ortologhi e paraloghi a A b cBC Gene ancestrale Duplicazione ci da 2 copie = paraloghi nello stesso genoma ortologhi paraloghi

50 hanno entrambe limplicazione di omologia Ortologia vs Paralogia Ortologia Sequenze derivate da un gene ancestrale comune dopo un evento di SPECIAZIONE Paralogia Sequenze derivate da un gene ancestrale comune dopo un evento di DUPLICAZIONE GENICA

51 Ruolo delle duplicazioni geniche nellevoluzione dellorganismo generano nuovo materiale genetico per levoluzione di nuove funzioni/complessità duplicazioni specie-specifiche possono permettere levoluzione di funzioni specie- specifiche che possono facilitare ladattamento allambiente Duplicazioni e generazione di pseudogeni popolazione-specifica contribuiscono allisolamento riproduttivo (speciazione)

52 AGGGCCCTTG AGGGTCCTTG This is the FIRST substitution event AGGGCCCTTG AGGGTCCTTG The SECOND event has a 1/20 chance (in this case), of occurring at the SAME position AGGGCCCTTG AGGGGCCTTG After a Duplication/Speciation

53 La saturazione è dovuta a cambiamenti multipli dello stesso sito durante la divergenza (dopo una ramificazione) La maggior parte dei dati contiene alcuni siti che evolvono rapidamente e che sono potenzialmente saturati (es. Nelle sequenze codificanti per proteine la terza posizione dei codoni) Nei casi più eclatanti i dati diventano essenzialmente casuali e non è possibile rintracciare informazioni circa le relazioni evolutive Saturazione nei dati di sequenza:

54 Cambiamenti multipli a un singolo sito - cambiamenti nascosti GC A G T G pos 1 pos 2 Numero di cambiamenti Seq 1 AGCGAG Seq 2 GCCGAC pos 3 C A C

55 Distanza Genetica expected difference observed difference La proporzione osservata di cambiamenti non riflette bene il reale numero di cambiamenti evolutivi quando il livello di divergenza è alto. Saturation Correction

56 Introduzione agli alberi filogenetici

57 Phylogenetic systematics Omologia: si riferisce allevidenza di un progenitore comune (common descent) Usa alberi per indicare relazione Gruppi monofiletici (clades) - contengono organismi (o sequenze ) che sono più strettamente imparentate fra di loro di quanto siano imparentate con altre organismi (o sequenze) al di fuori del gruppo.

58 Terminologia I Node/nodo: un punto di ramificazione su un albero filogenetico

59 E. coli Arabidopsis Riso Danio Uomo Topo Ratto Ramo Nodo

60 Terminologia II Taxon: Un livello di classificazione, una specie, un genere, una famiglia. Usato nella filogenesi molecolare anche per descrivere un OTU. OTU (Operational Taxonomic Unit), una foglia di un albero filogenetico, può essere una specie oppure una sequenza

61 E. coli Arabidopsis Riso Danio Uomo Topo Ratto Ramo Nodo Taxon/OTU Taxon

62 Clade/Gruppo monofiletico: un gruppo che contiene tutti gli OTU che sono discesi da un nodo. Gruppo parafiletico: un gruppo tassonomico che NON contiene tutti gli OTU che sono discesi da un nodo.

63 E. coli Arabidopsis Riso Danio Uomo Topo Ratto Nodo Ancestrale Clade/Gruppo monofiletico

64 I rettili non costituiscono un gruppo strettamente monofiletico. sono PARAFILETICI Arabidopsis Topo Homo Gecco Dinosauro Falcone Passero Clade?…..SI

65 Cladogrammi Cladogrammi mostrano lordine delle ramificazioni, lunghezze dei rami non significano niente E. coli Arabidopsis Riso Danio Uomo Topo Ratto E. coli Arabidopsis Riso Danio Uomo Topo Ratto

66 Filogrammi le lunghezze dei rami indicano il grado di divergenza E. coli Arabidopsis Riso Danio Uomo Topo Ratto Filogrammi

67 ACCTC ACGTC ACGTC ? G>C? Difficile sapere la direzione ACCTC ACGTC ACCTC ? C>G ?

68 OUTGROUP (Scelta) Una divergenza BASALE al INGROUP Non TROPPO lontano/divergente Meglio provare con piu di un outgroup

69 Alberi e Radici Riso Arabdopsis E. coli Danio Ratto Topo Homo Albero non radicato

70 E.coli OUTGROUP radice Danio Topo Ratto Homo Arabidopsis Riso Gruppo monofiletico Radicato da un outgroup Alberi e Radici

71 Riso Arabdopsis E. coli Danio Ratto Topo Homo Albero non radicato

72 Danio radice E. coli Topo Ratto Homo Arabidopsis Riso Gruppo monofiletico Alberi e Radici

73 Alberi di geni e alberi di specie Facciamo spesso lassunzione che sono la stessa cosa….. a b c A B C Albero di geni Albero di specie

74 Ortologhi and paraloghi a A b cBC Gene ancestrale Duplicazione ci da 2 copie = paraloghi nello stesso genoma ortologhi paraloghi

75 Ortologhi and paraloghi ChimpA*HomoA TopoA Gene ancestrale Duplicazione ci da 2 copie = paraloghi nello stesso genoma ortologhi paraloghi ChimpB HomoB* TopoB*

76 Ortologhi and paraloghi ChimpA*HomoA TopoA Gene ancestrale Duplicazione ci da 2 copie = paraloghi nello stesso genoma ortologhi paraloghi ChimpB HomoB* TopoB* Pesce

77 Ortologhi e paraloghi UomoTopoChimp Un albero che contiene una selezione non completa di paraloghi e ortologhi Pesce

78 hanno entrambe limplicazione di omologia Ortologia vs Paralogia Ortologia Sequenze derivate da un gene ancestrale comune dopo un evento di SPECIAZIONE Paralogia Sequenze derivate da un gene ancestrale comune dopo un evento di DUPLICAZIONE GENICA

79 Lalbero filogenetico questo gene contiene un misto di ortologhi e paraloghi Salmonella Danio 1 Ratto 1 Topo 1 Homo 1 Topo 2 Ratto 2 Homo 2 E.coli Solanum tuberosum Brassica Riso Gene duplication POLITOMIA

80 Lalbero filogenetico di questo gene contiene un misto di ortologhi e paraloghi Salmonella Danio 1 Ratto 1 Topo 1 Homo 1 Topo 2 Ratto 2 Homo 2 E.coli Solanum tuberosum Brassica Riso Gene duplication Danio 2?

81 Numero di alberi distinti in funzione del numero di taxa 10 2* * * * * N taxaN trees

82 Phylogenetic systematics Omologia: si riferisce allevidenza di un progenitore comune (common descent) Usa alberi per indicare relazione Gruppi monofiletici (clades) - contengono organismi (o sequenze) che sono più strettamente imparentate fra di loro di quanto siano imparentate con altre organismi (o sequenze) al di fuori del gruppo.

83 Newick Format ((A,B),(C,D)); A B C D AB CD

84 Multifurcazioni ((A,B,C),(D,E)); D C A B E

85 Lunghezza di Rami ((A:1,B:1):2,(C:2,D:1):3):0; = AB C D


Scaricare ppt "A Brief Introduction to Molecular Systematics David S. Horner Dip. Scienze Biomolecolari e Biotecnologie"

Presentazioni simili


Annunci Google