La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Il genoma umano e la variabilità genetica

Presentazioni simili


Presentazione sul tema: "Il genoma umano e la variabilità genetica"— Transcript della presentazione:

1 Il genoma umano e la variabilità genetica
Sara Palumbo Laboratorio di Biologia Molecolare, Dipartimento di Patologia Chirurgica, Medica, Molecolare e dell’Area Critica

2 Tutte le cellule hanno lo stesso patrimonio genetico
Ogni cellula possiede un nucleo 100 trilioni di cellule Il nucleo contiene il materiale genetico Cellula Nucleo Il DNA è organizzato in cromosomi Mitocondrio Cromosoma Il DNA è organizzato in plasmidi DNA mitocondriale DNA nucleare Plasmide

3 DNA mitocondriale: i plasmidi
Ereditato solo dalla madre L’eredità materna permette ha permesso la trasmissione si similarità ai figli per molte generazioni. Infatti, è stato visto che frazioni del dna mitocondriale presente nell’uomo moderno sono attribuibili ad una singola donna che si stima essere vissuta circa – anni fa. Per questo motivo, ìl sequenziamento del DNA mitocondriale ha trovato importanti applicazioni nello studio dell’evoluzione dell’uomo e nelle migrazioni delle popolazioni nella storia. Contiene 37 geni che producono proteine necessarie per le funzioni del mitocondrio E’ molto suscettibile a mutazioni Plasmide

4 DNA nucleare: i cromosomi
22 cromosomi (autosomi) in duplice copia più 2 cromosomi sessuali Ereditato da entrambi i genitori From Father From Mother Il DNA nucleare contiene geni che producono proteine

5 1953: modello del DNA secondo Watson and Crick

6 Come è fatto il DNA L’informazione contenuta nel DNA è rappresentata dall’alternanza di 4 lettere C Citosina G Guanina A Adenina T Timina Basi azotate

7 Come è fatto il DNA Appaiamento delle basi azotate C G A T Nucleotide
Successivo fosfato deossiribosio Essential Cell Biology (© Garland Science 2010)

8 Il genoma umano E’ il materiale genetico completo di un organismo, ovvero tutto il DNA contenuto del nucleo di ogni cellula Contiene circa 3 miliardi di paia di basi organizzato in: GENI: di circa geni (2% dell’intero genoma), sono sequenze codificanti per le proteine SEQUENZE CODIFICANTI che generano RNA funzionali ma che non codificano per proteine (es. RNA ribosomiale) SEQUENZE NON CODIFICANTI: Funzione strutturale Funzione regolatrice della trascrizione

9 Il genoma umano Regioni intergeniche ed introni non vengono trascritte
Enhancer e promotori sono sequenze che non vengono trascritte con funzione regolatoria della tascrizione

10 Il genoma umano a confronto con altri organismi
Organismo Lunghezza (Mb) Numero di cromosomi Numero di geni Uomo 46 20 500 Lievito 12.16 16 6 300 E.Coli 4.64 1 4 498 Confronto con organismi unicellulari Homo sapiens Saccharomyces Cerevisae Escherichia coli

11 Le regioni NON codificanti hanno un ruolo chiave nella complessità degli organismi
Regioni NON codificanti aumentano nella scala evolutiva Molti geni si sono conservati durante l’evoluzione Confronto con organismi pluricellulari. Scala evolutiva del contenuto in DNA non codificante.

12 http://web. ornl. gov/sci/techresources/Human_Genome/project/info
1990 Uno dei principali promotori del progetto era Renato Dulbecco (1914), premio Nobel per la medicina nel Il progetto genoma umano è stato coordinato dall’ NIH e dal dipartimento dell’energia degli Stati Uniti che ha richiesto la collaborazione di diversi centri internazionali tra cui il Giappone, la Germania, il Regno Unito, la Francia e la Cina. Ha avuto lo scopo di determinare la sequenza dell’intero genoma e di identificare i geni in esso contenuti. Il progetto ha avuto ufficialmente inizio nel 1990 ed è terminato nel In 13 anni è stato possibile sequenziare l’intero genoma umano due anni meno del tempo stimato. Il presidente fu James Watson in collaborazione con Eric Green e Francis Collins. Costo di 200 milioni di dollari utilizzando macchinari che possono condurre fino a 96 reazioni in parallelo in 24 ore. l progetto ha inoltre studiato vari altri organismi non umani quali il batterio Escherichia coli, il moscerino della frutta Drosophila melanogaster e il topo da laboratorio

13 “Il Progetto Genoma Umano ha cambiato il modo di fare scienza”
Numero stimato dei geni umani Prima del sequenziamento del Genoma Dopo la prima bozza del Genoma Al termine del sequenziamento < Ad oggi 20 500 “Il Progetto Genoma Umano ha cambiato il modo di fare scienza” Eric Green, Francis Collins e il Nobel James Watson, Nature Diagnosi Prevenzione Cura

14 Se precedentemente sono stati necessari 13 anni per il sequenziamento di un intero genoma, nel 2012 è stato possibile sequenziare

15 Nature 2012 http://www. nature

16 Population 1000 Genomes Samples 2577
DNA sequenced from blood Offspring Samples from Trios Available Pilot Samples Phase 1 Samples Final Phase Discovery Sample Final Release Sample Total Chinese Dai in Xishuangbanna, China(CDX) no yes 99 93 Han Chinese in Bejing, China (CHB) 91 97 103 106 Japanese in Tokyo, Japan (JPT) 94 89 104 105 Kinh in Ho Chi Minh City, Vietnam (KHV) 101 Southern Han Chinese, China (CHS) 100 108 112 Total East Asian Ancestry (EAS) 185 286 515 504 523 Bengali in Bangladesh (BEB) 86 Gujarati Indian in Houston,TX (GIH) Indian Telugu in the UK (ITU) 102 Punjabi in Lahore,Pakistan (PJL) 96 Sri Lankan Tamil in the UK (STU) Total South Asian Ancestry (SAS) 494 489 African Ancestry in Southwest US (ASW) 61 66 African Caribbean in Barbados (ACB) Esan in Nigeria (ESN) Gambian in Western Division, The Gambia (GWD) 113 Luhya in Webuye, Kenya (LWK) 116 Mende in Sierra Leone (MSL) 85 Yoruba in Ibadan, Nigeria (YRI) 88 109 Total African Ancestry (AFR) 208 246 669 661 691 British in England and Scotland (GBR) 92 Finnish in Finland (FIN) Iberian populations in Spain (IBS) 14 107 Toscani in Italia (TSI) 98 110 Utah residents with Northern and Western European ancestry (CEU) Total European Ancestry (EUR) 160 379 505 503 514 Colombian in Medellin, Colombia (CLM) 60 95 Mexican Ancestry in Los Angeles, California (MXL) 67 64 69 Peruvian in Lima, Peru (PEL) Puerto Rican in Puerto Rico (PUR) 55 Total Americas Ancestry (AMR) 181 352 347 355 553 1092 2535 2504 2577 Sequenziamento condotto su un totale di 2577 (esclusi alcuni campioni della fase 1 che per ragioni di qualità non sono stati inclusi nell’ultima fase). I campioni appartenevano a 5 etnie principali: Asiatici dell’est, Asiatici del sud, Africani, Europei ed Americani.

17 Costi del sequenziamento

18 Costi del sequenziamento
First generation sequencing Sequenziamento tradizionale tramite il metodo Sanger. Costo: circa M $/ genoma Next generation sequencing (NGS) 2008-Today Costo: circa 1,000 $ / genoma Automatizzazione della metodica

19 High-Throughput NGS Instrument Read lenghts Time
The HiSeq X ™ Illumina 350 pb 2-3 days 454 Life Sciences/Roche GS FLX pb 10/23 hrs Ion Torrent™ ThermoFisher Scientific 400 pb 7.3 hrs La read lenght è la lunghezza dei frammenti che lo strumento è in grado di leggere e determina la capacità di copertura del genoma. Più grandi lunghezze permetteranno di avere coperture maggiori e quindi ridurre il numero di sequenziamenti.

20 NGS Illumina Frammentazione del DNA in frammenti casuali di 600 pb
Ibridizzazione alla Flow cell contenente sequenze complementari agli adaptor e formazione di ponti

21 NGS Illumina Amplificazione Denaturazione Cicli di amplificazione fino
a formazione di cluster

22 NGS Illumina 7 8 9 Aggiunta del secondo nucleotide
Legame solo del primo nucleotide sui frammenti usando nucleotidi fluorescenti La fluorescenza viene visualizzata in spot colorati

23 NGS Illumina La fluorescenza viene visualizzata in spot colorati
Successive scansioni dei cluster determinano la sequenza nucleotidica Allineamento delle sequenze

24 Allineamento informatico
Allineamento delle sequenze, bilioni di piccole sequenze di DNA, al genoma presente in NCBI BFAST sviluppato presso l’Università della California BWA (Burrows-Wheeler Aligner)

25 Sequenziatori Illumina: numero di cluster
MiSeq 40 M NextSeq 400 M HiSeq 5000 M Cluster più numerosi Maggiore risoluzione

26 454 Pyrosequencing process

27

28 Metodo ABI Solid

29

30

31

32

33 IL sequenziamento del genoma umano di molti individui ha portato all’individuazione di 3 milioni di paia di basi che variano tra gli individui su 3 miliardi di paia di basi che compongono il genoma

34 La variabilità genetica
Il 99.9% del DNA è conservato tra individui diversi Solo gemelli identici possiedono lo stesso genoma Una differenza dello 0.1% nella composizione del DNA è sufficiente per dar luogo alla variabilità della popolazione

35 I Polimorfismi Sono variazioni della sequenza del DNA presenti nella popolazione con una frequenza > 1%

36 Tipologie di Polimorfismi
Cambio di una base ..AAC ATA ACG CCG CGA GAT.. ..AAC ATA ACG CAG CGA GAT.. Sequenze ripetute in TANDEM in numero variabile ..AAC ATAACG ATAACG ATAACG ATAACG ATAACG ATAACG ATAACG GTT.. ..AAC ATAACG ATAACG ATAACG GTT..

37 SEQUENZE NUCLEOTIDICHE RIPETUTE IN TANDEM
VNTR Variable number tandem repeats (minisatelliti) STR Short tandem repeats (Microsatelliti) 15-40 nucleotidi 2-4 nucleotidi

38 Applicazioni DNA Fingerprinting Test di paternità In ambito forense

39 Polimorfismi a singolo nucleotide: SNP
Sono la fonte principale della variabilità genetica tra gli individui circa 1 ogni 1000 pb

40 Il numero degli SNP conosciuti e’ raddoppiato con il progetto 1000 genomi

41 Polimorfismi a singolo nucleotide: SNP
Mutazione Missenso Mutazione Non senso Mutazione Silente

42 Mutazioni che impattano la struttura proteica
La sequenza amminoacidica della proteina codificata è diversa Mutazione Missenso Lisina Glutammato La sequenza amminoacidica non è completa e la proteina è tronca Mutazione Non senso

43 Mutazioni silenti (sinonime)
Se il polimorfismo cade in una regione del genoma non codificante Se, cadendo in una zona codificante, la sequenza amminoacidica della proteina corrispondente e’ identica Mutazione Silente Lisina Lisina

44 Polimorfismi a singolo nucleotide: SNP
E’ stato predetto che circa un terzo dei polimorfismi Missenso possa avere conseguenze sulla funzione della proteina Le mutazioni Non senso, causando la produzione di proteine tronche, molto probabilmente risulteranno in una alterazione della funzione proteica Le mutazioni Silenti pur non influenzando la struttura della proteina potrebbero alternarne i livelli di espressione

45 SNP: fattori di “DIVERSITA”
Diversità tra popolazioni Diversità individuale Diversa suscettibilità a malattie Diversa risposta ai farmaci

46 Il concetto di suscettibilità
Condizione che aumenta la probabilità di sviluppare una malattia MA….. Non è una condizione né necessaria né sufficiente per determinare l’insorgenza di una malattia INOLTRE… Ci sono individui che possiedono la variante di rischio e non si ammalano Ci cono individui che non possiedo la variante di rischio e si ammalano

47 Il concetto di suscettibilità
Uno SNP concorrere, insieme ad altri fattori, nello sviluppo di patologie: altre varianti genetiche interazione geni-ambiente

48 Diversa suscettibilità a malattie
J Hum Genet. 2002;47(11): SNP alleles in human disease and evolution. Shastry BS1.

49 ApoE e malattia di Alzheimer 3 alleli di suscettibilità
rs rs7412 ApoE e2 GACGTGTGCGGCCG…CAGAAGTGCCTGGCA ApoE e3 GACGTGTGCGGCCGC……CAGAAGCGCCTGGCA ApoE e4 GACGTGCGCGGCCGC……CAGAAGCGCCTGGCA ApoE e Cys Cys ApoE e Cys Arg ApoE e Arg Arg - APOE e’ una lipoproteina deputata al trasporto dei fosfolipidi e del colesterolo nel sangue Gli individui con almeno un allele ApoE e4 hanno maggiore possibilità di sviluppare Alzheimer

50 Vantaggi degli SNP HIV Malaria ……

51 Polimorfismo del recettore CCR5 (vantaggio dell’omozigote all’Infezione da HIV)
CCR5 ( chemokine (C-C motif) receptor 5) Gli omozigoti per la variante CCR5Δ32(mutazione che rimuove 32 bp) sembrano essere protetti dall’infezione da HIV Gli eterozigoti (CCR5 W/ Δ  32) Mostrano un andamento della malattia più lento CCR5 Δ32 generalmente si trova nelle popolazioni di origine europea, con una frequenza del 10%. In Africa, Asia e Oceania sembra che l’allele CCR5 Δ 32 sia assente CCR5 Linfocita T helper

52 Polimorfismi della catena beta β dell’emoglobina (vantaggio dell’eterozigote in ambiente malarico)
Sintesi normale delle catene beta HbS ….GAC… Glutamina ….GTC… Valina HbC ….GAG… Glutamina ….AAG… Lisina Mutazione missenso Sintesi difettosa (ridotta) delle catene beta microcitemia (Talassemia minor) = eterozigoti Talassemia major o Morbo di Cooley = omozigoti grave anemia - modificazioni scheletriche - necessitano di continue trasfusioni Emoglobina ‘difettosa’ ha un deficit di filamenti di actina necessari per la diffusione del parassita

53 Diversa risposta ai farmaci
Polimorfismi su geni codificanti molecole target del farmaco Polimorfismi sui geni codificanti gli enzimi che metabolizzano i farmaci, es. il citocromo epatico c 450, che provocano: Ridotto metabolismo del farmaco (tossicità) Eccessivo metabolismo del farmaco (nessuna effetto farmacologico)

54 Ad esempio.. Nelle terapie antitumorali
Farmaco SNP di risposta al farmaco 5-FU diidropirimidina deidrogenasi 6-mercaptopurina tiopurina S-metiltransferasi Metotressato 5,10-metilenetetraidrofolato reduttasi Cisplatino glutatione S-transferasi catabolismo inattivazione meccanismo d’azione eliminazione

55 Variando la dose Cambiando il farmaco Farmacogenetica
Esamina le varianti genetiche che determinano la risposta ad un farmaco e studia il modo in cui queste varianti possono essere usate per prevedere il tipo di risposta Variando la dose Cambiando il farmaco

56 Terapia personalizzata
Selezione sulla base di fattori responsabili di una diversa risposta al trattamento Selezione sulla base di fattori predisponenti alle malattie Terapia personalizzata Prevenzione Dagnosi precoce

57 Obiettivo l’intero assetto genetico su un chip grande come una carta di credito
Ricerca di SNP di suscettibilita’ genetica a malattie Ricerca di mutazioni patogene Ricerca di SNP di risposta ai farmaci Terapia farmacologica personalizzata Prevenzione Diagnosi precoce

58 Studi di associazione casi-controlli
Popolazione con malattia Popolazione senza malattia A T C G SNP Si cercano differenze nelle frequenze dei polimorfismi nei due gruppi

59 Selezione delle due popolazioni
devono differire solo per il fenotipo di interesse devono essere il più omogenee possibile per tutti gli altri aspetti (sesso, età, etnia…) devono essere sufficientemente numerose la numerosità del campione utile per rilevare associazioni statisticamente significative dipende dalla frequenza degli SNP studiati

60 Caso 1: nessuna associazione
Gene A Nessuna variante del gene (verde o nera) è associata con il fenotipo d’interesse Casi Controlli

61 Caso 2: associazione significativa
Gene B La variante rossa del gene è associata con il fenotipo d’interesse Casi Controlli

62 L’identificazione delle varianti che rappresentano fattori di vulnerabilità non è semplice in quanto ognuna di esse agisce in concomitanza con molte altre varianti e con numerosi fattori ambientali

63 Esistono varianti genetiche che vengono
SNP Semplificazione.. Esistono varianti genetiche che vengono ereditate insieme concetto di APLOTIPO

64 HapMap project

65 L’utilizzo degli aplotipi può facilitare l’analisi
da Nature 426, (2003)

66 Banche dati I dati generati dal sequenziamento del genoma sin ora condotti hanno prodotto una quantità di dati considerevole Le informazioni sono raccolte in banche dati accessibili liberamente sul web National Center for Biotechnology information (NIH) Ensembl Gene Cards

67 Banche dati https://www.youtube.com/watch?v=-dOQMiEtL8I

68 Banche dati http://www.ensembl.org/index.html
Ricerca anche delle CNV in structural variants

69 Banche dati

70 Banche dati http://hapmap.ncbi.nlm.nih.gov/
E’ un database utile allo studio degli aplotipi

71 SNP function prediction
dbSNP SNP FuncPred F-SNP SNPs3D

72 SNP function prediction
dbSNP è un database aggiornato contenete tutti gli SNP di tutti i geni, fa parte di NCBI SNP FuncPred suggerisce se uno SNP è funzionale e/o patogeno

73 SNP function prediction
F-SNP F-SNP suggerisce un indice di probabilità (un valore tra tra 0 a 1) che lo SNP sia funzionale

74 SNP function SNPs3D permette, inserendo il nome di una patologia, di trovare tutti gli SNP associati e viceversa

75 Conclusione Oggi è nota l’intera sequenza umana di un gran numero di individui grazie allo sviluppo di: Tecniche di sequenziamento in parallelo che permettono di sequenziare interi genomi in poco tempo con costi modesti Tecniche infomatiche che permettono di immagazzinare ed analizzarele sequenze dei genomi mettendole a confronto per individuare regioni conservate e diversita’ di sequenza L’analisi sitematica dei genomi umani ha permesso: L’individuazione di siti di varialibiità genetica Progressi in campo medico Individuare fattori di suscettibilità a malattie Prevenzione Terapia farmacologica personalizzata

76 La variabilità genetica è responsabile delle diversità individuali, ed è un fattore positivo per l’ adattamento all’ ambiente e per l’evoluzione della vita


Scaricare ppt "Il genoma umano e la variabilità genetica"

Presentazioni simili


Annunci Google