La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE.

Presentazioni simili


Presentazione sul tema: "INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE."— Transcript della presentazione:

1 INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

2 SANGER SEQUENCING

3 Tre aziende: 454 (Roche; 454 GS 20, 454 GS Flex, 454 Titaniumwww.roche-applied-science.com Illumina/Solexa (www.illumina.com; Genome Analyzer (GA 'classic' and GAII) Applied Biosystems (www. appliedbiosystems.com, SOLiD System, Solid 3) SEQUENZIAMENTO DI NUOVA GENERAZIONE

4 Si basano sul principio del sequenziamento di 'cluster' clonali Il processo, che incomincia con una singola molecola target, prevede la creazione di targets clonali durante un processo intermedio di amplificazione. Copie multiple identiche sono infatti necessarie per avere un alto rapporto segnale-rumore Sequenziamento mediante sintesi (SBS) Sequenziamento mediante ligazione (SBL) SOLID Chimica con terminatori SOLEXA Chimica del pirosequenziamento 454 SEQUENZIAMENO DI NUOVA GENERAZIONE

5 Sequenziamento Sanger ad alta processività PREPARAZIONE DELLA LIBRERIA Frammentazione casuale del DNA genomico clonazione e trasformazione in batteri Raccolta delle colonie Purificazione del DNA dalle colonie Sequenziamento Sanger Elettroforesi capillare Whole genome de novo assembly or mapping to a reference (re-sequencing) 7-10 giorni assumendo di possedere una piattaforma robotica per alta processività Settimane-anni (!), dipendentemente dalla dimensione del genoma (e copertura richiesta), dal numero di sequenziatori capillari

6 PREPARAZIONE DELLA LIBRERIA Frammentazione casuale del DNA genomico Ligazione degli adattatori Amplificazione clonale dei frammenti Sequenziamento mediante sintesi o ligazione Processamento delle immagini Mappatura delle reads su un genoma di riferimento (o assemblaggio de novo) 1 – 3 giorni 1 – 6 giorni Sequenziamento di nuova generazione

7 Vantaggi delle piattaforme di nuova generazione Non sub-clonazione, non utilizzo di cellule batteriche E. coli - abolizione di bias di clonazione - rapidità nel preparare le librerie (non ce colony picking!) Ciascuna sequenza proviene da una molecola di DNA unica. - quantificazione attraverso 'conta' digitale - aumento del range dinamico - rilevazione di varianti rare Fornisce una eccezionale risoluzione per molti tipi di esperimenti (es. analisi di espressione, sequenziamento di DNA immunoprecipitato, di RNA piccoli, analisi di medie/grandi inserzioni-delezioni nei genomi….) Rivoluzionaria diminuzione del costo e del tempo per generare dati di sequenza (lavorano in multi-parallelo) Richiesta meno robotica nelle fasi precedenti al caricamento sul sequenziatore

8 Svantaggi delle piattaforme next-gen Sono prodotte sequenze più corte - relativamente alle sequenze da sequenziatori capillari (metodo Sanger) - è necessario ri-parametrizzare laccuratezza della procedura di chiamata delle basi - enorme difficoltà nellanalisi dei dati; richiesto un grande sforzo di programmazione per costruire nuovi algoritmi. La mole enorme di dati traumatizza le infrastrutture informatiche. - da 10 Gb a diversi Tb di dati grezzi prodotti per corsa (dipende dalla piattaforma) - il processamento delle read tramite pipeline informatiche richiede molta capacità di calcolo (CPU) - è necessario prendere accurate decisioni su cosa salvare e cosa cancellare

9 Sequenze corte Sequenze corte, ma tecnologia in continua evoluzione: 454: 100 basi ? Solid: 25 basi ? Illumina: ? Difficoltà di assemblare sequenze corte de novo, soprattutto per il problema delle sequenze ripetute complicato ancora di più rispetto a Sanger (lunghezza media bp)

10 Risequenziamento In presenza di un genoma di riferimento di buona qualità posso effettuare un ri-sequenziamento e allineare tutte le reads ottenute: Non solo del genoma, ma anche del trascrittoma Genomic DNA IntronsExons

11 Paired-end (PE) Tutte le piattaforme next-gen offrono la possibilità di produrre paired-end read, cioè la sequenza può essere derivata da ciascuna delle due estremità di ogni frammento della libreria Esistono differenze nella distanza tra le due read pair-end, basate su un diverso approccio/piattaforma. In generale, le reads paired-end offrono vantaggi che dipendono dalla complessità del genoma e dallapplicazione/tipo di esperimento

12 Il problema (!) della enorme mole di dati prodotta E un problema chiave che limita una più ampia adozione di questi strumenti da parte dei laboratori 1 ABI3730xl genera fino un max di 260 milioni di paia di basi di sequenza allanno Quando nel è stato lanciato il primo 454 produceva una quantità di dati in un anno superiore a quella prodotta da più di 50 ABI3730xl Il problema dell indigestione di dati è dal 2005 ulteriormente peggiorato sia per il 454 che a causa della possibilità di scelta anche delle altre due piattaforme (Illumina/Solexa lanciata sul mercato nel 2006 e Solid nel 2007) Produzione una decina di gigabytes di dati per corsa per 454, 1-4 terabytes di dati per corsa per Illumina e Solid

13 Statistiche sulle tre piattaforme

14 VERSO IL GENOMA DA MILLE DOLLARI.... Costo 1 anno Sanger, reads 700bp: –1 anno, 1 sequenziatore a pieno regime=260 Mbp –260 Mbp=circa sequenze (lunghezza media 700bp)= EUR –EUR/base=0,0014 –Sequenziamento di un genoma batterico (es E. coli, 4.5Mbp) con copertura 10x= EUR –1 genoma umano (dimensione 3.6 Gbp), copertura 1x=60 anni (!) =5M EUR Costo 1 corsa, Illumina 2x75bp: –10 giorni, 1 sequenziatore=fino a 18 Gbp –18 Gbp=10,000 EUR –EUR/base= 0, –Sequenziamento di un genoma batterico con copertura 10x= 25 EUR –1 genoma umano (dimensione 3.6 Gbp), copertura 10x=2 corse=20K EUR

15 VERSO IL GENOMA DA MILLE DOLLARI.... Costo 1 corsa 454, reads bp: –10 ore, 1 sequenziatore=fino a 0.6 Gbp –0.6 Gbp= EUR –EUR/base= 0, –Sequenziamento di un genoma batterico (es E. coli, 4.5Mbp) con copertura 10x= EUR –1 genoma umano (dimensione 3.6 Gbp), copertura 10x=almeno 60 corse (più di 1 mese)=576K EUR Costo 1 corsa Solid, reads 2x50bp: –12 giorni, 1 sequenziatore= 20 Gbp – 20 Gbp = EUR –EUR/base=0, –Sequenziamento di un genoma batterico con copertura 10x= 18 EUR –1 genoma umano (dimensione 3.6 Gbp), copertura 10x= circa 2 corse (1 mese) = 16K EUR

16

17 SEQUENZIAMENTO CON LA TECNOLOGIA 454

18

19 Tecnologia 454 La quantità ottimale di DNA (trasformata da ng/ul in n. di molecole) necessaria per la PCR in emulsione viene determinata tramite una corsa di taratura sul sequenziatore bp

20 Tecnolgia 454

21

22 Tecnologia 454 Il sequenziamento inizia con la preparazione della piastra PicoTiter. Durante questo passaggio una miscela di beads, enzimi per il sequenziamento e la libreria sstDNA vengono depositati nei pozzetti di 44um Il processo di deposizione delle beads massimizza il numero di pozzetti che contengono un frammento individuale della libreria sstDNA La piastra PicoTiter viene caricata sul sequenziatore

23 Tecnologia 454 APS=adenosine 5´phosphosulfate PPi=pyrophosphate

24 For each cycle four pictures are captured (one picture per nucleotide); FLX standard run: 100 Cycles; FLX Titanium run: 200 Cycles Extraction, Qualification/Quantification and Normalization of wells data Read data are converted into "flowgrams".

25 Tecnologia 454

26 Tecnologia 454 – librerie mate- paired

27 Titanium

28 La tecnologia 454 rimpiazzerà i sequenziatori capillari nel sequenziamento de novo di genomi?

29

30

31


Scaricare ppt "INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE."

Presentazioni simili


Annunci Google