INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Slides:



Advertisements
Presentazioni simili
Una delle caratteristiche distintive della specie umana è la capacità di fabbricare strumenti con i quali costruirne altri. Strumenti come il martello,
Advertisements

Run I Distribuzione inclusive di Min Bias (Mult. Carica, Pt). Correlazioni dello stato finale ( -Mult) + mini-jet (soft hard physics). Campioni utilizzati:
Progetto genoma umano Il genoma tappe dello studio del genoma umano
Prime stime effetti finanziaria 2006 Conferenza stampa del DATI ANALISI VALUTAZIONI.
La Programmazione Lineare
Bioinformatica Prof. Mauro Fasano
Biologia.blu B - Le basi molecolari della vita e dell’evoluzione
Informatica di base A.A. 2003/2004 Algoritmi e programmi
LICEO SCIENTIFICO STATALE “LEONARDO da VINCI” di FIRENZE
Limite di una successione
La variazione della velocità del motore asincrono e lEfficienza Energetica Tecnologie e risparmio Marco Viganò ANIE – AssoAutomazione.
Algoritmi e Strutture Dati (Mod. B)
ANFoV Conference 2005 Milano, 21 giugno 2005 XI Rapporto ANFoV.
Sequenziamento dei genomi
Il concetto di aplotipo
Clonaggio funzionale Clonaggio posizionale
CARATTERISTICHE VETTORE PLASMIDICO DI CLONAGGIO
Genomi degli organelli

Amplificazione DNA Clonaggio PCR.
Editing dellRNA. Editing dellmRNA per la Apolipoproteina B umana.
Verso la costruzione di una cellula artificiale
SEAT PAGINE GIALLE - PAGINE BIANCHE OLO Campagna distribuzione 2012 febbraio
Array di oligonucleotidi
ESERCIZI di BIOLOGIA MOLECOLARE A.A
Sequenze Ripetitive di Dna
SMART 300+ TC500 Top 400 Minuti Numero Preferito Spesa mensile per i primi 12 mesi in MNP Spesa mensile con iPhone Minuti senza limiti 500 verso tutti.
C). Chimica del DNA i). Forze che influenzano la stabilità della doppia elica del DNA interazioni idrofobiche - stabilizzano dentro idrofobiche e fuori.
Biotecnologie ed OGM.
Perché Real-Time? Real time PCR Analisi PCR quantitativa
Informatica ed Impresa Problemi e Soluzioni 27 giugno 2006
CLONAGGIO DNA RICOMBINANTE: DUE MOLECOLE DI DNA VENGONO
Clonaggio: vettori plasmidici
UNIVERSITA’ DEGLI STUDI DI GENOVA
Elettroforesi di Acidi Nucleici Southern e Northern Blot
Il clonaggio di un frammento di DNA
Dei virus e altre storie Science Cafè Trieste,
Sequenziamento enzimatico del DNA (Sanger)
Il progetto genoma umano
La situazione iniziale
Che cosa offre biotechrabbit ? Prodotti per l’isolamento degli Adici Nucleici (DNA – RNA)
Cloning permette di avere DNA puro Dopo ligasi ho una miscela complessa di DNA difficile da purificare: Vettore non legato Frammento di DNA non legato.
Whole-body dynamic behavior and control of human-like robots. Analisi di un articolo del dipartimento di scienze informatiche dell’università di Stanford.
Cosa sono i GENI I geni rappresentano l’unità strutturale e funzionale della genetica Un gene è una successione lineare di unità chimiche semplici (nucleotidi)
Escherichia coli Un organismo modello.
=produzione di molte copie identiche del frammento di DNA
Ibridazione degli acidi nucleici e
Lezione mercoledì 13 Marzo 2011 corso vettori biologici II Biotec industriali ore 14:00 -16:00 aula 6A.
Flusso delle informazioni biologiche. In ogni istante della propria vita ogni cellula umana contiene: 46 cromosomi ( geni) mRNA diversi.
Applicazioni genetica umana e molecolare II parte
Computational analysis of data by statistical methods
IV LEZIONE Dati d'espressione genica: ESTs SAGE Microarray NCBI GEO.
I metodi RFLP SSCP/DGGE/TGGE Ibridazione con sonde oligonucleotidche
POSTGENOMICA O GENOMICA FUNZIONALE
Tecniche della Biologia Molecolare
Il progetto genoma umano e gli altri progetti genoma: importanza degli organismi-modello.
POLIMERASE CHAIN REACTION (PCR)
Sistema di ricerca Entrez Insieme di banche dati contenenti svariati tipi di informazioni biomediche, interrogabile mediante un’unica interfaccia Concetto.
Corso di Biologia Molecolare I Pagina web.
LABORATORIO 2: ANALISI DI RESTRIZIONE DI DNA GENOMICO In questa esercitazione campioni di DNA (es.: da fago λ e da plasmide pET28) verranno digeriti con.
Next Generation Sequencing (NGS) Illumina HiSeq 2000: 150 milioni di frammenti di 100 bp in una settimana. 1)Assemblaggio di genomi de novo 2)Analisi della.
INTRODUZIONE La contaminazione fungina nelle matrici alimentari è causa di deterioramenti che possono determinarne l’inidoneità al consumo ed alla trasformazione.
Clonaggio funzionale Clonaggio posizionale Conoscenza proteina Malattia genetica Determinazione sequenza amminoac.Mappatura genetica con marcatori polimorfici.
Costruzione di librerie di cDNA
Transcript della presentazione:

INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE 08/29/08 INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

SANGER SEQUENCING

08/29/08 SEQUENZIAMENTO DI NUOVA GENERAZIONE Tre aziende: 454 (Roche; www.roche-applied-science.com, 454 GS 20, 454 GS Flex, 454 Titanium Illumina/Solexa (www.illumina.com; Genome Analyzer (GA 'classic' and GAII)‏ Applied Biosystems (www. appliedbiosystems.com, SOLiD™ System, Solid 3)‏

SEQUENZIAMENO DI NUOVA GENERAZIONE 08/29/08 SEQUENZIAMENO DI NUOVA GENERAZIONE Si basano sul principio del sequenziamento di 'cluster' clonali Il processo, che incomincia con una singola molecola target, prevede la creazione di targets clonali durante un processo intermedio di amplificazione. Copie multiple identiche sono infatti necessarie per avere un alto rapporto segnale-rumore Sequenziamento mediante sintesi (SBS)‏ Sequenziamento mediante ligazione (SBL)‏ SOLID Chimica con terminatori SOLEXA Chimica del pirosequenziamento 454

Sequenziamento Sanger ad alta processività 08/29/08 Sequenziamento Sanger ad alta processività PREPARAZIONE DELLA LIBRERIA Frammentazione casuale del DNA genomico clonazione e trasformazione in batteri Raccolta delle colonie Purificazione del DNA dalle colonie Sequenziamento Sanger Elettroforesi capillare Whole genome de novo assembly or mapping to a reference (re-sequencing) 7-10 giorni assumendo di possedere una piattaforma robotica per alta processività Settimane-anni (!), dipendentemente dalla dimensione del genoma (e copertura richiesta)‏, dal numero di sequenziatori capillari

Sequenziamento di nuova generazione 08/29/08 Sequenziamento di nuova generazione PREPARAZIONE DELLA LIBRERIA Frammentazione casuale del DNA genomico Ligazione degli adattatori Amplificazione clonale dei frammenti Sequenziamento mediante sintesi o ligazione Processamento delle immagini Mappatura delle reads su un genoma di riferimento (o assemblaggio de novo) 1 – 3 giorni 1 – 6 giorni

Vantaggi delle piattaforme di nuova generazione 08/29/08 Vantaggi delle piattaforme di nuova generazione Non sub-clonazione, non utilizzo di cellule batteriche E. coli - abolizione di bias di clonazione - rapidità nel preparare le librerie (non c’e’ colony picking!) Ciascuna sequenza proviene da una molecola di DNA unica. - quantificazione attraverso 'conta' digitale - aumento del range dinamico - rilevazione di varianti rare Fornisce una eccezionale risoluzione per molti tipi di esperimenti (es. analisi di espressione, sequenziamento di DNA immunoprecipitato, di RNA piccoli, analisi di medie/grandi inserzioni-delezioni nei genomi….) Rivoluzionaria diminuzione del costo e del tempo per generare dati di sequenza (lavorano in multi-parallelo) Richiesta meno robotica nelle fasi precedenti al caricamento sul sequenziatore 7

Svantaggi delle piattaforme next-gen 08/29/08 Svantaggi delle piattaforme next-gen Sono prodotte sequenze più corte - relativamente alle sequenze da sequenziatori capillari (metodo Sanger) - è necessario ri-parametrizzare l’accuratezza della procedura di chiamata delle basi - enorme difficoltà nell’analisi dei dati; richiesto un grande sforzo di programmazione per costruire nuovi algoritmi. La mole enorme di dati ‘traumatizza’ le infrastrutture informatiche. - da 10 Gb a diversi Tb di dati grezzi prodotti per corsa (dipende dalla piattaforma) - il processamento delle read tramite pipeline informatiche richiede molta capacità di calcolo (CPU) - è necessario prendere accurate decisioni su cosa salvare e cosa cancellare 8

Sequenze corte Sequenze corte, ma tecnologia in continua evoluzione: 08/29/08 Sequenze corte Sequenze corte, ma tecnologia in continua evoluzione: 454: 100 basi → 200 → 400-500 → ? Solid: 25 basi → 35 → 50 → 100 → ? Illumina: 32 → 36 → 75-100 → 125 → 150 → ? Difficoltà di assemblare sequenze corte de novo, soprattutto per il problema delle sequenze ripetute complicato ancora di più rispetto a Sanger (lunghezza media 700-750bp)

08/29/08 Risequenziamento In presenza di un genoma di riferimento di buona qualità posso effettuare un ri-sequenziamento e allineare tutte le reads ottenute: Non solo del genoma, ma anche del trascrittoma Genomic DNA Introns Exons

08/29/08 Paired-end (PE) Tutte le piattaforme next-gen offrono la possibilità di produrre ‘paired-end read’, cioè la sequenza può essere derivata da ciascuna delle due estremità di ogni frammento della libreria Esistono differenze nella distanza tra le due read pair-end, basate su un diverso approccio/piattaforma. In generale, le reads paired-end offrono vantaggi che dipendono dalla complessità del genoma e dall’applicazione/tipo di esperimento

Il problema (!) della enorme mole di dati prodotta E’ un problema chiave che limita una più ampia adozione di questi strumenti da parte dei laboratori 1 ABI3730xl genera fino un max di 260 milioni di paia di basi di sequenza all’anno Quando nel 2004-2005 è stato lanciato il primo 454 produceva una quantità di dati in un anno superiore a quella prodotta da più di 50 ABI3730xl Il problema dell’ ‘indigestione’ di dati è dal 2005 ulteriormente peggiorato sia per il 454 che a causa della possibilità di scelta anche delle altre due piattaforme (Illumina/Solexa lanciata sul mercato nel 2006 e Solid nel 2007) Produzione una decina di gigabytes di dati per corsa per 454, 1-4 terabytes di dati per corsa per Illumina e Solid

Statistiche sulle tre piattaforme 08/29/08 Statistiche sulle tre piattaforme 13

VERSO IL GENOMA DA MILLE DOLLARI.... Costo 1 anno Sanger, reads 700bp: 1 anno, 1 sequenziatore a pieno regime=260 Mbp 260 Mbp=circa 370.000 sequenze (lunghezza media 700bp)=370.000 EUR EUR/base=0,0014 Sequenziamento di un genoma batterico (es E. coli, 4.5Mbp) con copertura 10x=64.000 EUR 1 genoma umano (dimensione 3.6 Gbp), copertura 1x=60 anni (!) =5M EUR Costo 1 corsa, Illumina 2x75bp: 10 giorni, 1 sequenziatore=fino a 18 Gbp 18 Gbp=10,000 EUR EUR/base= 0,00000055 Sequenziamento di un genoma batterico con copertura 10x= 25 EUR 1 genoma umano (dimensione 3.6 Gbp), copertura 10x=2 corse=20K EUR

VERSO IL GENOMA DA MILLE DOLLARI.... Costo 1 corsa 454, reads 300-400bp: 10 ore, 1 sequenziatore=fino a 0.6 Gbp 0.6 Gbp=10.000 EUR EUR/base= 0,000016 Sequenziamento di un genoma batterico (es E. coli, 4.5Mbp) con copertura 10x= 9.600 EUR 1 genoma umano (dimensione 3.6 Gbp), copertura 10x=almeno 60 corse (più di 1 mese)=576K EUR Costo 1 corsa Solid, reads 2x50bp: 12 giorni, 1 sequenziatore= 20 Gbp 20 Gbp = 8.000 EUR EUR/base=0,00000044 Sequenziamento di un genoma batterico con copertura 10x= 18 EUR 1 genoma umano (dimensione 3.6 Gbp), copertura 10x= circa 2 corse (1 mese) = 16K EUR

SEQUENZIAMENTO CON LA TECNOLOGIA 454 08/29/08 SEQUENZIAMENTO CON LA TECNOLOGIA 454

08/29/08 Tecnologia 454 300-800 bp La quantità ottimale di DNA (trasformata da ng/ul in n. di molecole) necessaria per la PCR in emulsione viene determinata tramite una corsa di taratura sul sequenziatore

08/29/08 Tecnolgia 454

08/29/08 Tecnologia 454 Il sequenziamento inizia con la preparazione della piastra PicoTiter. Durante questo passaggio una miscela di beads, enzimi per il sequenziamento e la libreria sstDNA vengono depositati nei pozzetti di 44um Il processo di deposizione delle beads massimizza il numero di pozzetti che contengono un frammento individuale della libreria sstDNA La piastra PicoTiter viene caricata sul sequenziatore

Tecnologia 454 If a nucleotide complementary to the template 08/29/08 Tecnologia 454 APS=adenosine 5´phosphosulfate PPi=pyrophosphate If a nucleotide complementary to the template strand is flowed into a well, the polymerase extends the existing DNA strand by adding nucleotide(s). • Addition of one (or more) nucleotide(s) results in a reaction that generates a chemiluminescent signal that is recorded by the CCD camera in the Genome Sequencer 20 Instrument. • This signal strength is proportional to the number of nucleotides incorporated during a single nucleotide flow.

Read data are converted into "flowgrams". For each cycle four pictures are captured (one picture per nucleotide); FLX standard run: 100 Cycles; FLX Titanium run: 200 Cycles Extraction, Qualification/Quantification and Normalization of wells data Read data are converted into "flowgrams".

08/29/08 Tecnologia 454

Tecnologia 454 – librerie mate-paired 08/29/08 Tecnologia 454 – librerie mate-paired

Titanium

La tecnologia 454 rimpiazzerà i sequenziatori capillari nel sequenziamento de novo di genomi?