IV LEZIONE Dati d'espressione genica: ESTs SAGE Microarray NCBI GEO.

Slides:



Advertisements
Presentazioni simili
Geni costitutivi e non costitutivi
Advertisements

Genetica dei Microrganismi ed Applicata
Progetto genoma umano Il genoma tappe dello studio del genoma umano
Bioinformatica Corso di Laurea specialistica in Informatica RNA: trascrizione e maturazione 21/03/2011.
Biologia.blu B - Le basi molecolari della vita e dell’evoluzione
Biologia.blu B - Le basi molecolari della vita e dell’evoluzione
Metodi di sequenziamento
Corso di ingegneria genetica
TRASCRIZIONE del DNA.
Escherichia coli Molto studiato da un punto di vista genetico, fisiologico e strutturale Molto studiato da un punto di vista genetico, fisiologico e strutturale.
LICEO SCIENTIFICO STATALE “LEONARDO da VINCI” di FIRENZE
Trascrizione Processo mediante il quale l’informazione contenuta in una sequenza di DNA (gene) viene copiata in una sequenza complementare di RNA dall’enzima.
Clonaggio funzionale Clonaggio posizionale
Amplificazione DNA Clonaggio PCR.
Editing dellRNA. Editing dellmRNA per la Apolipoproteina B umana.
Array di oligonucleotidi
Espressione genica.
Opinione studenti II anno A-K Per la stragrande maggioranza degli studenti, il bilancio per il II anno A-K, è nettamente positivo. Infatti se vogliamo.
FACOLTA’ DI MEDICINA E CHIRURGIA
Perché Real-Time? Real time PCR Analisi PCR quantitativa
La Candidosi L’infezione da candida è provocata dal lievito Candida albicans che è un parassita unicellulare appartenente al regno dei funghi. Candida.
CLONAGGIO DNA RICOMBINANTE: DUE MOLECOLE DI DNA VENGONO
Clonaggio: vettori plasmidici
La varietà dei genomi valore C: quantità totale di DNA contenuta in un genoma aploide Il genoma comprende geni e sequenze non codificanti. Le dimensioni.
CORSO DI BIOLOGIA - Programma
AN EXAMPLE FROM MORE ADVANCED BIOINFORMATICS
CORSO DI BIOLOGIA - Programma
Dip. Scienze Biomolecolari e Biotecnologie
Espressione genica External input Endogenous input S2
Difetti congeniti del metabolismo II
Flusso delle informazioni biologiche. In ogni istante della propria vita ogni cellula umana contiene: 46 cromosomi ( geni) mRNA diversi.
Applicazioni genetica umana e molecolare II parte
Il DNA Trascrizione Traduzione Trascritto primario (pre-mRNA) mRNA
IV LEZIONE Uso di Genome Browser per l'annotazione di sequenze genomiche. Allineamento di sequenze trascritte con sequenze genomiche: BLAT.
GenBank  Database di sequenze all’NIH  14,397,000,000 basi in 13,602,000 sequenze (Octobre 2001)  Crescita esponenziale  International Nucleotide Sequence.
Computational analysis of data by statistical methods
Computational analysis of data by statistical methods
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
AN EXAMPLE FROM MORE ADVANCED BIOINFORMATICS Gene expression data analysis.
Cenni di Bioinformatica
Dal neolitico al Xxi secolo.
Seminari degli studenti
POSTGENOMICA O GENOMICA FUNZIONALE
Tecniche della Biologia Molecolare
Era PostGenomica Sara Palumbo
Definizione di genoteca (o library) di DNA
Cosa sono gli enzimi di restrizione
Ibridazione degli acidi nucleici e
POLIMERASE CHAIN REACTION (PCR)
Arrays di acidi nucleici
Clonaggio per espressione e clonaggio funzionale
LABORATORIO 2: ANALISI DI RESTRIZIONE DI DNA GENOMICO In questa esercitazione campioni di DNA (es.: da fago λ e da plasmide pET28) verranno digeriti con.
CLONAGGIO POSIZIONALE
Clonaggio funzionale Clonaggio posizionale Conoscenza proteina Malattia genetica Determinazione sequenza amminoac.Mappatura genetica con marcatori polimorfici.
Trascrizione Processo mediante il quale l’informazione contenuta in una sequenza di DNA (gene) viene copiata in una sequenza complementare di RNA dall’enzima.
Jacob, Monod – Parigi,1961 il modello dell’Operon-lac
Biotecnologie Il DNA ricombinante.
Microarrays di DNA, cDNA e oligonucleotidi
Costruzione di librerie di cDNA
POSTGENOMICA O GENOMICA FUNZIONALE
POSTGENOMICA O GENOMICA FUNZIONALE
Transcript della presentazione:

IV LEZIONE Dati d'espressione genica: ESTs SAGE Microarray NCBI GEO

ESPRESSIONE DEL GENOMA UMANO NELLE CELLULE DIFFERENZIATE Tutte le cellule di un organismo hanno lo stesso corredo genomico L’espressione genica tessuto specifica determina il fenotipo morfo-funzionale dei tipi cellulari e tissutali In ogni cellula differenziata ed in ogni particolare momento dello sviluppo e’ attivo solo un sottoinsieme di geni

REGOLAZIONE DELL’ESPRESSIONE GENICA Puo’ agire su ciascuno dei livelli che caratterizzano il passare dell’informazione genica dal DNA alle proteine Negli Eucarioti superiori la regolazione dell’espressione genica si svolge principalmente come controllo della trascrizione Principali tipi di regolazione: Controllo epigenetico Controllo trascrizionale Controllo post-trascrizionale

METODI PER LO STUDIO SU LARGA SCALA DELL’ESPRESSIONE GENICA Sequenziamento sistematico di ESTs da librerie di cDNA SAGE (Serial Analysis of Gene Expression) cDNA microarrays

“Large-scale approach” “One-gene approach” Il gene di interesse e’ espresso in un tessuto o in un dato momento dello sviluppo ? Quanto e’ attivo dal punto di vista trascrizionale ? Real Time PCR PCR semiquantitativa Ibridazione DNA genico o cDNA con RNA totale o poly(A)+RNA (Northern blot) Ibridazione in situ “Large-scale approach” Quali geni sono espressi in un tessuto ed in un dato momento dello sviluppo ? Quanto ciascuno di essi e’ attivo dal punto di vista trascrizionale ? Profilo d’espressione del genoma (TRASCRITTOMA)

EST EST SEQUENCING mRNA of different genes cDNA LIBRARY

EST Il sequenziamento del DNA “codificante” si basa sulla purificazione dell'RNA messaggero da cellule o da campioni di tessuto e sulla sua retrotrascrizione in vitro in una sequenza di DNA complementare (cDNA). In genere i cDNA vengono frammentati e clonati in vettori batterici. Si ottengono in questo modo delle collezioni di batteri, nelle quali ogni colonia contiene un inserto corrispondente ad un frammento di sequenza di un gene espresso, dette librerie di cDNA.

Mappaggio di nuovi geni EST Utilità delle EST Scoperta di nuovi geni Mappaggio di nuovi geni Identificazione degli esoni lungo estese sequenze genomiche (Gene Prediction) Studio dello splicing alternativo

EST Una libreria di cDNA, che viene preparata dal messaggero contenuto nelle cellule di uno specifico tessuto, può essere considerata come un'istantanea che riproduce la composizione della popolazione dei messaggeri presenti nel tessuto in un particolare momento dello sviluppo dell'organismo e in determinate condizioni fisiologiche. Le librerie di cDNA in cui i cloni da sequenziare vengono scelti in modo casuale e sulle quali non vengono effettuate né operazioni di sottrazione né di normalizzazione, possono essere usate per descrivere, sia qualitativamente sia quantitativamente, la popolazione dei messaggeri.

EST

EST

EST

EST

ESTIMATE OF THE LEVEL OF EXPRESSION OF A GIVEN GENE UniGene Human Release Statistics Total sequences in clusters: 3115711 Total number of clusters sets: 95928 22094 sets contain at least one known gene 94710 sets contain at least one EST 20876 sets contain both genes and ESTs ESTIMATE OF THE LEVEL OF EXPRESSION OF A GIVEN GENE Sample of 12919 ESTs corresponding to 4460 genes/trascripts eg. Rhodopsin: 65 retina ESTs  65 / 12919 = 0.503%

EST

EST

SAGE Serial Analysis of Gene Expression SAGE è un metodo sperimentale ideato per utilizzare i vantaggi del sequenziamento su larga scala con il fine di avere informazioni quantitative di espressione genica (Velculescu et al. 1995, Zhang et al, 1997) Con questa tecnica e’ possibile stimare il livello d’espressione di ciascun gene, attraverso la misura del numero di volte in cui la TAG che lo rappresenta compare in un campione abbastanza grande di TAGs sequenziate a partire dal messaggero del tessuto in analisi Tag to Gene mapping  Gene to Tag mapping Consiste nel sequenziamento da messaggeri cellulari di brevi oligonucleotidi, che fungono da etichette di sequenza (TAG)

SAGE Si basa su tre principi: una sequenza di 9 paia di basi permette di identificare 49 (262144) diversi trascritti, dal momento che una "tag" viene ottenuta da una posizione specifica di ogni trascritto (12bp) le "tag" possono essere unite insieme in serie, a costituire lunghe molecole di DNA, che vengono clonate e sequenziate in modo automatizzato il numero di volte in cui una singola "tag" viene osservata permette di quantificare l'abbondanza del messaggero identificato nella popolazione dei messaggeri e, indirettamente, il livello di espressione del gene corrispondente.

SAGE Una TAG e’ una sequenza di lughezza definita direttamente adiacente al 3’ del sito di restrizione piu’ 3’, nel messaggero da cui proviene, per l’enzima utilizzato (spesso NIaIII) Sintesi DNA a doppia elica a partire dai messaggeri con primer oligo(dT) biotinilato Taglio con enzima di restrizione e isolamento della porzione 3’ del cDNA per purificazione mediante sfere a streptavidina Separazione del cDNA in 2 aliquote, ciascuna ligata con un linker diverso, contenente un sito di taglio per un enzima di restrizione (tagging enzyme) che taglia ad una distanza definita dal sito riconociuto (20bp) Il linker con attaccato un breve tratto di cDNA (9-12 bp) viene rilasciato Ligazione tags a due a due ed eliminazione ditags con due elementi uguali Taglio ditags in modo da creare estremita’ coesive (spaziatore di 4 bp) Ligazione ditags in lunghi concatameri Clonaggio dei concatameri e sequenziamento Analisi automatizzata dei risultati: identificazione di tutte le specie di tags, conteggio della frequenza di ciascuna, assegnazione a sequenze geniche note ed annotazione

SAGE

SAGE Il risultato della SAGE e’ di tipo digitale: una lista di tags e la frequenza di ciascuna di esse La fase in cui si stabilisce la corrispondenza tra tag e gene e’ cruciale per una corretta stima del livello d’espressione del gene La corrispondenza tag-gene non e’ sempre biunivoca, come ci si aspetterebbe Gli errori di sequenziamento hanno effetti molto pesanti sui dati SAGE (1%  10% che ci sia almeno 1 errore su 10 bp) Le assegnazioni tag/EST sono affette da un errore maggiore Nel caso di due tag assegnate al medesimo gene: Reliable mapping  correzione per gli errori di sequenza sulle ESTs

SAGE

SAGE

SAGE

SAGE

SAGE

SAGE

Esperimenti di Microarray Permettono l’analisi dell’espressione genica di migliaia di geni simultaneamente

MICROARRAY Un esperimento

Misura dell’espressione dei geni con i microarray = malato = sano Gene 1 Gene 2

Analisi dell’immagine MICROARRAY Analisi dell’immagine Identificazione della posizione degli spot Costruzione di un’area locale intorno ad ogni spot Calcolo dell’intensità di ogni singolo spot Calcolo del background locale

MICROARRAY Elaborazione dei dati

EST SAGE MICROARRAY

Matrice dei risultati con più condizioni sperimentali … Cond. m Gene 1 x11 x12 x1m Gene 2 x21 x22 x2m Gene n xn1 xn2 xnm Quali geni sono differenzialmente espressi ? Quali e quanti geni sono coespressi?

Obiettivi dell’analisi saranno… Identificazione geni differenzialmente espressi Identificazione pattern di espressione comuni Identificazione di geni coespressi con geni di funzione nota

I geni sono punti nello spazio: CLUSTER ANALISI Identificazione di gruppi di geni con profili di espressione simili Simili rispetto a cosa ? distanza Definizione di I geni sono punti nello spazio: punti vicini nello spazio sono raggruppati insieme

CLUSTER ANALISI Misura di similarita’ Linking method DUE STEPS: Diverse misure Standardizzazione dei dati Linking method criterio per stabilire i gruppi Metodi gerarchici e non gerarchici