Genome Projects Homo sapiens 3.2 billions 25,000 M. musculus Base pairs Genes Homo sapiens 3.2 billions 25,000 M. musculus 2.6 billions A. thaliana 100 millions C. elegans 97 millions 19,000 D. melanogaster 137 millions 13,000 S. cerevisiae 12.1 millions 6,000 E. coli 4.6 millions 3,200
23.000 geni codificanti. 45% del genoma è costituito da sequenze ripetute. 95% dei geni subiscono splicing alternativo. Molti geni hanno più di un promotore. Aree di conservazioni con i genomi di mammiferi. Regolazione. 481 UCE (Ultra Conserved Elements) 100% identiche in uomo, ratto, topo. Elementi regolativi? 11% dei promotori sono bidirezionali. Divergenti e convergenti. Non coding RNAs: 8/10.000. MicroRNAs: >800.
23.000 geni codificanti. 45% del genoma è costituito da sequenze ripetute. 95% dei geni subiscono splicing alternativo. Molti geni hanno più di un promotore. Aree di conservazioni con i genomi di mammiferi. Regolazione 481 UCE (Ultra conserved Sequences) 100% identiche in uomo, ratto, topo. Elementi regolativi? 11% dei promotori sono bidirezionali. Divergenti e convergenti. Non coding RNAs: 8/10.000. MicroRNAs: >800.
-trascrizione inversa -marcatura con fluorofori dei rispettivi cDNA laser 1 laser 2 cloni di DNA in piastre RNA da popolazione 1 RNA da popolazione 2 eccitazione -trascrizione inversa -marcatura con fluorofori dei rispettivi cDNA emissione -amplificazione tramite PCR -purificazione -fissaggio su vetrino (procedure robotizzate) scansione nei due canali ibridazione sul vetrino -combinazione e analisi d’immagine -analisi bioinformatica
-migliaia di oligonucleotidi(PM) (e corrispondentimismatch (MM))sintetizzati sul chip -ogni gene e’ rappresentato da un set di 11-16 oligonucleotidi (probe set) PM+MM Il chip Affymetrix© preparazione del campione da ibridare (cRNA biotinilato) immagine della scansione del chip (monocolore)
NEXT GENERATION SEQUENCING
Figure 2 An overview of the sequence by synthesis method. An overview of the sequence by synthesis method. Initially, adapters are ligated to the purified DNA fragments and low-cycle PCR used to amplify the DNA. The amplified DNA is subsequently denatured to form single-stranded products and one end attached to the surface of a flow cell. Subsequently, the free end is allowed to anneal to a primer complementary to one of the adapters that is attached to the flow cell surface. This primer is then used to prime synthesis of the complementary strand. The now double-stranded bridge structures are then denatured producing two single-stranded products and this cycle is repeated to form clusters. After cluster formation, the sequencing phase of the process begins with the addition of DNA polymerase, primer, and each of the nucleotides that are fluorescently labeled with different fluorophores and are blocked to prevent extension. This results in the addition of one nucleotide to each DNA fragment. Fluorescence microscopy is then used to capture images of the flow cell. After imaging, the oligonucleotides on the cell are deprotected and the next round of synthesis is initiated. After the process is complete, image analysis is used to determine the sequence of the DNA fragments in each cluster. Hoffman B G , and Jones S J M J Endocrinol 2009;201:1-13 © 2009 Society for Endocrinology
Costa et al., JBB 2010
23.000 geni codificanti. 45% del genoma è costituito da sequenze ripetute. 95% dei geni subiscono splicing alternativo. Molti geni hanno più di un promotore. Aree di conservazioni con i genomi di mammiferi. Regolazione 481 UCE (Ultra conserved Sequences) 100% identiche in uomo, ratto, topo. Elementi regolativi? 11% dei promotori sono bidirezionali. Divergenti e convergenti. Non coding RNA: 8/10.000. MicroRNA: >800.
HapMap: variazioni nella sequenza di DNA (SNPs) in 270 individui etnicamente diversi. Comparazione con DNA di primati: 1.23% variazione con scimpanzee. 1000 genomes project
The ENCODE Project. Functional genomics: ChIp-Seq location analysis in n (12) cell types of n (10) histone PTMs and n (160 -and counting) DNA-binding Proteins (Mostly TFs). Ok 19 19
Epigenetics -DNA methylation (5-mC, 5-hmC) -Histone PTMs (>100)
Metilazione del DNA Nei vertebrati la metilazione interessa solamente la Citosina: l’enzima citosina metiltransferasi aggiunge un gruppo metile al C5 della citosina: il risulatato è la 5-metilcitosina.
Immunoprecipitazione della cromatina - ChIP 1 Fissaggio delle cellule con formaldeide 3000 2 Rottura della cromatina per sonicazione 1600 1254 400 3 IP con anticorpo anti-NF-Y 4 Eliminazione dei legami covalenti X 5 y Precipitazione dei frammenti di DNA X z input a-NF-Y a-Ctl 6 Analisi PCR di siti CCAAT hnRNPA1 NF-YA
ChIP on chip flowchart Oberley et al.2003
ChIP on chip 5 7 8 9 10 11 Precipitazione dei frammenti di DNA y Precipitazione dei frammenti di DNA X z y 7 Ligazione di linkers X z y 8 1254 Ampificazione per PCR X 400 z 9 Marcatura Cy3/Cy5 Isole CpG (Frammenti genomici) 10 Ibridizazione su vetrino Promotori (Frammenti PCR) Cromosomi (Oligonucloetidi) 11 Analisi genomica dei siti di interazione
ChIP on chip
NF-Y H3-K4-m3 H3-ac Pol II mRNA
Figure 3 A schematic depicting how peaks are formed from sequence reads. A schematic depicting how peaks are formed from sequence reads. For peak identification, sequence reads are first aligned to the genome. Regions of protein–DNA interaction will have an enriched concentration of reads when compared with the background model. The background read density is either obtained from a control sample or computationally predicted in the absence of a control. Thus, tag density can be used to identify peaks, or sites of enrichment, that correspond to locations of interaction between the protein of interest and the genomic DNA. An example of a peak, visualized using the UCSC browser, indicating a FOXA2-binding site in the promoter of the transthyretin (Ttr) gene found in the liver. Hoffman B G , and Jones S J M J Endocrinol 2009;201:1-13 © 2009 Society for Endocrinology