LEZIONE 4 http://users.unimi.it/mpl/lezioni.html Adriana Maggi CORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO Adriana Maggi BASI MOLECOLARI DELL’AZIONE DEL FARMACO BIOTECNOLOGIE FARMACOLOGICHE LEZIONE 4 http://users.unimi.it/mpl/lezioni.html
STUDIO DELLA FUNZIONE GENICA
ARRAY MACROARRAY MICROARRAY
DNA microarray (o gene/genome chip, DNA chip, o gene array) è una collezione di depositi puntiformi di DNA, ciascun punto rapresentante un singolo gene immobilizzati su un supporto (vetro, plastica o silicone) mediante legami di tipo irreversibile. Esempio di microarray con 40.000 oligo immobilizzati su supporto solido e ibridati con cDNA
APPLICAZIONI DI ARRAY: SNP detection arrays – per identificare Single nucleotide polymorphism nel genoma di diverse popolazioni comparative genomic hybridization (Array CGH) – per identificare riarragiamenti coinvolgenti un numero significtativo di basi mRNA or gene expression profiling – per studiare I livelli di espressione di migliaia di geni simultaneamente Chromatin immunoprecipitation (chIP) studies – per determinare il legame di specifche proteine in porzioni specifiche del DNA (ChIP-on-chip technology)
Siti polimorfici per singola sostituzione di base (SNP) polimorfismo a singolo nucleotide di base Nel genoma umano ci sono 200.000 SNP all’interno di sequenze codificanti, alcuni di questi possono essere marcatori di patologia http://www.ncbi.nlm.nih.gov/About/primer/snps.html
Siti polimorfici per singola sostituzione di base (SNP) Individuo 1 Individuo 2 Gli SNP sono la causa di circa il 90% della variabilità genetica umana ed in genere si trova uno SNP ogni 100-300 pb. 2/3 SNP vedono sostituita la C con T. Perchè una variazione possa essere considerata un SNP deve essere presente in almeno l’1% della popolazione
Metodi di identificazione di SNP
IBRIDAZIONE ALLELE-SPECIFICA
REAZIONE DI ELONGAZIONE DI PRIMER FISSATO SU SUPPORTO SOLIDO
AT CG AC 3’ TG 5’ GC 3’ TA 5’ TAGC DNA is denatured and mixed with oligonudeotides and ligase. The ligase joins pairs of oligonudeotides annealed head to tail if they are correctly base-paired at the junction. Radioactively labeled oligonudeotides (*) are immobilized and detected by autoradiography only if ligated to biotinylated oligonucleotides (B) that can be bound to streptavidin on a solid support. LANDEGREN, et al. Science 1998
Michiel J. T. van Eijk*, et al. NAR 2004
BANCHE DATI E IDENTIFICAZIONE DI SNP dbSNP sono presenti (“annotati”) in diverse banche dati quali: PubMed, genome project sequences, GenBank records, the Entrez Gene database, and the dbSTS database of sequence tagged sites.
mRNA or gene expression profiling
Drugs x Cells Genes x Cells Clustered Image Maps Genes x Drugs
Database Microarray Experiment Sets Sample Profiles Genomics and bioinformatics group NCI and NIH
Studio di proteine che interagiscono con DNA
ChIP-on-chip (o ChIP-chip) è una tecnica che combina la immunoprecipitazione di cromatina (chromatin immunoprecipitation "ChIP” con la tecnologia del micro array(microarray technology “chip").
Chip-on-chip analysis per lo studio delle interazioni DNA proteine
read-out Normalizzazione dei dati e analisi esplorativa dei dati Sito DNA “estrazione delle informazioni” arricchimento proteina di interesse
Le prime analisi si sono focalizzate sulle differenze tra animali in Proestro e Metestro, per vedere se la differenza dei livelli di Estradiolo circolante avesse degli effetti sull’espressione genica. Come atteso, gli animali LID non mostrano nessuna significativa differenza nell’espressione genica nelle due fasi del ciclo, come se quest’ultimo fosse appiattito. Gli animali WT, al contrario, mostrano deboli ma rilevabili differenze nelle due fasi; tuttavia, il quadro osservato e’ totalmente inatteso, in quanto i geni differenzialmente espressi sono tutti geni MAGGIORMENTE espressi nella fase di metestro o, guardando all’inverso, downregolati nella fase di Proestro. Considerando cio’ che abbiamo sempre osservato, vale a dire un’attivazione del recettore degli estrogeni in fase di proestro, questo stupisce. Upregulated in M WT M vs WT P WT P vs WT M SEM Analysis Downregulated in P
GO Term Analysis Una volta identificati i trascritti differenzialmente espressi nei due gruppi (t test & SAM analysis, tenendo in considerazione solo quelli con Fold Indution >=1,5), si cerca di capire se questi geni sono implicati in determinati ‘Biological Process’ o hanno particolari ‘Molecular Function’ o interferiscono in un determinato ‘Pathway’. Questa analisi si puo’ fare a diversi “livelli”, i risultati riportati si riferiscono ad un livello piuttosto superficiale, ma per questo piu’ generale e credo indicativo. Riporto: BP = Biological Process MF = Molecular Function Pathway L’analisi e’ stata fatta principalmente con DAVID http://david.abcc.ncifcrf.gov/summary.jsp piu’ molti altri software e websites (le risorse sono infinite)
Biological Process - WTall vs LIDall Considerando tutti i trascritti differentemente espressi, sia upregolati che downregolati. I geni per ogni categoria sono nel file Excel ‘Panther_BP_WTall_vs_LIDAll.xls’
Molecular Function - WTall vs LIDall I geni per ogni categoria sono nel file Excel ‘Panther_MF_WTAll_vs_LIDAll.xls’
Gene Ontology http://www.geneontology.org/index.shtml Un progetto atto a costruire un vocabolario per descrivere geni e prodotti genici attribuibili a ogni organismo Questo vocabolario serve per dare un unico nome a un specifico prodotto in modo che questi così compaia nelle diverse banche dati e possa venire rapidamente ritrovato Ogni gene/proteina si contraddistingue per un numero identificativo unico (GO:nnnnnnn) e un nome (es: cellula, fibroblasto, fattore di crescita, trasduttore del segnale). Ogni termine viene assegnato a una delle tre suddivisioni della banca (ontology): Funzioni molecolari Componenti cellulari Componenti I processi biologici
The three organizing principles of GO are cellular component, biological process and molecular function. A gene product might be associated with or located in one or more cellular components; it is active in one or more biological processes, during which it performs one or more molecular functions. For example, the gene product cytochrome c can be described by the molecular function term oxidoreductase activity, the biological process terms oxidative phosphorylation and induction of cell death, and the cellular component terms mitochondrial matrix and mitochondrial inner membrane.
Topology The ontologies are structured as directed acyclic graphs, which are similar to hierarchies but differ in that a more specialized term (child) can be related to more than one less specialized term (parent). For example, the biological process term hexose biosynthetic process has two parents, hexose metabolic process and monosaccharide biosynthetic process. This is because biosynthetic process is a type of metabolic process and a hexose is a type of monosaccharide. When any gene involved in hexose biosynthetic process is annotated to this term, it is automatically annotated to both hexose metabolic process and monosaccharide biosynthetic process.
I LIMITI DELLA ANALISI GENOMICA: RIPRODUCIBILITA’ ANALISI NON QUANTITATIVA I mRNA NON RIFLETTONO ESATTAMENTE LE PROTEINE PRESENTI NELLA CELLULA
proteomica Il fine della proteomica consiste nella completa identificazione delle proteine e della loro espressione in determinati cellule o tessuti La metodologia su cui si basa la proteomica comprende: gel elettroforesi bidimensionale; HPLC e spettrometria di massa
(20,000 to 25,000 genes vs. > 500,000 proteins). E’ stato calcolato che il corpo umano puo’ esprimere fino a 2 milioni di proteine, ciascuna con differenti funzioni
I metodi della proteomica dagli anni ‘70: gel elettroforesi bidimensionale Limiti di definizione e riproducibilità Anni ’90 spettrometria di massa con metodi di ionizzazione alternativi (electrospray o MALDI Matrix Assisted Laser Desorption Ionization ) Non si amplificano le proteine: dimensione campioni Identificazione dei peptidi da miscele complesse Rapidità Analisi quantitativa Limiti nelle conoscenze di genomi da diversi organismi Disponibilità di strumentazione
electrospray ionization liquid chromatography mass spectrometry
John Bennett Fenn ha ricevuto il premio Nobel per la chimica nel 2002 per lo sviluppo della tecnica di elettrospray per l’analisi di macromolecole biologiche
Stable isotope labeling with amino acids in cell culture (SILAC) per analisi proteomica quantitativa
Functional and quantitative proteomics using SILAC Mann Nature Reviews Molecular Cell Biology 7, 952–958 (December 2006) | doi:10.1038/nrm2067 Functional and quantitative proteomics using SILAC SILAC (Stable isotope labelling with amino acids in cell culture)
Proteomica e trascrittomica a confronto Uno studio in cui si sono comparati i dati di analisi di cellule MCF-7 Su un totale di 7278 geni identificati in modo univoco come messaggi o proteine 55% provengono da analisi proteomica 77% provengono da microarray
LE PROSPETTIVE DELLA PROTEOMICA: continuo progresso della tecnologia per misure sempre più su larga scala e rapide costruzione di banche dati protomica interviene in cellule dove mRNA non è informativo (es cellule ematiche) La misura proteomica fornisce l’end point, il microarray va verificato con qPCR e da western La proteomica permette di studiare la presenza di modificazioni post-traduzionali, di interazioni proteina-proteina
INTERATTOMICA analisi del trascrittoma, del proteoma e dell’interattoma comparati per arrivare a definire le funzioni fisiologiche di ciascun gene
L’INTERATTOMA O BIOLOGIA DEI SISTEMI (system biology)
L’interattoma rappresenta interazioni molecolari con un sistema digrafico Per grafico intendiamo un insieme di punti, nodi o vertici che sono tra loro collegati non in modo unidirezionale. Nel digrafico la direzionalità o bidirezionalità dell’evento è segnata
‘OMICS APPLICAZIONI MEDICHE Test genetici Terapia genica Farmacogenomica Informazioni sulla malattia