AA 2011/2012 Lezione 4 Adriana Maggi DOCENTE DI BIOTECNOLOGIE FARMACOLOGICHE CORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO AA 2011/2012 Lezione 4
Le sfide per il futuro del progetto genoma umano comprendere le componenti strutturali e funzionali del genoma capire come le reti di geni e proteine contribuiscono alla definizione del fenotipo comprendere cosa determina le variazione nella trasmissione dei caratteri genetici identificare le varianti genetiche che contribuiscono al mantenimento dello stato di salute determinare strategie per identificare il rischio di malattia stabilire strategie per l’identificazione del contributo del genoma nella determinazione delle patologie e delle risposte alla terapia utilizzare le conoscenze genetiche per lo sviluppo di farmaci innovativi
Il progetto Genoma Umano si è focalizzato sulla generazione di mappe genomiche tramite mappe di concatenazione e mappe fisiche. Una mappa genomica indica l’ordine in cui i geni e i marcatori genici si trovano nei singoli cromosomi
Nella ricerca del gene malattia, i ricercatori in genere trovano un marcatore specifico che indica il segmento di DNA nelle vicinanze del gene di interesse, con clonaggi posizionali e analisis di sequenze si possono individuare I geni responsabili della patologia
GENOMATICA FUNZIONALE Studio di funzione genica
LA RICERCA DELLA FUNZIONE DEI GENI La tradizione: ricerca di di mutazioni per identificare perdite o acquisizione di funzioni I metodi della genetica all’incontrario: Analisi mutazionale in organismi modello: Generare nuovi organismi geneticamente modificati per studiare perdita o acquisizione di funzioni Metodologie innovative: Studio comparativo di popolazioni di prodotti genici
La tradizione: ricerca e analisi di mutazioni e polimorfismi (es RFLP; SNP) del genoma stesso
Polimorfismi al taglio con enzimi di restrizione (RFLP) Siti polimorfici 99.99 % della sequenza del DNA di due individui e’ identica la maggioranza delle differenze (0.01%) coinvolgono singole sostituzioni Polimorfismi al taglio con enzimi di restrizione (RFLP) Single nucleotide polymorphysm (SNP)
Polimorfismi al taglio con enzimi di restrizione (RFLP) * Allele 1 Allele 2
Polimorfismi al taglio con enzimi di restrizione (RFLP) associazione RLFP-patologia variab nella popol. Famiglia Patol. sani
The Lod (log of odds) score is used to calculate the probability of a pedigree arising randomly or by genetic linkage. The test was developed by Newton and Morton In practice, linkage is declared if the LOD score is equal to or greater than 3 (i.e. the likelihood of observing the result if the two loci are not linked is less than 1 in 1000). On the other hand, linkage can be completely excluded if the LOD score is strictly below -2. LOD = log Probability of birth sequence with a given linkage value Probability of birth sequence with no linkage
Studio di funzione genica Localizzazione posizionale di geni/malattia Studio di linkage familiare con polimorfismi
Huntington, la malattia ideale per position cloning Ereditarietà – autosomica dominante : penetranza 100% Frequenza - circa 1/10,000 nati Manifestazione clinica: 35 - 45 anni di età La manifestazione in età adulta ne ha causato l’espandersi della malattia Gli studi delle basi molecolari della malattia sono iniziati con la identificazione di famiglie di grandi dimensioni i cui membri fossero viventi: questo è stato possibile grazie al registro Nazionale dei Pazienti con Huntington USA presso l’Università dell?Indiana e alla scoperta di una famiglia presso il lago Maracaibo in Venezuela in cui diversi membri erano affetti dalla malattia Da diverse famiglie sono state prelevate cellule ematiche per la Generazione di cellule immortalizzate Ogni famiglia è stata seguita da neurologi e la paternità dei pazienti è stata opportunamente verificata
1981 - Gusella's group started with a group of anonymous probes that uncovered RFLPs - very few available. the 12th probe they tried -called G8 - indicated linkage. Disease associated with the A haplotype in the American family and the C haplotype in the Venezuelan family. LOD Scores 1983 - G8 (also called D4S10) mapped approximately 4 cM from the HD locus. It took 10 more years to clone the gene. 1986-87 DNA markers were used and D4S10 was localized by in situ hybridization and somatic cell genetics to chromosome region 4p16.3; Further linkage studies for isolating HD Identification of Putative Coding Sequences Exon Trapping; Use trapped exons to identify candidate genes from cDNAs; Four transcripts were analyzed; IT15 - Huntingtin
Dall’osservazione: Gusella JF, Wexler NS, Conneally PM, Naylor SL, Anderson MSA, Tanzi RE, Walkins PC, et al (1983) A polymorphic DNA marker genetically linked to Huntington's disease. Nature 306:234-238 Al brevetto: Huntingtin DNA, protein and uses thereof US Patent Issued on November 11, 1997 Inventor(s): Marcy E. MacDonald; Christine M. Ambrose; Mabel P. Duyao; James F. Gusella Assignee: The General Hospital Corporation Application: No. 246982 filed on 1994-05-20
Metodologie innovative: Studio comparativo di popolazioni di prodotti genici genomatica comparativa generazione di arrays per lo studio comparato di espressione genica
Genomatica comparata: analisi basata sulla omologia di geni codificanti proteine a funzione nota
Genomatica comparata Utile per: Identificare similarità/dissimilarità tra speci diverse Studiare evoluzione della specie Identificare geni codificanti e loro funzione Identificare regioni funzionali nei genomi
Ortologo e paralogo Ortologhi – geni omologi con la stessa funzione in organismi diversi Paraloghi – geni all’interno dello stesso organismo derivanti da duplicazione genica
Geni ortologhi o paraloghi
Allineamento di sequenze
generazione di arrays per lo studio comparato di espressione genica
ARRAY MACROARRAY MICROARRAY
DNA microarray (o gene/genome chip, DNA chip, o gene array) è una collezione di depositi puntiformi di DNA, ciascun punto rapresentante un singolo gene immobilizzati su un supporto (vetro, plastica o silicone) mediante legami di tipo irreversibile. Esempio di microarray con 40.000 oligo immobilizzati su supporto solido e ibridati con cDNA
mRNA or gene expression profiling
Drugs x Cells Genes x Cells Clustered Image Maps Genes x Drugs
I LIMITI DELLA ANALISI GENOMICA: RIPRODUCIBILITA’ ANALISI NON QUANTITATIVA I mRNA NON RIFLETTONO ESATTAMENTE LE PROTEINE PRESENTI NELLA CELLULA
la materia vivente per comprenderla? Il progetto GENE ONTOLOGY Come classificare la materia vivente per comprenderla? Il progetto GENE ONTOLOGY
Gene Ontology http://www.geneontology.org/index.shtml Un progetto atto a costruire un vocabolario strutturato pensato per descrivere i geni e i loro prodotti in qualsiasi tipo di organismo Questo vocabolario serve per dare un unico nome a un specifico prodotto in modo che questi così compaia nelle diverse banche dati e possa venire rapidamente ritrovato
L'ontologia, una delle branche fondamentali della filosofia, è lo studio dell'essere in quanto tale, nonché delle sue categorie fondamentali. Il termine deriva dal greco ὄντος, òntos (genitivo singolare del participio presente ὤν di εἶναι, èinai, il verbo essere) più λόγος, lògos, letteralmente "discorso sull'essere”
di funzione molecolare, di ubicazione cellulare Gene Ontology (GO, ontologia genica): un vocabolario controllato e strutturato per la descrizione di prodotti genici in termini di funzione molecolare, di ruolo biologico e di ubicazione cellulare
Le Ontologie differiscono dalle terminologie controllate (Lexicon) poiché si tratta di una struttura dati gerarchica che contiene tutte le entità rilevanti, le relazioni esistenti fra di esse, le regole, gli assiomi, ed i vincoli specifici del dominio; mentre le terminologie controllate semplicemente restringono l’insieme di parole usate per descrivere il dominio.
Gene Ontology http://www.geneontology.org/index.shtml Ogni gene/proteina si contraddistingue per un numero identificativo unico (GO:nnnnnnn) e un nome (es: cellula, fibroblasto, fattore di crescita, trasduttore del segnale). Ogni termine viene assegnato a una o più delle tre suddivisioni della banca (ontology): Funzioni molecolari Componenti cellulari Componenti I processi biologici
Esempio di annotazione: Il prodotto genico della citocromo-C-ossidasi puo’ essere descritto in GENE ONTOLOGY tramite: La sua funzione molecolare: attività ossidoreduttasica Il componente cellulare nel quale è presente: la matrice mitocondriale o la membrana interna del mitocondrio Il processo biologico che causa: fosforilazione ossidativa e induzione di morte cellulare
DAG (Grafico Acilico Diretto) Il grafico Acilico Diretto è la forma rappresentativa usata in GO. Il DAG è una forma di grafico che differisce da una normale gerarchia poichè ogni termine può avere più padri e in cui possono esistere molteplici percorsi da un termine qualsiasi al termine radice Ciascun vocabolo della GO rappresenta un nodo del DAG al quale è associato un identificativo (GO ID).
Grafico Acilico Diretto
un termine di gene ontology molto “generico” contiene al suo interno” più termini di gene ontology via via più specifici. Questo fa sì che man mano che si va “verso il basso” le definizioni diventino sempre più precise ed i geni che soddisfano a quella descrizione sempre meno. Questo albero può quindi essere “letto” a più livelli, da quelli più generali, che stanno alla radice, a quelli via via sempre più specifici che stanno sulle foglie.
POSSIBILI UTILIZZI DI GENE ONTOLOGY La categorizzazione con GENE ONTOLOGY può avere diversi scopi finali: 1) comprendere in che processo/funzione/componente in cui è coinvolto un gene 2) categorizzazione di un set di dati (gene e proteine); in formato normale o usando un Goslim per avere una visione d'insieme dei dati 3) categorizzare un set di dati e valutare eventuali sovra-rappresentazioni (“gene enrichment”) che non siano fruttto del caso 4) estrazione dei geni (sequenze) che sono coinvolte in un processo, funzione, componente