La “Gene Ontology” Ontologia: studio dell’essere in quanto tale, e delle sue categorie fondamentali Le categorie sono le “classi supreme di ogni predicato.

Slides:



Advertisements
Presentazioni simili
IL PROGETTO GENOMA UMANO (HGP)
Advertisements

Regolazione dell’espressione genica
Sintesi proteica Prof. Domenico Ripolo.
IL METABOLISMO ovvero la miriade di reazioni enzimatiche che avvengono in una cellula, rappresenta unattività cellulare altamente coordinata, orientata.
RICERCA DI SIMILARITA’ IN BANCHE DATI
Dr. Giuseppe Pigola – Bioinformatica Dr. Giuseppe Pigola –
Anticorpi e loro azione
IL CICLO REPLICATIVO DEI VIRUS
Classificazione dei viventi
STRUTTURA DUPLICAZIONE SINTESI DELLE PROTEINE
BASI DI DATI BIOLOGICHE - 3
Come nasce la Bioinformatica? Progetti di sequenziazione del genoma Sforzi sperimentali per determinare la struttura e le funzioni di molecole biologiche.
Metilazione del DNA Nei vertebrati la metilazione interessa solamente la Citosina sul dinucleotide CpG : l’enzima citosina metiltransferasi aggiunge un.
TRASCRIZIONE del DNA.
Chip a DNA: un esempio pratico
La Sintesi Proteica.
Bioinformatica Corso di Laurea Specialistica in Biologia Cellulare e Molecolare Ricerca pattern e di motivi funzionali 8/5/2008 Stefano Forte.
Micro RNA (miRNA) Piccole molecole di RNA (20-22 nt)
Bioinformatica Andrea G. B. Tettamanzi.
Vivente : entità genetica organizzata, caratterizzata da metabolismo,
Opinione studenti II anno A-K Per la stragrande maggioranza degli studenti, il bilancio per il II anno A-K, è nettamente positivo. Infatti se vogliamo.
Bioinformatica Per la laurea triennale in: Biologia Umana
Allineamento Metodo bioinformatico che date due o più sequenze ne mette in evidenza similarità/diversità, supponendo che le sequenze analizzate abbiano.
È stimato che oggi sulla terra sono presenti
Farmaci mirati e cura di pazienti affetti da tumori
Struttura delle proteine
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
Gli organismi viventi:
UNITA’ DIDATTICA: L’RNA
CORSO DI BIOLOGIA - Programma
CORSO DI BIOLOGIA - Programma
LE PRINCIPALI CLASSI DI COMPOSTI BIOLOGICI Monosaccaridi (p.es. fruttosio) Oligosaccaridi (p.es. saccarosio,) Polisaccaridi (p.es. amido) Carboidrati.
La regolazione dell’espressione genica
Molti composti possono essere ottenuti da culture batteriche
Dip. Scienze Biomolecolari e Biotecnologie
Andrea Valé 5 A Liceo Scientifico Tecnologico A.S
Nozioni base di Biologia
Ibridazione degli acidi nucleici e
D I V I N E B I O L O G Y © by Michele Muzzolini. All Rights Reserved.
Flusso delle informazioni biologiche. In ogni istante della propria vita ogni cellula umana contiene: 46 cromosomi ( geni) mRNA diversi.
TERMINAZIONE IN PROCARIOTI ED EUCARIOTI
Esempio di utilizzo del programma BLAST disponibile all’NCBI
I GENI ONCOSOPPRESSORI
Informatica e Bioinformatica – A. A Un altro grande database è UniProt, The Universal Protein Resource ( nel quale.
GenBank  Database di sequenze all’NIH  14,397,000,000 basi in 13,602,000 sequenze (Octobre 2001)  Crescita esponenziale  International Nucleotide Sequence.
Computational analysis of data by statistical methods
Computational analysis of data by statistical methods
CORSO DI BIOLOGIA - Programma
Allineamento di sequenze
IV LEZIONE Dati d'espressione genica: ESTs SAGE Microarray NCBI GEO.
DNA: The life molecule La ricerca del materiale genetico (da Eissman a Hershey e Chase) La struttura del DNA (da Chargaff a Watson e Crick) Le funzioni.
CARATTERISTICHE DEGLI ESSERI VIVENTI
La sintesi proteica La sintesi proteica è il processo che porta alla formazione delle proteine utilizzando le informazioni contenute nel DNA. Si tratta.
La trascrizione del DNA
I cambiamenti della sequenza del DNA: Evoluzione
Arrays di acidi nucleici
Pagina web
Clonaggio per espressione e clonaggio funzionale
Capacità di riprodursi struttura nucleo DNA, RNA Membrana semipermeabile Parete cell organelli metabolismo Scambi energia e materia vegetale animale unicellulare.
STRUTTURA DUPLICAZIONE SINTESI DELLE PROTEINE
Sintesi dell’ RNA.
La Fabbrica delle Proteine
Biologia = Studio della vita. Discipline interne alla biologia Molecolare – livello chimico Cellulare – livello della cellula o dei gruppi di cellule.
Trascrizione Processo mediante il quale l’informazione contenuta in una sequenza di DNA (gene) viene copiata in una sequenza complementare di RNA dall’enzima.
Sintesi proteica Prof. Domenico Ripolo.
Jacob, Monod – Parigi,1961 il modello dell’Operon-lac
Figure 6-2 Molecular Biology of the Cell (© Garland Science 2008)
FIRB 2003 (art.8) D.D LIBI: Laboratorio Internazionale di Bioinformatica Unità di Ricerca: CNRBA ATTIVITA’  Sviluppo programmi di analisi  Sviluppo.
GENOMI DELLE PIANTE. I genomi delle piante contengono numerose classi di geni assenti o scarsamente rappresentati nei genomi animali I prodotti di questi.
Transcript della presentazione:

La “Gene Ontology” Ontologia: studio dell’essere in quanto tale, e delle sue categorie fondamentali Le categorie sono le “classi supreme di ogni predicato possibile, con cui poter catalogare tutta la realtà” In pratica: la “gene ontology” è un tentativo di “catalogare la realtà” di tutti i geni noti sulla base delle informazioni che abbiamo sulla loro funzione o attività La catalogazione deve essere effettuata in modo non ambiguo utilizzando una nomenclatura pre-definita e in modo da permettere confronti e analisi delle informazioni disponibili sui geni

“Gene Ontology” Consideriamo un gene, e la rispettiva proteina codificata Per “catalogare” il gene possiamo cominciare a chiederci: Dove è localizzata la proteina, una volta sintetizzata? Nucleo? Citoplasma? Membrana? Secreta fuori dalla cellula? Qual è la funzione molecolare della proteina, ovvero, “cosa fa”? Si lega al DNA? Ad altre proteine? A determinate molecole? Ecc. ecc. In quale “processo biologico” è coinvolta la proteina? Regolazione della trascrizione? Ciclo cellulare? Metabolismo? Pathway? Ecc. ecc.

Gene Cellular Component (CC) “Localizzazione” Molecular Function (MF) Biological Process (BP)

GO I termini (o “attributi”) associati a un gene sono quindi raggruppati in tre categorie principali Gli attributi associati a ciascuna categoria sono organizzati in modo gerarchico, dal più generico al più specifico Gli attributi sono pre-definiti in modo da evitare ambiguità

GO Esempio: un gene codifica per una proteina che agisce da fattore di trascrizione I fattori di trascrizione legano il DNA regolando (attivando/bloccando/modulando) la trascrizione dei geni ad opera della polimerasi I fattori di trascrizione sono attivi nel nucleo della cellula E quindi, per definire un fattore di trascrizione tramite GO:

Gene CC MF BP Nucleus Binding Regulation Nucleotide Binding Regulation of Cell Cycle DNA Binding

Molecular function ontology is_a DNA binding is a type of nucleic acid binding. Nucleic acid binding is a type of binding. Molecular function ontology

Biological process ontology Adaxial/abaxial pattern formation is a type of pattern specification. Adaxial/abaxial pattern specification is a part of adaxial/abaxial pattern formation

Cellular component ontology nucleus is part of the intracellular domain is_a membrane- bound organelle is a type of organelle part_of

function component process

part_of is_a

GO Oltre che a catalogare in modo uniforme, non ambiguo e gerarchico le annotazioni disponibili per i geni e i loro prodotti, la GO serve ad analizzare insiemi di geni cercando proprietà condivise e caratterizzanti Analisi di dati di espressione Confronto due condizioni diverse: estraggo i geni che mostrano differenze significative di espressione nei due esperimenti Confronto più condizioni: “raggruppo” i geni in due o più gruppi sulla base della similarità nella variazione dell’espressione nelle diverse condizioni I gruppi (“cluster”) così formati possono contenere centinaia di geni: che cosa hanno in comune i geni di ogni “cluster”? Determino su scala genomica tutti i geni “target” di un dato fattore di trascrizione (centinaia o migliaia) Di quali processi o pathway biologici il fattore sembra essere un regolatore fondamentale?

GO La risposta dipende da Immaginando di avere un insieme di geni, di cui vogliamo determinare se esistano caratteristiche/proprietà comuni, ci possiamo chiedere: Esiste un “nodo” nella gerarchia GO - ovvero una annotazione - che è associato ai geni dell’insieme - se non proprio tutti a un numero significativo di geni? Ovvero - esiste una annotazione di qualsiasi tipo che è condivisa da un numero significativamente alto dei geni dell’insieme? La risposta dipende da N: numero di geni del genoma M: numero di geni del genoma con una data annotazione GO “A” n: numero di geni del “campione” studiato (es: cluster di espressione) m: numero di geni del “campione” con l’ annotazione GO “A”

GO Dati N,M,n,m si calcola un “test di Fisher” per determinare “la probabilità che - selezionando n geni a caso su N - si trovino m geni con l’annotazione A” Si ripete il test per ogni possibile annotazione della gerarchia della Gene Ontology Si considerano le annotazioni con una probabilità tel test di Fisher BASSA

GO Esistono “tool” bioinformatici che fanno proprio questo: Prendono come input una lista di identificativi di geni Esplorano tutta la gerarchia completa delle annotazioni GO alla ricerca di nodi (annotazioni) con un numero significativamente alto di geni - e un rispettivo “p-value” (valore di probabilità) che ne misura la significatività: più il p-value è basso, più l’osservazione NON è casuale (come nel caso dell’E-value del BLAST)