DATABASE DI GENETICA E BIOLOGIA MOLECOLARE OMIMOnline Mendelian Inheritance in Man LOCUSLINKcurated sequence and descriptive information about genetic.

Slides:



Advertisements
Presentazioni simili
Malattie genetiche monogeniche
Advertisements

Organizzazione del genoma umano I
Argomenti trattati Struttura di un gene e alternative splicing (AS)
MAPPE CONCETTUALI Sergio Capone ITP
EBRCN General Meeting, Paris, 28-29/11/20021 WP4 Analysis of non-EBRCN databases and network services of interest to BRCs Current status Paolo Romano Questa.
WEB OF SCIENCE ISI Web of Knowledge
Dr. Giuseppe Pigola – Bioinformatica Dr. Giuseppe Pigola –
Bioinformatica Prof. Mauro Fasano
BASI DI DATI BIOLOGICHE - 2. Basi di Dati Biologiche Tipi principali di Basi di Dati Biologiche: Di sequenze : NCBI. Di annotazioni: Ensembl.Specifiche:Transfac.
BASI DI DATI BIOLOGICHE - 3
PUBMED 29 novembre 2012.
Bioinformatica Corso di Laurea Specialistica in Biologia Cellulare e Molecolare Ricerca pattern e di motivi funzionali 8/5/2008 Stefano Forte.
Il concetto di aplotipo
Teoria e tecniche della catalogazione e classificazione ricerca9web Prof.ssa Elisa Grignani Università degli studi di Parma aa. 2005/2006.
Micro RNA (miRNA) Piccole molecole di RNA (20-22 nt)
Caratteri complessi Vincenzo Nigro Dipartimento di Patologia Generale
Sequenze Ripetitive di Dna
L’ ALU UN VIAGGIO NEL DNA.
Software per la Bioinformatica
Canale A: Prof. Malavasi
Clonaggio: vettori plasmidici
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia
Polimorfismi, mutazioni e metodi per evidenziarli
AN EXAMPLE FROM MORE ADVANCED BIOINFORMATICS
Polymerase chain reaction amplification of the Bag320 satellite family reveals the ancestral library and past gene conversion events in Bacillus rossius.
Sintesi di una proteina Cos’è il patrimonio genetico
A.A CORSO INTEGRATO DI INFORMATICA E BIOINFORMATICA per il CLT in BIOLOGIA MOLECOLARE Scuola di Scienze, Università di Padova Docenti: Dr.
La “Gene Ontology” Ontologia: studio dell’essere in quanto tale, e delle sue categorie fondamentali Le categorie sono le “classi supreme di ogni predicato.
Sequenze e Banche Dati Biologiche
Giulio Pavesi Dipartimento di BioScienze Università di Milano
Prof.ssa Cinzia Di Pietro
Adriana Maggi DOCENTE DI BIOTECNOLOGIE FARMACOLOGICHE CORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO Lezione 2.
Informatica e Bioinformatica – A. A Un altro grande database è UniProt, The Universal Protein Resource ( nel quale.
UN GENE UNA MALATTIA ETEROGENEITÀ GENETICA TEST DI COMPLEMENTAZIONE
Watson et al., BIOLOGIA MOLECOLARE DEL GENE, Zanichelli editore S.p.A. Copyright © 2005.
Corso di laurea specialistica magistrale Biotecnologia aula 6a ore corso di genomica a.a. 2009/10 lezione martedì 15 Dicembre 2009 lezione.
GQuery ( ncbi. nlm. nih
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle.
STRUTTURA  FUNZIONE  EVOLUZIONE STRUTTURA  (FUNZIONE)  EVOLUZIONE Organi, tessuti ecc. Geni o segmenti genomici.
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
IV LEZIONE Uso di Genome Browser per l'annotazione di sequenze genomiche. Allineamento di sequenze trascritte con sequenze genomiche: BLAT.
A.A CORSO DI BIOINFORMATICA per il CLT in Biotecnologie Sanitarie Università di Padova Docente: Dr. STEFANIA BORTOLUZZI.
GenBank  Database di sequenze all’NIH  14,397,000,000 basi in 13,602,000 sequenze (Octobre 2001)  Crescita esponenziale  International Nucleotide Sequence.
Computational analysis of data by statistical methods
Computational analysis of data by statistical methods
Test genetici nella investigazione e commercio di specie protette
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
AN EXAMPLE FROM MORE ADVANCED BIOINFORMATICS Gene expression data analysis.
La parola “Bioinformatica”
Allineamento di sequenze
DATABASE DI GENETICA E BIOLOGIA MOLECOLARE
IV LEZIONE Dati d'espressione genica: ESTs SAGE Microarray NCBI GEO.
Transcription termination RNA polymerase I terminates transcription at an 18 base terminator sequence. RNA polymerase III terminates transcription in poly(U)
AVVISO Il materiale riportato in queste diapositive è di esclusiva proprietà del Prof. Liborio Stuppia. La pubblicazione.
Viruses.
Chiusura del periodo per ordini di servizio
Il laboratorio: l’ analisi molecolare Accurata Consulenza Genetica
L’utilizzo di pannelli di geni per le forme ereditarie tumorali
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle Prof.
Sistema di ricerca Entrez Insieme di banche dati contenenti svariati tipi di informazioni biomediche, interrogabile mediante un’unica interfaccia Concetto.
FILE DEI DATABASE FASTA GBFF XML ASN. Formato FASTA Il formato fasta è forse il più utilizzato dai comuni software di ricerca. Esso consiste in un file.
Corso di ricerca bibliografica. I motori di ricerca in rete Un motore di ricerca è un software composto da tre parti: 1.Un programma detto ragno (spider)
CLONAGGIO POSIZIONALE
OJS & OCS O PEN S OURCE PER LA R ICERCA S CIENTIFICA Le risorse offerte da CSIA-UniMC per la ricerca scientifica: Open Journal System & Open Conference.
Trascrizione Processo mediante il quale l’informazione contenuta in una sequenza di DNA (gene) viene copiata in una sequenza complementare di RNA dall’enzima.
Definizione di GENETICA
Transcript della presentazione:

DATABASE DI GENETICA E BIOLOGIA MOLECOLARE OMIMOnline Mendelian Inheritance in Man LOCUSLINKcurated sequence and descriptive information about genetic loci UniGeneexperimental system for automatically partitioning GenBank sequences into a non- redundant set of gene-oriented clusters GenCardsdatabase of human genes, their products and their involvement in diseases GDBGenome Database: stores information about genes and other genomic features HGMDHuman Gene Mutation Database: information about disease-causing mutations in genes

DATABASE DI GENETICA E BIOLOGIA MOLECOLARE OMIM LOCUSLINK UniGene GenCards GDB HGMD

OMIM Online Mendelian Inheritance in Man Catalogo di geni umani e malattie genetiche (Dr. Victor A. McKusick, Johns Hopkins + NCBI) Contiene informazione testuale, riferimenti bibliografici e links a MEDLINE, sequenze e ad altre risorse OMIM gene map Posizioni di mappa citogenetica di geni-malattia e altri geni descritti in OMIM OMIM morbid map Posizioni di mappa citogenetica di geni-malattia indicizzati in OMIM

OMIM OMIM Numbering and Symbols ID e’ un numero di 6 cifre. * ( ) Autosomal dominant (entries created before May 15, 1994) * ( ) Autosomal recessive (entries created before May 15, 1994) * ( ) X-linked loci or phenotypes * ( ) Y-linked loci or phenotypes * ( ) Mitochondrial loci or phenotypes * ( ) Autosomal loci or phenotypes (entries created after May 15, 1994)

OMIM Varianti alleliche: stesso ID piu’ un altro numero di 4 cifre. For example, allelic variants (mutations) at the factor IX (hemophilia B) locus are numbered to The beta-globin locus (HBB) is numbered ; sickle hemoglobin is numbered Asterisco (*) significa che il fenotipo legato al gene e’ diverso da quelli rappresentati da altre entries con l’asterisco e che si conosce il tipo di ereditabilita’. Se manca l’asterisco non sono chiari la separazione da altri loci o il modo in cui si eredita il fenotipo. (#) il fenotipo puo’ essere causato da 2 o piu’ geni (eterogeneita’ genetica).

OMIM Esempio di ricerca: search for... 1.DYSTROPHY 2.CORNEAL DYSTROPHY OMIM Statistics All Entries : Established Gene Locus (*) : 10628* Phenotype Descriptions (#) : 1269# Other Entries ( ) : 2418 Autosomal Entries : X-Linked Entries : 795 Y-Linked Entries : 43 Mitochondrial Entries : 60

LOCUSLINK Interfaccia unificata per cercare informazioni su sequenze e loci genetici. Presenta informazioni sulla nomenclatura ufficiale, accession numbers, fenotipi, MIM numbers, UniGene clusters, omologia, posizioni di mappa e link a numerosi altri siti web. Sequence accessions include a subset of GenBank accessions for a locus, as well as a new type, the NCBI Reference Sequence (RefSeq). Refseq

LOCUSLINK Records for Homo sapiens Review statusNumber of reference sequences Number of loci Validated17 Inferred33 Provisional Predicted Reviewed Genomic992 Total LocusLink records with sequence data for Homo sapiens 21933

LOCUSLINK LocusLink and the curated RefSeq records are created via a process that includes automated computational methods,collaboration, and manual data curation by NCBI Staff. LocusLink & RefSeq Development

LOCUSLINK Examples of LocusLink Queries: Search for... Nebulin Rhodopsin

UniGene è il principale "gene indexing" database, mantenuto all'NCBI UniGene si propone di rappresentare l'insieme dei geni umani espressi attraverso il raggruppamento in un unico "cluster" di tutte le EST e le sequenze annotate di DNA genomico, mRNA, derivanti dai database GenBank e dbEST, simili tra loro e ipoteticamente afferenti alla medesima unità trascrizionale. Il sistema di "clusterizzazione" si basa sulla similarità di sequenza e non sull'allineamento e le sequenze di scarsa qualità non vengono prese in considerazione. Le sequenze vengono comparate ognuna con tutte le altre in occasione di ciascuna delle frequenti versioni di UniGene e quelle che mostrano una similarità statisticamente significativa vengono inserite in un unico gruppo. UniGene

Non viene costruita alcuna sequenza di consenso tra quelle di un "cluster", poiché a una singola unità trascrizionale possono corrispondere diversi contigui di sequenze espresse, a causa di fenomeni molto comuni quali o lo splicing alternativo o l'uso di diversi promotori per diverse isoforme. Il processo di "clusterizzazione" si svolge in diversi passaggi, con stringenza decrescente. Prima vengono filtrate le sequenze contaminanti, ripetute o a bassa complessità e quelle ribosomiali e mitocondriali, in modo che ogni restante sequenza, di lunghezza superiore a 100 bp sia candidata per far parte di un "UniGene cluster". Poi vengono comparate tra loro e raggruppate le sequenze di geni e messaggeri; a questi "cluster" vengono aggiunte le EST correlate per similarità di sequenza o per informazioni sul clone di derivazione. UniGene

I "cluster" che non contengono il segnale di poliadenilazione vengono scartati, mantenendo solo i "cluster" "ancorati", ovvero quelli per cui è nota la sequenza 3', requisito fondamentale per l'identificazione di un gene. Gli ultimi stadi del processo provvedono all'assegnazione delle EST "orfane" e dei "cluster" di dimensione 1 a uno dei "cluster" "ancorati", con minore stringenza. Infine a ogni "cluster" viene assegnato il numero di identificazione, cercando di assicurare la massima continuità possibile con le precedenti versioni del database. I parametri usati da UniGene per il processo di raggruppamento delle sequenze in "UniGene entry" sono caratterizzati da un grado di stringenza piuttosto basso percio’ ci si aspetta che esista in UniGene un singolo gruppo di trascritti a rappresentare ogni gene umano, ovvero che, di converso, le sequenze di trascritti diversi, ottenuti per splicing alternativo da un medesimo gene, siano raggruppate insieme in un'unica "entry". UniGene Search for... nebulin Search for... Nebulin Rhodopsin

GDB GDB contiene i seguenti tipi di dati: Regions of the human genome, including genes, clones, amplimers (PCR markers), breakpoints, cytogenetic markers, fragile sites, ESTs, syndromic regions, contigs and repeats.Regions of the human genome Maps of the human genome, including cytogenetic maps, linkage maps, radiation hybrid maps, content contig maps, and integrated maps. These maps can be displayed graphically via the Web.Maps of the human genome Variations within the human genome including mutations and polymorphisms, plus allele frequency data.Variations within the human genome

GDB Search and Browsing Options Example Searches Search for... Nebulin Rhodopsin

HGMD Human Gene Mutation Database (HGMD) raccoglie le mutazioni conosciute (pubblicate) in geni umani, responsabili di malattie genetiche Creato per studiare il meccanismo delle mutationi nel genoma umano, per riconoscere le regioni e i loci ipermutabili Ora e’ importante anche come raccolta di dati. Utile per diagnosi molecolare di patologie e consulenza genetica. Non include mutazioni somatiche o mitocondriali, mutazioni silenti. Dal marzo 1999, HGMD include disease-associated polymorphisms. Basato sull’analisi di >250 riviste scientifiche. Search for... Nebulin Rhodopsin