Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel. 0039 049 8276214

Slides:



Advertisements
Presentazioni simili
Divisione in gruppi di tre persone
Advertisements

Cache Memory Prof. G. Nicosia University of Catania
Teoria e Tecniche del Riconoscimento
1 Teaching Cloud Computing and Windows Azure in Academia Domenico Talia UNIVERSITA DELLA CALABRIA & ICAR-CNR Italy Faculty Days 2010.
Luca Bianchi Windows Development Day Bologna 28 gennaio 2005 SQL Server Desktop Engine (MSDE) & SQL Server 2005 Express.
Modalità di ricerca semantica nelle Biblioteche digitali Maria Teresa Biagetti DIPARTIMENTO DI SCIENZE DOCUMENTARIE LINGUISTICO-FILOLOGICHE E GEOGRAFICHE.
EBRCN General Meeting, Paris, 28-29/11/20021 WP4 Analysis of non-EBRCN databases and network services of interest to BRCs Current status Paolo Romano Questa.
The lac operon gal operon Glucose-1-phosphate
Dr. Giuseppe Pigola – Bioinformatica Dr. Giuseppe Pigola –
Lezione 1 Di che cosa si occupa la patologia generale
1.E un algoritmo ricorsivo: Tutti le istanze di oggetti raggiungibili da un oggetto persistente diventano anchessi persistenti.
LETTERA DI DIMISSIONE DIAGNOSI FATTORI DI RISCHIO DECORSO CLINICO
Bioinformatica Prof. Mauro Fasano
BASI DI DATI BIOLOGICHE - 3
Un DataBase Management System (DBMS) relazionale client/server.
MySQL Esercitazioni. Ripasso Connessione a MySQL. Creazione delle basi di dati e delle tablelle. Inserimento dei dati. Interrogazioni.
Raffaele Cirullo Head of New Media Seconda Giornata italiana della statistica Aziende e bigdata.
SOCIOLOGIA DEI PROCESSI CULTURALI E COMUNICATIVI Prof.ssa Donatella Padua A.A. 2011/12 A.A. 2011/12.
LA RICERCA BIBLIOGRAFICA NEL SETTORE BIOMEDICO: Pubmed CENTRO DI BIOTECNOLOGIE SETTORE DOCUMENTAZIONE BIOMEDICA A.O.R.N. A.CARDARELLI- NAPOLI Prof.ssa.
La predizione della struttura genica e lo splicing alternativo
TIPOLOGIA DELLE VARIABILI SPERIMENTALI: Variabili nominali Variabili quantali Variabili semi-quantitative Variabili quantitative.
Ergo : what is the source of EU-English? Standard British English? Standard American English? Both!!!! See morphology (use of British.
Fanno ormai parte della nostra vita di tutti i giorni….
NLM - National Library of Medicine NLM - National library of Medicine Che cosè? Dove? Bethesda, MD, USA Affiliazione: –Department of Health and Human.
NLM - National Library of Medicine NLM - National library of Medicine Che cosè? n Dove? Bethesda, MD, USA n Affiliazione: –Department of Health and Human.
NLM - National Library of Medicine NLM - National library of Medicine Che cosè? n Dove? Bethesda, MD, USA n Affiliazione: –Department of Health and Human.
Watson et al. , BIOLOGIA MOLECOLARE DEL GENE, Zanichelli editore S. p
FUNZIONI DI GRUPPO Le funzioni di gruppo operano su un set di record restituendo un risultato per il gruppo. AVG ([DISTINCT|ALL] n) media, ignora i valori.
Palermo, may 2010 F.Doumaz, S.Vinci (INGV-CNT- Gruppo di telerilevamento)
Entrez + MedLine => PubMed
Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione.
INTERNET Internet è una rete a livello mondiale che permette alle persone di comunicare ed ad accedere a banca dati da qualunque parte del mondo e su qualunque.
Gruppo 4: Gelmi Martina, Morelato Francesca, Parisi Elisa La mia scuola ha un sito Web: modelli per la qualità dei siti (Ingegneria del Web)
Project Review byNight byNight December 6th, 2011.
Banche dati biologiche
THE BIG DATA ERA Researchers need to be obliged to document and manage their data with as much professionalism as they devote to their experiments. Nature.
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia
Project Review Novembrer 17th, Project Review Agenda: Project goals User stories – use cases – scenarios Project plan summary Status as of November.
Project Review byNight byNight December 21th, 2011.
Project Review byNight byNight December 6th, 2011.
Project Review Novembrer 17th, Project Review Agenda: Project goals User stories – use cases – scenarios Project plan summary Status as of November.
Project Review byNight byNight December 5th, 2011.
Quale Europa? Riscopriamo le radici europee per costruire unEuropa PIÙ vicina a noi ISTITUTO COMPRENSIVO MAZZINI CASTELFIDARDO PROGETTO COMENIUS 2010/2012.
Uso di Genome Browser per l'annotazione di sequenze genomiche.
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
Gene details Annotation Tracks official sequence comparisons SNPs NAVIGATING GENOMES By Genome Browsers.
A.A CORSO DI BIOINFORMATICA per il CLT in Biotecnologie Sanitarie Università di Padova Docente: Dr. STEFANIA BORTOLUZZI.
Analysis and Development of Functions in REST Logic: Application to the «DataView» Web App UNIVERSITA’ DEGLI STUDI DI MODENA E REGGIO EMILIA DIPARTIMENTO.
Collection & Generics in Java
EMPOWERMENT OF VULNERABLE PEOPLE An integrated project.
Teorie e tecniche della Comunicazione di massa Lezione 7 – 14 maggio 2014.
La DNA Polimerasi può commettere errori Nei batteri: 1 errore ogni 10 9 basi in ogni generazione.
Sequenze e Banche Dati Biologiche
Italian 1 -- Capitolo 2 -- Strutture
Scenario e Prospettive della Planetologia Italiana
Informatica e Bioinformatica – A. A Un altro grande database è UniProt, The Universal Protein Resource ( nel quale.
Corso di laurea specialistica magistrale Biotecnologia aula 6a ore corso di genomica a.a. 2009/10 lezione martedì 15 Dicembre 2009 lezione.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle.
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
A.A CORSO DI BIOINFORMATICA per il CLT in Biotecnologie Sanitarie Università di Padova Docente: Dr. STEFANIA BORTOLUZZI.
GenBank  Database di sequenze all’NIH  14,397,000,000 basi in 13,602,000 sequenze (Octobre 2001)  Crescita esponenziale  International Nucleotide Sequence.
DATABASE DI GENETICA E BIOLOGIA MOLECOLARE OMIMOnline Mendelian Inheritance in Man LOCUSLINKcurated sequence and descriptive information about genetic.
La parola “Bioinformatica”
DATABASE DI GENETICA E BIOLOGIA MOLECOLARE
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle Prof.
Bioinformatica Scienza osservativa o deduttiva?
ESERCITAZIONI ANTROPOLOGIA
Transcript della presentazione:

Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel Corso di Laurea in Biotecnologie Sanitarie Universita' di Padova Corso di Bioinformatica 16 ore

II LEZIONE Database di interesse per la genetica e la biologia molecolare Portali per l'accesso a database e servizi bioinformatici

DATABASE DI GENETICA E BIOLOGIA MOLECOLARE OMIMOnline Mendelian Inheritance in Man EntrezGenecurated sequence and descriptive information about genetic loci UniGeneexperimental system for automatically partitioning GenBank sequences into a non-redundant set of gene-oriented clusters GenCardsdatabase of human genes, their products and their involvement in diseases HGMDHuman Gene Mutation Database: information about disease-causing mutations in genes

DATABASE DI GENETICA E BIOLOGIA MOLECOLARE OMIM EntrezGene UniGene GenCards HGMD

OMIM Online Mendelian Inheritance in Man Catalogo di geni umani e malattie genetiche (Dr. Victor A. McKusick, Johns Hopkins + NCBI) Contiene informazione testuale, riferimenti bibliografici e links a MEDLINE, sequenze e ad altre risorse OMIM gene map Posizioni di mappa citogenetica di geni-malattia e altri geni descritti in OMIM OMIM morbid map Posizioni di mappa citogenetica di geni-malattia indicizzati in OMIM

Use OMIM to explore Rett syndrome

There are entries for both the disease and the gene

Link to NCBI map viewer OMIM number

Numbering and Symbols ID e un numero di 6 cifre. * ( ) Autosomal dominant (before 1994) * ( ) Autosomal recessive (before 1994) * ( ) X-linked loci or phenotypes * ( ) Y-linked loci or phenotypes * ( ) Mitochondrial loci or phenotypes ( ) Autosomal loci or phenotypes Asterisco (*) significa che il fenotipo legato al gene e diverso da quelli rappresentati da altre entries con lasterisco e che si conosce il tipo di ereditabilita. Se manca lasterisco non sono chiari la separazione da altri loci o il modo in cui si eredita il fenotipo. (#) il fenotipo puo essere causato da 2 o piu geni (eterogeneita genetica). OMIM

Varianti alleliche stesso ID piu un altro numero di 4 cifre. Sono MUTAZIONI CHE CAUSANO MALATTIE OMIM

ENTREZ GENE Interfaccia unificata per cercare informazioni su sequenze e loci genetici. Presenta informazioni sulla nomenclatura ufficiale, accession numbers, fenotipi, MIM numbers, UniGene clusters, omologia, posizioni di mappa e link a numerosi altri siti web.

ENTREZ GENE

Gene Table

GeneCards Weizmann Institute of Science, Israele GeneCards is a database of human genes, their products and their involvement in diseases. It offers concise information about the functions of all human genes that have an approved symbol, as well as selected others. The information presented here has been automatically extracted from various resources. GeneCards is particulary useful for people who wish to find information about genes of interest in the context of functional genomics and proteomics.

GeneCards INFORMAZIONI SU Aliases and Additional Descriptions Chromosomal Location Proteins Protein Domains/Families/Ontologies Transcripts/Sequences Expression in Human Tissues Similar Genes in Other Organisms Related Human Genes - Paralogs SNPs/Variants Disorders & Mutations Medical News Research Articles Links to the entry of the gene in Other Genome Wide Resources, in general or specialized databases

GeneCards is an integrated database of human genes that includes automatically-mined genomic, proteomic and transcriptomic information, as well as orthologies, disease relationships, SNPs, gene expression, gene function and more. GeneNote is a database of human genes and their expression profiles in healthy tissues (Weizmann Institute of Science DNA array experiments, Affymetrix HG-U95 ) GeneAnnot provides a revised and improved annotation of Affymetrix probe-sets from HG-U95, HG-U133 and HG-U133 Plus2.0. GeneLoc presents an integrated map for each human chromosome, based on data integrated by the GeneLoc algorithm. GeneLoc includes further links to GeneCards, NCBI's Human Genome Sequencing, UniGene, Genome Database, and mapping resources. GeneTide is an automated system for human transcripts (mRNA & ESTs) annotation and elucidation of de-novo genes.

UniGene è un altro "gene indexing" database, mantenuto all'NCBI UniGene si propone di rappresentare l'insieme dei geni umani espressi attraverso il raggruppamento in un unico "cluster" di tutte le EST e le sequenze annotate di DNA genomico, mRNA, derivanti dai database GenBank e dbEST, simili tra loro e ipoteticamente afferenti alla medesima unità trascrizionale. Il sistema di "clusterizzazione" si basa sulla similarità di sequenza e non sull'allineamento e le sequenze di scarsa qualità non vengono prese in considerazione. Le sequenze vengono comparate ognuna con tutte le altre in occasione di ciascuna delle frequenti versioni di UniGene e quelle che mostrano una similarità statisticamente significativa vengono inserite in un unico gruppo. UniGene

Non viene costruita alcuna sequenza di consenso tra quelle di un "cluster", poiché a una singola unità trascrizionale possono corrispondere diversi contigui di sequenze espresse, a causa di fenomeni molto comuni quali o lo splicing alternativo o l'uso di diversi promotori per diverse isoforme. Il processo di "clusterizzazione" si svolge in diversi passaggi, con stringenza decrescente. Prima vengono filtrate le sequenze contaminanti, ripetute o a bassa complessità e quelle ribosomiali e mitocondriali, in modo che ogni restante sequenza, di lunghezza superiore a 100 bp sia candidata per far parte di un "UniGene cluster". Poi vengono comparate tra loro e raggruppate le sequenze di geni e messaggeri; a questi "cluster" vengono aggiunte le EST correlate per similarità di sequenza o per informazioni sul clone di derivazione. UniGene

I "cluster" che non contengono il segnale di poliadenilazione vengono scartati, mantenendo solo i "cluster" "ancorati", ovvero quelli per cui è nota la sequenza 3', requisito fondamentale per l'identificazione di un gene. Gli ultimi stadi del processo provvedono all'assegnazione delle EST "orfane" e dei "cluster" di dimensione 1 a uno dei "cluster" "ancorati", con minore stringenza. Infine a ogni "cluster" viene assegnato il numero di identificazione, cercando di assicurare la massima continuità possibile con le precedenti versioni del database. I parametri usati da UniGene per il processo di raggruppamento delle sequenze in "UniGene entry" sono caratterizzati da un grado di stringenza piuttosto basso percio ci si aspetta che esista in UniGene un singolo gruppo di trascritti a rappresentare ogni gene umano, ovvero che, di converso, le sequenze di trascritti diversi, ottenuti per splicing alternativo da un medesimo gene, siano raggruppate insieme in un'unica "entry". UniGene

HGMD Human Gene Mutation Database (HGMD) raccoglie le mutazioni conosciute (pubblicate) in geni umani, responsabili di malattie genetiche Creato per studiare il meccanismo delle mutazioni nel genoma umano, per riconoscere le regioni e i loci ipermutabili Ora e importante anche come raccolta di dati. Utile per diagnosi molecolare di patologie e consulenza genetica. Non include mutazioni somatiche o mitocondriali, mutazioni silenti. Dal marzo 1999, HGMD include disease-associated polymorphisms. Basato sullanalisi di >250 riviste scientifiche.

Portali per l'accesso a database e servizi bioinformatici NCBI (SNP,SAGE, Gene Expression Omnibus, Cancer Chromosomes database, …) ExPASy Proteomics Server ( EBI (EMBL Nucleotide Database, UniProt Knowledgebase, Macromol. Structure Database, ArrayExpress, Ensembl,…, TOOLBOX) (