Informatica e Bioinformatica – A. A. 2013-2014 1 Un altro grande database è UniProt, The Universal Protein Resource (http://www.uniprot.org/) nel quale.

Slides:



Advertisements
Presentazioni simili
Misure con biomarcatori VI. Markers di funzionalità cellulare Prof. Giorgio Sartor Corso di Laurea Specialistica in Scienze per lAmbiente e il Territorio.
Advertisements

Geni costitutivi e non costitutivi
WEB OF SCIENCE ISI Web of Knowledge
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Progetto e sviluppo di.
Università degli Studi di Modena e Reggio Emilia
Dr. Giuseppe Pigola – Bioinformatica Dr. Giuseppe Pigola –
Corso di Laurea Specialistica in Informatica Bioinformatica A. A
Bioinformatica Prof. Mauro Fasano
BASI DI DATI BIOLOGICHE - 3
TRASCRIZIONE del DNA.
Internet Explorer Il browser.
Bioinformatica Corso di Laurea Specialistica in Biologia Cellulare e Molecolare Ricerca pattern e di motivi funzionali 8/5/2008 Stefano Forte.
Introduzione alla bioinformatica
Metodi basati sulle similitudini per dedurre la funzione di un gene
Micro RNA (miRNA) Piccole molecole di RNA (20-22 nt)
RISORSE WEB Internet Per un uso consapevole delle risorse della Rete
DBMS ( Database Management System)
ESERCITAZIONE PROSITE & INTERPRO. Prosite Elenco dei motivi in PROSITE.
Entrez + MedLine => PubMed
Allineamento Metodo bioinformatico che date due o più sequenze ne mette in evidenza similarità/diversità, supponendo che le sequenze analizzate abbiano.
Analisi della struttura primaria delle proteine
Modulo 1 - Hardware u.d. 3 (syllabus – 1.3.5)
Software per la Bioinformatica
Informatica e Bioinformatica – A. A
SCAN PROSITE ExPASy proteomic tool.
Università degli Studi di Genova Laurea Specialistica in Biotecnologie Medico-Farmaceutiche Corso di: Biotecnologie Diagnostiche A.A. 2004/2005 Utilizzo.
Fondamenti delle Reti di Computer Seconda parte Carasco 15/04/2010.
Gianpaolo Cecere Introduzione
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia
In questa lezione ci occuperemo
Ricerca di similarità di sequenza (FASTA e BLAST)
Alcuni esempi di domande di esame
BIOINFO3 - Lezione 101 GLI IPERTESTI Una delle innovazioni introdotte da HTML e dal WWW in generale, rispetto ad un testo normale è sicuramente la possibilità
Tutorial per l’utilizzo di k ScanProsite
Report federica scarrione 18/05/09. Definizione I rapporti o report sono lo strumento informatico per la presentazione di un insieme di dati memorizzati.
A.A CORSO INTEGRATO DI INFORMATICA E BIOINFORMATICA per il CLT in BIOLOGIA MOLECOLARE Scuola di Scienze, Università di Padova Docenti: Dr.
La “Gene Ontology” Ontologia: studio dell’essere in quanto tale, e delle sue categorie fondamentali Le categorie sono le “classi supreme di ogni predicato.
Dip. Scienze Biomolecolari e Biotecnologie
Sequenze e Banche Dati Biologiche
Percorso didattico per l’apprendimento di Microsoft Access Modulo 2
DNA – REPLICAZIONE (1) Semiconservativa: Catene genitrici
Annotare i geni Gene xxxx Gene zzzz 3 esoni 7 esoni proteina y
Esempio di utilizzo del programma BLAST disponibile all’NCBI
Cloud Tecno V. Percorso didattico per l’apprendimento di Microsoft Access 1.
Corso di laurea specialistica magistrale Biotecnologia aula 6a ore corso di genomica a.a. 2009/10 lezione martedì 15 Dicembre 2009 lezione.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle.
Pseudogeni = geni non funzionali
Docente: Dr. Stefania Bortoluzzi Dipartimento di Biologia Universita' di Padova viale G. Colombo 3, 35131, Padova Tel
IV LEZIONE Uso di Genome Browser per l'annotazione di sequenze genomiche. Allineamento di sequenze trascritte con sequenze genomiche: BLAT.
GenBank  Database di sequenze all’NIH  14,397,000,000 basi in 13,602,000 sequenze (Octobre 2001)  Crescita esponenziale  International Nucleotide Sequence.
Computational analysis of data by statistical methods
La parola “Bioinformatica”
Allineamento di sequenze
Cloud Tecno V. Percorso didattico per l’apprendimento di Microsoft Access 4 - Le maschere.
Una volta stabilito che un insieme di proteine sono tra di loro omologhe posso procedere ad un allineamento multiplo. Il programma più usato a questo scopo.
Allineamento di sequenze Perché è importante? Le caratteristiche funzionali delle molecole biologiche dipendono dalle conformazione tridimensionale che.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle Prof.
I cambiamenti della sequenza del DNA: Evoluzione
INTRODUZIONE AL DATABASE CORSO BLOG & WEBSITE: COME CREARLI?
Sistema di ricerca Entrez Insieme di banche dati contenenti svariati tipi di informazioni biomediche, interrogabile mediante un’unica interfaccia Concetto.
Annotazione strutturale dei genomi
FILE DEI DATABASE FASTA GBFF XML ASN. Formato FASTA Il formato fasta è forse il più utilizzato dai comuni software di ricerca. Esso consiste in un file.
Geni “cliccabili”. SRS : Ensembl : NCBI : Sanger centre :
1 FIRB 2003 LIBI: Laboratorio Internazionale di Bioinformatica Unità di Ricerca: UNIMI 6 Gruppi di Ricerca: G. Pesole C. Gissi G. Pavesi D. Horner F. Mignone.
Progetto WELL-FIR Manuale Utente del Web GIS Versione 0.1.
Allineamenti Multipli Problema Durante l’evoluzione i residui importanti per il mantenimento della struttura e della funzione sono conservati. Come riconoscere.
Esistono delle banche dati derivate simili a pfam, cioe’ banche dati in cui le proteine sono organizzate per famiglie ma che a differenza di pfam comprendono.
Definizione di GENETICA
Transcript della presentazione:

Informatica e Bioinformatica – A. A Un altro grande database è UniProt, The Universal Protein Resource ( nel quale sono radunate le sequenze proteiche, e le annotazione delle stesse, ottenute grazie a:  determinazione diretta della sequenza proteica  traduzione di sequenze nucleotidiche per le quali sia stata individuata o predetta la funzione di gene codificante la proteina Uniprot è un consorzio che nasce dalla collaborazione tra: European Bioinformatics Institute (EBI); SIB Swiss Institute of Bioinformatics; Protein Information Resource (PIR). Banche Dati proteiche UniProt è una risorsa onnicomprensiva che in realtà raduna diversi database, tra cui fondamentale è UniProtKB (Protein knowledgebase)

Informatica e Bioinformatica – A. A Swiss-Prot ( Il punto di forza di questo database è l’elevato livello di annotazione effettuata dai suoi curatori.

Informatica e Bioinformatica – A. A Query di sequenza in UniProt Siamo interessati a conoscere la sequenza proteica codificata dalla lactate dehydrogenase A

Informatica e Bioinformatica – A. A Anche in questo caso possiamo ottenere la sequenza proteica E molte altre informazioni sulla struttura secondaria, terziaria (via PDB), sulle varianti conosciute e sulla funzione della proteina ricercata

Informatica e Bioinformatica – A. A I database proteici secondari Contengono il risultato di analisi eseguite sulle sequenze contenute nei database primari per arricchire il dato di informazioni utili. Esempio: da Swiss-Prot sono stati ricavati i database secondari Prosite e Pfam, nei quali si pone maggior rilievo alla classificazione delle famiglie e dei domini proteici. Database of protein domains, families and functional sites as well as associated patterns and profiles to identify them Large collection of protein families, each represented by multiple sequence alignments and HMMs

Informatica e Bioinformatica – A. A Famiglie proteiche e domini  Nonostante l’elevato numero di proteine esistenti, la maggior parte di esse può venire raggruppata in un numero limitato di famiglie in base alla similarità tra le loro sequenze.  Studiando le famiglie proteiche si nota che durante l’evoluzione alcune regioni si sono meglio conservate di altre.  Analizzando le proprietà costanti e variabili di questi gruppi di sequenze simili, si può ricavare una firma per una famiglia proteica o dominio, che contraddistingue le proteine di un gruppo da altre proteine non correlate.  I domini permettono di assegnare una nuova proteina ad una specifica famiglia proteica e così formulare ipotesi sulla sua funzione.  Proteine o domini proteici appartenenti a una particolare famiglia solitamente condividono attributi funzionali e derivano da un comune progenitore: queste considerazioni sono fondamentali per effettuare un’analisi comparativa.

Informatica e Bioinformatica – A. A Proteine formate da più di un dominio si sono probabilmente evolute per fusione di geni che contenevano tali domini: fusione genica è fattore importante nell’evoluzione. Altro esempio: proteine (Zasp, ALP, CLP, ecc.) contenenti domini PDZ e LIM. Questi domini possono interagire e legare altre proteine Complesso della trascrizione DNA Seq. DNA promotore DNA binding domain activation domain Fattore di trascrizione Domini proteici Molte proteine, specialmente quelle di grandi dimensioni, sono formate da più parti funzionali organizzate in strutture tridimensionali distinte che vengono chiamate ‘domini proteici’. Ad esempio alcuni fattori di trascrizione hanno due domini, uno in grado legarsi con una particolare sequenza di DNA, l’altro in grado di attivare la trascrizione.

Informatica e Bioinformatica – A. A Esempi: Domini LIM associati ad altri domini (Sono riportate solo alcune strutture proteiche contenenti il LIM domain) PFAM, PROSITE, ma anche SMART ( e InterPro ( sono tutti database contenenti domini funzionali delle proteine.

Informatica e Bioinformatica – A. A

10 Tra i 16 diversi record presenti in PROSITE che contengono il termine ricercato troviamo il dominio PDZ (PS50106)

Informatica e Bioinformatica – A. A Nota: gli Hidden Markov Models sono complessi modelli statistici che dall’analisi di sequenze primarie permettono la predizione di domini proteici e strutture proteiche.

Informatica e Bioinformatica – A. A Esempio di ricerca in Pfam Ricerca dei domini presenti nella proteina ZASP: sono individuati 6 record Possono essere visualizzati le principali architetture proteiche che possiedono domini PDZ

Informatica e Bioinformatica – A. A Possono essere visualizzati anche gli allineamenti dei domini nelle differenti proteine

Informatica e Bioinformatica – A. A I browser genomici UCSC genome browser University of California Santa Cruz  L’enorme aumento dei dati riguardanti interi genomi, in particolare quelli derivanti dai progetti di sequenziamento di vertebrati, ha richiesto lo sviluppo di veri e propri browser di genomi.  Per questo motivo presso la UCSC è stato sviluppato uno dei primi genome browser in grado di fornire una rapida visualizzazione grafica di ogni regione di genoma di qualsivoglia lunghezza assieme ad una grande quantità di informazioni come: geni noti, geni predetti, ESTs (expressed sequence TAGs), mRNA, elementi regolativi, geni omologhi di altri organismi, ecc.  Successivamente i principali siti (NCBI, EBI ecc.) hanno sviluppato piattaforme sempre più complesse, in grado di integrare il maggior numero di informazioni su una certa regione in particolare del genoma umano e di numerosi altri organismi. ( Definizione di browser: interfaccia utente che permette di la navigazione tra oggetti, ad esempio Mozilla Web Browser.

Informatica e Bioinformatica – A. A

Informatica e Bioinformatica – A. A Organismo di cui si vuole visualizzare la regione genomica Gruppo di organismi di interesse group Nota: durante il sequenziamento di un genoma, spesso sono rilasciate versioni successive specialmente nella fase finale del progetto: possono essere più o meno definitive. Qui si fa riferimento a varie versioni (release) del genoma umano (l’ultima è del 2009).

Informatica e Bioinformatica – A. A Pulsanti di spostamento sul genoma Pulsanti per ingrandire o rimpicciolire l’area di interesse Posizione attuale sul genoma Permette di “saltare” sulla posizione digitata sulla finestra di sinistra chr: rappresentazione schematica e posizione

Informatica e Bioinformatica – A. A Posizione (bp) Geni con esoni, le barre spesse, e introni, le barre sottili. Traccia dei trascritti Grado di conservazione della sequenza tra organismi diversi

Informatica e Bioinformatica – A. A Moltissimi sono i campi a disposizione, essi possono essere visualizzati in modo diverso o nascosti utilizzando le opzioni presenti nella parte inferiore della pagina Ci sono varie possibilità di visualizzazione di ogni informazione sul genome browser. Provate ad esercitazione Tipologia di traccia

Informatica e Bioinformatica – A. A UCSC Genome Browser: descrizione del gene scelto ….e molte altre informazioni!!