Romano, Portale Web 1 WP 5 – Attività 1 Il portale Web Paolo Romano Istituto Nazionale per la Ricerca sul Cancro
Romano, Portale Web 2 Sommario Motivazioni e obiettivi del portale Panoramica dei contenuti Qualche parola in più su: SRS questionari databases
Romano, Portale Web 3 Motivazioni strumenti bioinformatici distribuiti su siti diversi: difficoltà nella ricerca e nella scelta degli strumenti, interfacce, metodi di ricerca, strutture dati eterogenei: difficoltà nell’utilizzo degli strumenti disponibili post-genomica in continua evoluzione: strumenti bioinformatici poco numerosi e interfacce primitive, elevata partecipazione nel progetto: difficoltà di coordinamento e messa in comune dei dati sinergie e ottimizzazione risorse
Romano, Portale Web 4 Obiettivi Realizzare un portale che: ospiti servizi e strumenti di tipo bioinformatico, utili ai ricercatori coinvolti nel progetto e non, dia visibilità al progetto e ai partner (parte accessibile a tutti) serva come strumento di lavoro e coordinamento per le unità di ricerca (parte ad accesso riservato) rimanga un riferimento alla fine del progetto
Romano, Portale Web 5 Organizzazione non solo portale, contenuti propri gestione comune siti mirror per garantire servizio e prestazioni software “ingombranti” non replicati
Romano, Portale Web 6 Risultati attesi Disponibilità di strumenti di tipo generale (banche dati, sistemi di ricerca, programmi per analisi delle sequenze, strumenti bioinformatici di uso comune) SRS per interrogazione di banche dati di pubblico dominio (GenBank, LocusLink, OMIM, SwissProt, ecc.) e strumenti di analisi di pubblico dominio (BLAST, FASTA, ecc.) Disponibilità di strumenti di analisi e banche dati di specifico interesse ai fini del progetto HRBC Nuovi strumenti specificamente sviluppati da questa unità
Romano, Portale Web 7 Riferimenti Lingua: inglese (e italiano nella parte riservata) Nome: Hormone Responsive Breast Cancer (HRBC) Genomics Network Dominio: hrbc-genomics.net (e hrbc-genomics.org e hrbc-genomics.info) Indirizzo: Logo: da definire
Romano, Portale Web 8 Logo attuale
Romano, Portale Web 9 Contenuti (area pubblica) Presentazione del progetto sintesi del progetto di ricerca responsabili unità operative e altri contatti elenco articoli/documenti vari prodotti nell’ambito del progetto
Romano, Portale Web 10 Contenuti (area pubblica) sito SRS (con accesso a software d’analisi, se collegato a SRS) –elenco database da definire –possibile inserimento di nuovi database –elenco software a definire –limitazione d’accesso (per progetto, per utente) –riferimento iniziale ISA/CNR
Romano, Portale Web 11 Contenuti (area pubblica) link a siti unità operative e partner link a siti di interesse scientifico affine al progetto link a corsi di formazione on-line (free) selezionati tra quelli esistenti per la loro attinenza al progetto e agli strumenti del progetto elenchi da definire
Romano, Portale Web 12 Contenuti (area pubblica) Materiale didattico corsi organizzati dal progetto –Sull’accesso e utilizzo degli strumenti –Sulle tecnologie (microarray) Materiale didattico corsi organizzati dai partner –Biology for dummies –Perl Mirror di corsi creati da altri ricercatori –BioComputing Division VSNS
Romano, Portale Web 13 Contenuti (area pubblica) analisi dei risultati dei questionari –Quali tools installare e perché –Quali tools sviluppare e perché dati estratti dinamicamente da db
Romano, Portale Web 14 Contenuti (area riservata) progetto di ricerca dettagliato, elenco dettagliato partner, documenti prodotti nell’ambito del progetto: –presentazioni a meetings (questo!) –relazioni annuali
Romano, Portale Web 15 Contenuti (area riservata) archivio mailing list di progetto –coordinamento –annunci interni –annunci pubblici (?) –unità operative
Romano, Portale Web 16 Contenuti (area riservata) Database dati sperimentali del progetto –Database microarray –Database overall del progetto Interfacce per accesso a software di analisi dei dati di espressione genica e proteomica –Sviluppati nel progetto –Sottoposti a licenza –Computazionalmente onerosi
Romano, Portale Web 17 Contenuti (area riservata) Questionari Esempi: –Quali software esistenti si desiderano sul sito –Quali analisi sarebbe utile implementare Implementazione: –Compilazione tramite form –Inserimento dati in db –Estrazione dati riassuntivi
Romano, Portale Web 18 Contenuti (area riservata) Sviluppo cooperativo di documenti Esempi: –Preparazione materiale corsi –Redazione relazioni/articoli Strumenti –Wiki?
Romano, Portale Web 19 SRS - Sequence Retrieval Software SRS è un esempio di integrazione locale di banche dati eterogenee in maniera semplice ed efficiente L’approccio originale di SRS consiste in oBanche dati disponibili localmente come “flat file” oDefinizione di sintassi specifiche per l’estrazione dei dati oUtilizzo di link interni espliciti e impliciti tra banche dati oL’integrazione trasparente con applicazioni oL’integrazione esterna tramite link HTML
Romano, Portale Web 20 SRS – I links I collegamenti (links) tra banche dati possono essere definiti in maniera oEsplicita, quando un termine è appositamente inserito in un field come riferimento a una entry di un’altra banca dati oImplicita, cercando termini comuni all’interno di fields predefiniti di banche dati diverse
Romano, Portale Web 21 SRS – I links espliciti Esplicito riferimento a un’altra banca dati Other_collection_numbers CCUG 34964; NCIB Literature DSM ref.no. 72; DSM ref.no EMBL: X52289
Romano, Portale Web 22 SRS – I links impliciti Termini comuni in banche dati diverse TargetGene: APOE Constructed_from pMB1, pSC101 and Tn3 Name Gluconacetobacter xylinus subsp. xylinus, (Brown 1886) Yamada, Hoshino and Ishikawa 1998 VL Literature Nucleic Acids Res 1990;18:4967 [PMID: ]
Romano, Portale Web 23 SRS – Possibili estensioni SRS è facilmente estendibile oNuove banche dati possono essere aggiunte dando una descrizione della loro sintassi nel linguaggio Icarus o fornendo il DTD oÈ possibile stabilire nuovi collegamenti tra banche dati inserendo xrefs o lasciando che siano identificati da SRS, specificando i fields oMolte banche dati sono distribuite in formato “flat file” e con relative sintassi Icarus (qualche DTD)
Romano, Portale Web 24 SRS: operatori link SRS consente di utilizzare i link esistenti per le ricerche tramite un apposito operatore: < oswissprot < EMBL oEMBL < swissprot oswissprot < [EMBL-id: X52289] o[EMBL-organism:human] < [medline-pmid: ]
Romano, Portale Web 25 Gestione di un sito SRS Aggiornamento del software oNuove releases (3-4 / anno) oModifiche software / nuove funzioni Aggiornamento banche dati oNuove releases (3-4 / anno) oModifica contenuto / struttura file Controllo processi oDirectory temporanee oProblemi memoria/disco oAnalisi degli accessi
Romano, Portale Web 26 Nuove banche dati Definizione delle informazioni e analisi delle sorgenti Analisi dei link con banche dati esistenti Definizione di una struttura dati e di un formato “flat file” o DTD Creazione di un’analizzatore di sintassi Indicizzazione
Romano, Portale Web 27 Con la collaborazione di….. Idee raccolte e discusse con: Assunta Manniello, Istituto Nazionale per la Ricerca sul Cancro, Genova Elda Rossi e Francesco Falciano, CINECA, Bologna Angelo Facchiano, ISA/CNR, Avellino
Romano, Portale Web 28 Stato del sito prototipo (user: hrbc, password: testpwd) Contenuti: Struttura definita, pagine riservate protette Link a vari strumenti su siti dei partner (ISA/CNR, CINECA) Corso Biocomputing Division (BCD) della Virtual School of Natural Sciences (VSNS)