FESR www.trigrid.it Trinacria Grid Virtual Laboratory University of Coimbra AMGA - Official Metadata Service for EGEE Salvatore Scifo INFN Catania Catania,

Slides:



Advertisements
Presentazioni simili
Sistemi Informativi sul Web
Advertisements

FESR Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID Second TriGrid Checkpoint Meeting Catania,
FESR Trinacria Grid Virtual Laboratory University of Coimbra AMGA - Official Metadata Service for EGEE Salvatore Scifo INFN Catania Primo.
Layered Grid Architecture. Application Fabric “Controlling elements locally”: Access to, & control of, resources Connectivity “Talking to Grid elements”:
FESR Trinacria Grid Virtual Laboratory The AMGA metadata catalog Riccardo Bruno – INFN Sez.CT Catania, Tutorial TriGrid su gLite 3.0,
FESR Trinacria Grid Virtual Laboratory La sicurezza dei dati in ambiente Trigrid Giordano Scuderi.
FESR Trinacria Grid Virtual Laboratory AMGA Web Interface Salvatore Scifo TRIGRID Second TriGrid Checkpoint Meeting Catania,
FESR Catania, Trigrid Open Day, Trinacria Grid Virtual Laboratory PROGETTO “ISOSPIN” Supporters : AnnaMaria Muoio, Marcello IaconoManno.
1 Gruppo di lavoro Siti web Cristina Paulon CIS Maldura - Master in giornalismo Padova, 19 luglio 2007 C. Paulon - CIS Maldura - Master in giornalismodreams.
INFN-AAI per il Servizio Sistema Informativo Dael Maselli Frascati, 10/07/2012 Riunione plenaria del Servizio Sistema Informativo.
Università degli Studi di Perugia, LS in Informatica Seminario per il corso di Sicurezza Informatica (Prof. S. Bistarelli) Valentina Franzoni I nuovi paradigmi.
Giuditta Cantoni, 4 E S.I.A I DATABASE. Definizione databese In informatica, il termine database, banca dati o base di dati (a volte abbreviato con il.
POLITECNICO DI MILANO FACOLTA’ DI INGEGNERIA SEDE DI CREMONA TESI DI DIPLOMA IN INGEGNERIA INFORMATICA RELATOREAUTORI Prof. Vittorio TrecordiDemicheli.
Presentazione della piattaforma e - learning MOODLE a cura di Davide Afretti Bologna, 24 aprile 2013.
VO-Neural Project e GRID Giovanni d’Angelo Dipartimento di Scienze Fisiche Università degli Studi di Napoli Federico II Martina Franca 12 – 23 Novembre.
Corso per Webmaster base
L’ ORGANIZZAZIONE DEI DATI IN AZIENDA
Università degli Studi di Modena e Reggio Emilia
Status Report Gruppo Storage CCR CCR 14-15/03/2006.
Conformità agli standard ufficiali
Integrazione tier3 in Grid Paolo Veronesi, Luciano Gaido
Crea il tuo sistema aziendale sul web a partire dei fogli Excel che usi. ShareXLS
Summary di (quasi) tutti gli utenti non presentati…
Università degli studi di Roma Tor Vergata
App-to-Cloud Security
Riunione INFN – Bologna, 17 January 2013
PROGETTO AGRICOLTURA L’architettura tecnologica Bologna : 11/04/02.
Monitoring e loadbalancing dei servizi Grid
Rielaborato da Atzeni et al., Basi di dati, Mc-Graw Hill
Corso di Ingegneria del Web e Applicazioni A A Prof
Sistemi e Applicazioni per l’Amministrazione Digitale
Breve report su corso RedHat Enterprise Virtualization (RH318)
ORACLE Corso Base Copyright © Maggio 2008 Assi Loris Versione : 1
how to use Windows SharePoint Services
Cloud per HA nei Servizi
Virtual Organizations e Security
Sezione di Napoli GRID-PACS Commissione Calcolo Richieste 2008 Napoli.
Metriche SE monitoring G.Donvito G.Cuscela INFN Bari
Analisi dei dati dell’Esperimento ALICE
Valeria Ardizzone INFN Catania Martina Franca (TA),
Condivisione Documentazione Tecnica
Introduzione alle griglie computazionali
Giordano Scuderi Unico SRL Catania
Giordano Scuderi Unico SRL - Messina,
Job Application Monitoring (JAM)
Sviluppo di server web e sistema di caching per contenuti dinamici
INFN-AAI Autenticazione e Autorizzazione
Risultati del questionario sui servizi middleware aggiuntivi
analizzatore di protocollo
Sviluppo di un'applicazione web per l'utilizzo del framework SparkER
Antonio Mosca Public Sector Practice Manager
Corso di Ingegneria del Web A A Domenico Rosaci 1
Organizzazione di una rete Windows 2000
Windows Admin Center La rivoluzione della gestione di Windows Server
Marcello Iacono-Manno Catania, 6 maggio 2010
Introduzione alle basi di dati
Introduzione alla materia sistemi
Procedura di gestione appuntamenti tramite web.
Attività svolte nel progetto CRESCO dal Centro di Ricerca CRIAI
ADO Per gestire i database con tecnologia ASP si utilizzano strumenti ADO (ActiveX Data Objects): un'architettura che fornisce oggetti.
INFN-AAI Autenticazione e Autorizzazione
389 Directory Server Dael Maselli.
LMS e VLE Stefano Garione.
SAGE – Un sistema per l’accounting dello storage in gLite
Corso di Ingegneria del Web e Applicazioni A A Prof
Evolution of Information Modeling and Discovery of Grid Resources
ATLAS PRIN Roma1 - status Alessandro De Salvo
Introduzione ai DBMS I Sistemi di Gestione di Basi di Dati sono strumenti software evoluti per la gestione di grandi masse di dati residenti su memoria.
Competenze Informatiche Avanzate
CLOUD.
Transcript della presentazione:

FESR Trinacria Grid Virtual Laboratory University of Coimbra AMGA - Official Metadata Service for EGEE Salvatore Scifo INFN Catania Catania, 23 Ottobre 2006

Catania, Contenuti Background e Motivazioni Concetti di base sui metadati Requisiti e Architettura Replicazione dei Metadati

Catania, AMGA e Metadati Generalmente Grid contiene una mole non indifferente di file distribuiti su diversi siti Utenti e applicazioni necessitano di un meccanismo efficiente per: –trovare agevolmente i file di interesse sulla Grid –ricercare file per mezzo di indicazioni sui loro contenuti Ricerca intelligente : –associando attributi descrittivi (metadata) ai file –pubblicando queste informazioni in appositi cataloghi, accessibili e interrogabili da utenti e/o applicazioni client

Catania, AMGA e Database Virtualization Non solo Metadati –Molte applicazioni Grid utilizzano dati strutturati –Generalmente schemi molto semplici possono essere modellati come metadati Vantaggi –Integrazione immediata con l’infrastruttura Grid  Metadata Service è un Grid Component –Grid security –Hide DB heterogeneity

Catania, Requisiti del Metadata Service Un servizio di metadati: –deve esporre una interfaccia completa ma semplice, tale da essere facilmente usabile da ogni utente –Deve essere flessibile e fornire schemi dinamici al fine di supportare un gran numero di domini applicativi (differenti esigenze)  Uno Schema è un set di metadati raggruppati attorno al significato logico di una data entità (es. Dublin Core) –Il servizio deve permettere la definizione di metadati strutturati e gerarchici che permettono la definizione di collezioni  Collezione: un insieme di entry + valori degli attributi associati  (per esempio: una collezione potrebbe descrivere tutti i file video in un qualunque formato di codifica, title, singer, duration, format, owner, …)

Catania, Requisiti del Metadata Service Deve essere progettato con un’attenzione particolare alla scalabilità, per permettere l’interazione con un largo numero di entry (diversi milioni) Per quanto concerne la sicurezza è richiesto un meccanismo di accesso a livelli differenti per utenti differenti Ridurre i tempi di latenza della rete migliorando le performance per client WAN Essere trasparente ai differenti Back End (l’ambiente GRID è eterogeneo per definizione)

Catania, Un pò di storia AMGA nasce dalla valutazione dei Metadata Services esistenti per gli esperimenti HEP (High Energy Physics): –AMI (ATLAS), RefDB (CMS), Alien Metadata Catalogue (ALICE) –Analoghi concetti e analoghi obiettivi –Progettazione dipendente dal dominio dell’applicazione (scarsamente riusabile) –Molte limitazioni tecniche: prestazioni, scalabilità, velocità, flessibilità AMGA – ARDA Metadata Grid Application –ARDA ha adottato AMGA come EGEE Metadata Interface ufficiale –Prima release integrata in gLite 1.5 –Il servizio è disponibile anche come componente “standalone”  Basato sui requisiti dell’esperimento LHC  General purpose – aperto a qualunque dominio applicativo  Progettato in collaborazione con il gLite/EGEE team  Incorpora i feedback del gruppo GridPP (Grid Particle Physicists)

Catania, AMGA – Funzionalità Schemi dinamici –Schemi modificabili a runtime dall’utente  Create schemas  Delete schemas  Add attributes  Drop attributes Metadati strutturati e gerarchici –Gli schemi possono contenere sotto-schemi –Analogia con il file system:  Schema  Directory  Entry  File Query flessibili –SQL-like query language –Join tra schemi e collezioni differenti ammessi

Catania, AMGA – Concetti Base Pensiamo a: –schema  table –collection  instance table –attribute  column –entry  row Schema - set di attributi associabili ad una directory/file Entry - astrazione di una directory/file registrata sul catalogo Collection - un set di entry (istanze di directory/file) con i valori degli attributi definiti dallo schema Attributo – è una coppia con tipo –Nome – il nome dell’attributo –Valore – il valore dell’attributo –Tipe – il tipo del valore (int, float, varchar,…)

Catania, AMGA - Sicurezza Access control –ACL per collection (condivise tra le entries) –ACL per entry –È possibile filtrare l’accesso ai gruppi di utenti in uno Unix style Access Control Group Based Client Authentication –Username/password –General X509 certificates –VOMS Grid-proxy certificates Secure connections – SSL –SSL implementato nei webservice

Catania, AMGA - Implementazione C++ multiprocess server –Backends  Oracle, MySQL, PostgreSQL, SQLite –Front Ends  TCP Streaming High performance Client API for C++, Java, Python, Perl, Ruby  SOAP (web services) Interoperability Scalability Standalone Python Library implementation –Data stored on file system

Catania, AMGA – come accedere TCP Streaming Front-end –mdcli & mdclient and C++ API (md_cli.h, MD_Client.h) –Java Client API and command line mdjavaclient.sh & mdjavacli.sh (also under Windows !!) –Python Client API –AMGA Web Interface ---NEW  Developed totally by the GILDA team – INFN CT  Based on JAVA AMGA Standard APIs  Web Application using standard as JSP Custom Tags, Servlet SOAP Frontend (WSDL) –C++ gSOAP –AXIS (Java) –ZSI (Python)

Catania, AMGA - Metadata Replication AMGA fornisce un meccanismo efficiente per la replica del servizio –Scalabilità – ottime prestazioni da 100 a 1000 utenti –Distribuzione Geografica nasconde la latenza di rete –Affidabilità – la caduta di un singolo nodo non costituisce “breakdown” –Utilizzo off-line – access off-line (laptops) Architettura –Replica asincrona  Scrittura su un database qualunque e aggiornamento asincrono sulle altre repliche –Modello Master-Slave  Scritture permesse solo sul master, il master aggiorna tutti gli slave –Replica a livello Applicativo  L’applicazione si occupa di garantire la coerenza tra le repliche –Replica Parziale  La replica avviene solo su sotto-alberi della gerarchia dei metadati.

Catania, AMGA - Metadata Replication Patterns Full replication Partial replication FederationProxy

Catania, AMGA - progetti LHCb-bookkeeping –Migrated bookkeeping metadata to ARDA prototype  20M entries, 15 GB  Large amount of static metadata –Feedback valuable in improving interface and fixing bugs –AMGA showing good scalability Ganga –Job management system  Developed jointly by Atlas and LHCb –Uses AMGA for storing information about job status  Small amount of highly dynamic metadata

Catania, AMGA - Biomed Medical Data Manager – MDM –Conservare immagini mediche su GRID e recuperarle tramite i metadati associati –Sviluppato su gLite 1.5 data management system –Dimostrato alla conferenza di EGEE Pisa, Ottobre 2005 Requisiti di sicurezza molto restrittivi –I dati dei pazienti sono dati sensibili (privacy) –I dati devono essere criptati sullo storage –L’accesso ai metadati deve essere ristretto solo agli utenti autorizati AMGA adottato come metadata server –Dimostrata funzionalità di autenticazione –Dimostrato la crittografia dei contenuti –Utilizzato come virtualizzazione del Database Riferimenti – – dev/metadata

Catania, AMGA - gLibrary Studio della implementazione di un Multimedia Management System su Grid –Esempi di Contenuti Multimediali gestibili con gLibrary:  Images  Movies  Audio Files  Office Documents (Powerpoint, Word, Excel, OpenOffice)  s, PDFs, HTMLs  Customized versions of well-know document type (ex. EGEE PPTs)  …. –Tenere traccia e organizzare in modalità uniforme tutti i dettagli addizionali (metadata schema) dei files conservati negli Storage Elements e registrati sui File Catalogues –Fornite agli utenti un modo agevole per localizzare e recuperare i files in base ai loro contenuti (metadata schema instance)

Catania, AMGA – Grid Movie On Demand gMOD: –Applicazione che gestice la catalogazione, la ricerca e la visualizzazione di movies conservati nello Storage di Grid. Funzionalità –Utente può navigare la lista dei video e sceglierne uno per visualizzarlo in real time streaming sul video player della workstation. –Per ciascun video sono mantenute diverse informazioni di dettaglio Metadati (Title, Runtime, Country, Release Date, Genre, Director, Case, Plot Outline) e gli utenti possono eseguire ricerche accurate interrogando tali dati. –Due tipologie di utenti possono interagire con gMOD:  TrailersManagers : gestisce il db dei movies (uploading new ones and attaching metadata to them);  GILDA VO users (guest) : esegue il browsing del catalogo, cerca attraverso i metadati e sceglie il movie da scaricare.

Catania, AMGA – Digital Archive Applicazione che gestice la catalogazione, la ricerca e la visualizzazione di documenti digitali conservati nello Storage di Grid.

Catania, Conclusioni AMGA è il servizio di metadati per Grid –permette a utenti e applicazioni di definire e valorizzare metadati descrittivi per file e identificare tali file in base ai valori dei metadati AMGA è basato RDBMS –Multidomain metadata: permette di definire schemi di attributi che soddisfino le necessità dell’utente (metadata customization) –Fornisce un meccanismo per la replica del servizio il quale assicura una disponibilità locale del database e assicura l’aggiornamento delle istanze replicate –Database virtualization: un servizio di accesso a database per applicazioni Grid AMGA integrazione perfetta in un ambiente Grid –Il Metadata Service è un componente Grid –Il servizio è compatibile con la Grid Security Infrastructure –AMGA nasconde la eterogeneità dei Database server usati come back end

Catania, Questions…