La facility nazionale Egrid: stato dell'arte Egrid-Team Trieste, 9 ottobre 2004
Obiettivi del progetto Egrid Investigate the potential of grid paradigm for economical research Provide a National Italian Facility for economical research
Egrid national facility Implementata e rilasciata prima release Scelte di fondo: – Utilizzo della tecnologia corrente (non inventare nulla che non serve) – Grid provider: Grid.it – Sviluppo e messa a punto di strumenti mancanti (possibilmente in forma collaborativa) – Attenzione ai dati (user requirements)
Egrid 1.0: struttura Middleware EDG Inserita nella infrastruttura Grid.it : definita una VO specifica Architettura a stella nella gestione dei dati – nodo di SE centrale in grid.it Grande ( 2.6TB) Sicuro (backup) sempre on line – Nodo di SE locale alle Unita' di ricerca Piccolo / minimizza – Basato su replica manager
Struttura grafica di EGRID PA FI Roma AN TS WNWN WNWN WNWN WNWN CE SuperNodo: CE+SE+WN PADOVA Main Storage
Limiti architetturali incontrati Problemi di gestione dati: – Replica Manager NON all'altezza – Sistema di Pool accounting non garantisce sicurezza Procedura di installazione software EDG invadente – Vincolo del O.S.: Linux 7.3 : – Una macchina dedicata per ogni servizio (anche per la UI !!) Banda passante limitata fra site diversi
Rapporto con Grid.it; acquisizione di un servizio Nodo centrale di Padova 2.6 Terabyte di disco 4 CPUs (P4 2.8Ghz) dedicate ~200 CPUs in competizione con altre Vos Di partnership e sviluppo congiunto: – Identificazione dei requirements e competenze comuni – Progetti operativi – Invito a presenziare al INFN-Grid Forum di Bari
Sicurezza e privacy dei dati Richiesta da parte dei partner – I dati devono essere resi disponibili solo ai titolari dei contratti fra i diversi utenti in griglia Problemi: – Pool accounting non garantisce la riservatezza: un utente non autorizzato puo' arrivare sui dati di qualcun altro ( altamente probabile sugli SE) – Replica manager di EDG NON prevede alcun protocollo sicuro nella gestione delle repliche
Soluzione in Egrid: replica manager Gestione sicura nello storage principale – a cura di Egrid – Nessuna azione errata/maliziosa possibile Gestione sicura nello storage locale – delegata all'utente nei confronti degli utenti locali – Assicurata dalla struttura per quel che riguarda gli altri utenti della griglia. Analogia – Il sys adm garantisce che la tua area di lavoro non sia accessibile da persone esterne. – L'utente deve preoccuparsi di non dare accesso a chiunque ai propri dati personali.
Soluzione in Egrid: gridmap file Gestione di pool account solo su CE e WN – Problema di sicurezza ancora presente ma molto mitigato Gestione su SE con account personali: – server ldap mantenuto da Egrid team – Scripts e meccanismi automatici per la gestione di nuovi utenti
Soluzione EGRID nei confronti di procedure EDG di installazione Indipendenza della UI dalla distribuzione linux sottostante (mandrake/debian/fedora etc...) – – ~ 500MB Indipendenza dalla macchina/spazio disco – LIVE CD UI – Basata su Knoppix –
Contributo di EDG in linee di codice In UI: – comandi egrid-* 1500 java/4000 scripting – creazione di live CD: 2000 linee In SE: – Gestione accounting ed albero di directories: 2500 Configurazione SN: ~ 2000 linee
Soluzione EGRID nei confronti di procedure EDG di installazione Creazione del supernodo: – CE – SE – WN – UI Indipendenza dalla macchina/spazio disco – LIVE CD per il SN – Basata su Knoppix – ( accesso riservato) SN
Sviluppi futuri a breve Realizzazione di un sistema di caching GRID – Soluzione ai problemi evidenziati Sviluppo di uno Storage Management Sistem su file system paralleli (in collaborazione con INFN) – Soluzione per run paralleli – Soluzione per problemi di performance relative ad I/O Partnership con altri progetti grid
Sistema di caching GRID Evitare il download ripetuto dello stesso file (caching classico) Che sia coerente con i sistemi in uso di controllo dell'accesso ai dati Minimizzare le latenze di trasferimento files superare le limitazioni della topologia a stella.
Come: Utilizzo della crittografia a chiave simmetrica Storage della chiave in un sistema di metadati Controllo dell'accesso al livello dei metadati: – Solo chi ha accesso ai metadati accede alla chiave.
Rapporto con Grid.it: partnership Identificazione dei requirements Identificazioni competenze comuni e/o complementari Progetti operativi ( in partenza) – Esempio: Storage Resource Manager Invito a presenziare ad INFN-Grid Forum di Bari
Rapporti con EGEE Egrid puo' rappresentare una applicazione pilot all'interno del WP ? Intervento di R. Barbera (EGEE Generic Applications Coordinator) alla round table