Problemi aperti Luciano Gaido (INFN - Torino)

Slides:



Advertisements
Presentazioni simili
R. Brunetti INFN - Torino. Contenuti Cosa e’ uno CSIRT Gestione della sicurezza in EGI/IGI e IGI-CSIRT Servizi ed attivita’ previste Collaborazione con.
Advertisements

Virtualizzazione nell’INFN Andrea Chierici 11 Dicembre 2008.
Aggiornamento attività gruppo Windows Gian Piero Siroli, Dip. di Fisica, Univ. di Bologna e INFN CCR, Giugno 2009.
Implementazione di TRIP ai LNF Commissione Calcolo e Reti 31 maggio 2007 Massimo Pistoni.
Gruppo Netarch Incontro di lavoro della CCR Napoli gennaio 2010 Connessioni Tier1/Tier2 a GARR-X 1 GM, Incontro di lavoro della CCR – Napoli
IL blueprint e le esigenze per il progetti internazionali (EMI e EGI- InSPIRE) L. Gaido, INFN Torino Riunione del Comitato di Coordinamento IGI Roma, 12.
EGEE is a project funded by the European Union under contract IST L'infrastruttura di produzione attuale A. Cavalli - INFN- CNAF D. Cesini.
EGI-InSPIRE RI EGI-InSPIRE EGI-InSPIRE RI Gruppo CNAF (2010/2011) 7/10/2016 CdC 03/12/
PRIN NAPOLI Enzo Capone, Gianpaolo Carlino, Alessandra Doria, Rosario Esposito, Leonardo Merola, Silvio Pardi, Arturo Sanchez Pineda.
EGEE is a project funded by the European Union under contract IST Il Sistema di Supporto nel ROC-IT Riccardo Brunetti INFN-Torino Riunione.
POLITECNICO DI MILANO FACOLTA’ DI INGEGNERIA SEDE DI CREMONA TESI DI DIPLOMA IN INGEGNERIA INFORMATICA RELATOREAUTORI Prof. Vittorio TrecordiDemicheli.
HLRmon per IGI: nuove funzionalità Enrico Fattibene INFN – CNAF
Alessandro De Salvo Status dei Tier2 di ATLAS Alessandro De Salvo
Attività gruppo Sicurezza CCR, 3 Ottobre CCR, 3/10/07 Attività del gruppo Sicurezza 2 Topologia LAN Configurazioni ottimali rete e monitoraggio,
Acquisti TIER T2 team e Pistoni per la consulenza sull’hardware.
Aggiornamenti gruppo WINDOWS CCR Riunione 5-7 ottobre 2010 Gianluca Peco.
VO-Neural Project e GRID Giovanni d’Angelo Dipartimento di Scienze Fisiche Università degli Studi di Napoli Federico II Martina Franca 12 – 23 Novembre.
Riunione SICR Enrico Pasqualucci. Supporto Stato support Stato PCSupport.
Piano di Formazione CCR per il 2016
Valutazione proposte di corsi di formazione S. Arezzini, L
Piano di Formazione CCR per il 2017
Infrastruttura cloud servizi realizzata nella Sezione di Napoli
SCoPE - Stato dei Lavori
(Codice identificativo progetto: PON03PE_00159_1)
Vulnerability Assessment
Gestione Farm Tema centrale della sessione: utilizzo del batch- system nelle varie sedi T1 e T2, ma anche altre farm grid e farm di sezione requirements,
Gestione Farm Tema centrale della sessione: utilizzo del batch-system nelle varie sedi T1 e T2, ma anche altre farm grid e farm di sezione requirements,
Status Report Gruppo Storage CCR CCR 14-15/03/2006.
SICR 6 Settembre 2012.
Integrazione tier3 in Grid Paolo Veronesi, Luciano Gaido
Agenda 9 Maggio 10 Maggio Riunione Plenaria
IGI BLUEPRINT LAVORI IN CORSO
Monitoring e loadbalancing dei servizi Grid
Referaggio delle richieste dei gruppi di lavoro
Comput-ER l'infrastruttura di calcolo distribuito in Emilia Romagna
l’organizzazione di IGI
La segnalazione : Incident Reporting
Attività su middleware Grid e sua evoluzione
Richieste di upgrade dei link di accesso alla rete Geografica
Gruppo WebTools CCR – 14 Marzo 2007 Dael Maselli.
HLRmon: visualizzazione di dati di accounting
Nuovo sito della Commissione Calcolo e Reti
Netgroup Attività 2007 R.Gomezel.
Gruppo storage CCR Nuove attivita’ 2007 Alessandro Brunengo CCR - Roma
Stato Acquisti Switch/Router T2
Sicurezza e Grid Computing
Meccanismi di caricamento e aggiornamento dei dati
Introduzione alla sessione sull’analisi per gli esperimenti LHC
Metriche SE monitoring G.Donvito G.Cuscela INFN Bari
QUADRO CALCOLO IN COMMISSIONE III
Commissione Calcolo e Reti
Aggiornamento sullo stato del Tier-2 di Catania
Nuove funzionalità e futura implementazione nella Sezione di Trieste
Parlando di network i discorsi naturalmente diventano complessi (creazione di un intero ecosistema virtuale comparabile ad uno reale): Separazione layers.
(Breve) Riassunto del workshop WLCG
Gruppo WebTools Workshop CCR – 12 Giugno 2008 Dael Maselli – INFN LNF.
Agenda CE IGI
Luciano Gaido (INFN - Torino) Workshop CCR/INFNGRID – Palau
ATLAS PRIN Next Steps Alessandro De Salvo
AUDITING DEI SISTEMI DI POSTA ELETTRONICA Prima fase: definizione della procedura, politiche di sicurezza Workshop maggio 2009 Ombretta Pinazza,
IGI e l’impatto sui servizi calcolo
Attivita’ passata e futura CCR 29 settemre 2008
Gruppo WebTools Workshop CCR – 12 Giugno 2008 Dael Maselli – INFN LNF.
Marcello Iacono-Manno Catania, 6 maggio 2010
[Nome progetto] Relazione finale
[Nome progetto] Relazione finale
D.M. n. 663/2016 La rete Toscana dei CPIA Tipologia B
INFN-Grid DI PRODUZIONE grid-use-model grid.infn.it
CSN aprile Comunicazioni
Valutazione del servizio
Transcript della presentazione:

Problemi aperti Luciano Gaido (INFN - Torino) Workshop CCR – Laboratori Nazionali del Gran Sasso 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Sommario Introduzione Rete Sicurezza Release e compatibilità del software Supporto Altri punti di vista Availability/reliability Conclusioni Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Sommario Introduzione Rete Sicurezza Release e compatibilità del software Supporto Altri punti di vista Availability/reliability Conclusioni Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Introduzione Grid di produzione operativa da parecchi anni (DataGrid, EGEE, EGEE-II ed ora EGEE-III). La componente wLCG (worldwide LHC Computing Grid) è stata ed è molto importante (in termini di risorse, applicazioni e commitment): Inizio presa dati! La gestione di una grossa infrastruttura di produzione è una attività complessa, anche per i vincoli esterni (locali e sovranazionali) L’nfrastruttura evolverà ancora: Prospettiva delle Nation Grid Infrastructures (NGI) con “interconnessione” di European Grid Initiative (EGI) Evoluzione del modello delle Operations in EGEE-III Aumento di risorse, servizi, applicazioni ed utilizzatori Qualità di servizio elemento sempre più importante: Garantire un livello di servizio soddisfacente (possibilmente) a tutti gli utilizzatori Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Sommario Introduzione Rete Sicurezza Release e compatibilità del software Supporto Altri punti di vista Availability/reliability Conclusioni Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Rete Firewall Non ci sono purtroppo documenti esaustivi sulle porte da aprire sul firewall per tutti i servizi grid. Sono disponibili alcuni documenti su wiki: Configurazione iptables:   https://twiki.cern.ch/twiki/bin/view/LCG/LCGfw Elenco porte utilizzate dai servizi:  https://twiki.cern.ch/twiki/bin/view/LCG/LCGPortTable Prossimamente verrà creata una sezione specifica sul portale del ROC italiano. Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Rete (cont.) Reti locali e geografiche  necessità di valutare l’evoluzione, in particolare: 10 Gb/s per i Tier-2 Link dedicati Tier-1  Tier-2 (1 Gb/s?) Valutazione da effettuare in collaborazione tra CCR (WG NetArch, ROC, GARR) Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Sommario Introduzione Rete Sicurezza Release e compatibilità del software Supporto Altri punti di vista Availability/reliability Conclusioni Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Sicurezza Il gruppo OSCT (Operations Security Coordination Team): coordina le attività dei vari ROC sulla security raccoglie raccomandazioni, best practices e documenti vari su un sito web (c’è il link dal portale italiano del supporto) http://rss-grid-security.cern.ch/rss.php Effettua i cosiddetti “security challenge” Un team, il Duty Contact (OSCT-DC), segue i problemi di sicurezza che si presentano attivando le procedure opportune con turni di una settimana Organizza tutorial sulla sicurezza Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Sicurezza (cont.) Il ROC italiano sta riorganizzando le proprie attività: riviste le procedure di incident response (con GARR-CERT) in costituzione gruppo di lavoro per Studio delle problematiche di security sulla grid italiana valutazione di strumenti vari (log centralizzato, intrusion detection, etc.) Sinergia con gruppo security INFN (non si deve riscoprire l’acqua calda) riorganizzazione della documentazione (a volte troppo dispersiva e dispersa) definizione degli use case da sottoporre all’OTS GARR per interventi su un sito verifica periodicamente dei “Security Contact”, attraverso appositi security challenge ‘regionali’ formazione Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Sommario Introduzione Rete Sicurezza Release e compatibilità del software Supporto Altri punti di vista Availability/reliability Conclusiono Workshop CCR - LNGS - 11 giugno 2008

Release e compatibilità dei sw Release INFN-GRID: Insufficienza procedure validazione (EGEE) Test più approfonditi a livello del ROC italiano prima di rilasciare una componente per il deployment Compatibilità dei sw con il middleware grid: Problema serio Particolarmente sentito in ambienti “misti” (accesso grid e locale alle farm) Non esiste una soluzione definitiva Varie esperienze, anche da progetti italiani Virtualizzazione? Integrazione di nuove componenti nella release Scuole (es. Martinafranca) Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Sommario Introduzione Rete Sicurezza Release e compatibilità del software Supporto Altri punti di vista Availability/reliability Conclusioni Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Supporto Riorganizzazione turni: Individuazione del modello più efficiente: Tutti fanno i turni a rotazione come ora Team dedicato al controllo/supporto Tool Evoluzione ‘naturale’ dei tool, miglioramento funzioni esistenti ed inserimento di nuove funzionalità Inserimento risorse di altri partner (INAF e PON): Interoperabilità tool di supporto Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Sommario Introduzione Rete Sicurezza Release e compatibilità del software Supporto Altri punti di vista Availability/reliability Conclusioni Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Altri punti di vista Diversi attori coinvolti, con differenti punti di vista Utilizzatori/amministratori: Necessità di tool semplici, affidabili e possibilmente comuni: monitoring accounting Supporto distribuzione informazioni Utilizzatori/esperimenti: Necessità di UI SL4/x86_64 Non presente in gLite, ma inserita in INFN-GRID: Guida disponibile: http://igrelease.forge.cnaf.infn.it/doku.php?id=doc:guides:install-3_1_64bit Workshop CCR - LNGS - 11 giugno 2008

Altri punti di vista (cont.) Utilizzatori/esperimenti: frequenza elevata degli upgrade, possono interferire con attività esperimenti  quali fare? Già ora sono classificati in 2 categorie (High Priority, Normal) Miglioramento documentazione associata in futuro (sintesi di release notes?) Possibilità di effettuare l’upgrade di specifiche componenti: metapackage possibile già ora per profili “generali” (CE, SE, UI, etc.) in fase di studio profili a grana più fine qualche test già effettuato a padova Workshop CCR - LNGS - 11 giugno 2008

Altri punti di vista (cont.) Utilizzatori/esperimenti (cont.): documentazione poco utilizzabile (carente, dispersa) Due ‘repository’: EGEE ed INFN-GRID Riorganizzazione in vista, ma quella gLite non dipende dal ROC italiano per YAIM (INFN-GRID): http://igrelease.forge.cnaf.infn.it/doku.php?id=doc:guides:site-info-variables Repository middleware: presenza di file obsoleti e ‘upgrade’ totali Vari repository disponibili (gLite, INFN-GRID, altri) Problema aperto Workshop CCR - LNGS - 11 giugno 2008

Altri punti di vista (cont.) Utilizzatori/esperimenti (cont.): Alcuni problemi con DGAS (roma1 in particolare): Configurazioni complesse! Necessità di controllo regolare dello stato: https://dgas.cnaf.infn.it/HLRmon In fase di implementazione l’automatizzazione di alcuni controlli Affidabilità dei servizi ‘core’ (es. VOMS): Ridondanza già presente Non sempre è sufficiente, necessarie opportune ‘configurazioni’ da parte degli esperimenti (vedi problemi di CDF) Workshop CCR - LNGS - 11 giugno 2008

Altri punti di vista (cont.) Problemi segnalati in passato: meccanismo con cui vengono prese le decisioni operative non ottimale,  necessita' di un coordinamento snello ma efficace fra GRID ed esperimenti: phone conference periodiche INFN-GRID (il venerdì, ogni 15 gg.) Phone conf operations (ogni lunedì) Problemi specifici o particolamente importanti : cabina di regìa Riunioni “ad hoc” difficoltà ad avere un monitoring dell'uso delle risorse uniforme e coerente fra le sedi: Dati di accounting accessibili attraverso il portale HLRmon Per segnalare problemi specifici  aprire un ticket opportuno, in modo tale da consentirne la tracciabilità Per problemi più generali mail a it-roc-managers@infn.it Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Sommario Introduzione Rete Sicurezza Release e compatibilità del software Supporto Altri punti di vista Availability/reliability Conclusioni Workshop CCR - LNGS - 11 giugno 2008

Availability/reliability Metriche EGEE/LCG: controllo basato su test periodici (SAM test) gestiti centralmente evoluzione verso Nagios nei mesi scorsi risultati per la grid italiana insoddisfacenti Non significa necessariamente che non c’è stata attività Sintomo di problemi (e.g. BDII poco responsivo) Supporto del ROC per la risoluzione dei problemi nei siti Miglioramento nell’ultimo mese... ma il lavoro non è concluso Gestione “regionale” dei test prossimamente Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Sommario Introduzione Rete Sicurezza Release e compatibilità del software Supporto Altri punti di vista Availability/reliability Conclusioni Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Conclusioni Sinteticamente: Il modello utilizzato per le operations è in fase di revisione L’evoluzione verso IGI/EGI impone di affrontare nuovi problemi ma anche di semplificare le procedure per gestione/controllo/supporto della Grid Dobbiamo garantire una opportuna qualità di servizio Workshop CCR - LNGS - 11 giugno 2008

Workshop CCR - LNGS - 11 giugno 2008 Conclusioni (cont.) Discussione! Workshop CCR - LNGS - 11 giugno 2008