Attività su EOS Prime esperienze d’implementazione della soluzione storage prodotta al CERN presso la Sezione di Trieste Workshop della CCR - 16-20 maggio.

Slides:



Advertisements
Presentazioni simili
Workshop CCR Otranto - maggio 2006 General Parallel File System: caratteristiche, prestazioni ed esempi di utilizzo in produzione Alessandro Brunengo -
Advertisements

5 Feb 2002Stefano Belforte – INFN Trieste calcolo per CDF in Italia1 Calcolo per CDF in Italia Prime idee per lanalisi di CDF al CNAF Numeri utili e concetti.
CCR 14-15/03/2006 Status Report Gruppo Storage CCR.
AFS Working Group R.Gomezel CCRWS Verso la sfida di LHC Otranto (Lecce), 6-9 Giugno 2006.
LNL CMS M.Biasotto, Roma, 22 novembre I Tier2 in CMS Italia Massimo Biasotto - LNL.
8 Maggio 2002Workshop CCR - La Biodola W2K Coordination Group & HEP-NT Report Enrico M.V. Fasanelli Gian Piero Siroli.
Istituto Nazionale di Fisica Nucleare La Biodola, Isola d’Elba, 6-9 maggio 2002 AFS: Status Report WS CCR R.Gomezel Workshop sulle problematiche.
Workshop CCR Otranto - giugno 2006 Gruppo storage CCR Status Report Alessandro Brunengo.
Alessandro Tirel - Sezione di Trieste Storage Area Network Riunione gruppo Storage Padova, 5 ottobre 2005.
BOLOGNA Prin-STOA Report L. Rinaldi Bari – 12/11/2015.
Domenico Elia1Riunione PRIN STOA-LHC / Bologna Attività per ALICE: sommario e prospettive Domenico Elia Riunione PRIN STOA-LHC Bologna, 18 Giugno.
CCR - Frascati 29 settembre 2008 Gruppo storage CCR Status Report Alessandro Brunengo.
Presentazione WS del 23/10/2013 al CNAF: 0&resId=0&materialId=slides&confId=6920
Attività e servizi di calcolo a Roma Tor Vergata R. Kwatera, R. Lulli, R. Sparvoli Roma Tor Vergata.
EEE e Cloud Enrico Fattibene, Andrea Ferraro INFN – CNAF Workshop di CCR sull'Infrastruttura Cloud 15 Dicembre 2014 Quest'opera è distribuita con Licenza.
20-21/03/2006Workshop sullo storage - CNAF Storage nei Servizi Calcolo delle sezioni INFN Alessandro Brunengo.
ALICE Computing Readiness Workshop Tier-2 CNAF Jan 17-18, ALICE Computing Readiness 1) ALICE Italia: Persone & organizzazione 2) Test & commisioning.
Alessandro Tirel - Sezione di Trieste Storage servers & TCP Tuning Proposta di studio delle problematiche connesse alla fornitura di servizi di storage.
Attività Gruppo Virtualizzazione Andrea Chierici CNAF Riunione CCR
Security Group – Cnaf-Bologna - 7 Novembre 2007 Security Gruppo Auditing Franco Brasolin Servizio di Calcolo e Reti Sezione INFN di Bologna.
CCR, LNF ott 2011 Proposte assegnazioni server & storage L. Carbone, A. Gianoli, M. Serra.
INFN-AAI Stato dell’infrastruttura centrale Dael Maselli Workshop INFN CCR 2010.
Sistema Informativo. Mansioni Gestione della piattaforma hardware e sistemistica del sistema informativo INFN In realta’ il mansionario e’ in continua.
Attività PRIN STOA a Cagliari Alessandro De Falco Università/INFN Cagliari.
AFS NELLA SEZIONE DI PADOVA aree_utenti: attualmente nessuno ha la proria home in AFS e quasi nessuno utilizza l'area utenti di AFS. /usr/local: si preferisce.
Torino, Andrea Dainese 1 Andrea Dainese (INFN – LNL) Stato del Tier-2 ALICE a Legnaro.
Aggiornamenti gruppo WINDOWS CCR Riunione 5-7 ottobre 2010 Gianluca Peco.
20-21/03/2006Workshop sullo storage - CNAF Alessandro Brunengo.
Il calcolo ATLAS a Napoli nel 2014/2015
Sistemi e Applicazioni per l’Amministrazione Digitale
Infrastruttura cloud servizi realizzata nella Sezione di Napoli
Riccardo Veraldi - Massimo Donatelli CCR 3-4 Marzo 2008
Status Report Gruppo Storage CCR CCR 14-15/03/2006.
Summary di (quasi) tutti gli utenti non presentati…
dCache Test effettuati al CNAF
WPC069 Il deployment automatizzato di Windows 10
Riunione INFN – Bologna, 17 January 2013
Monitoring e loadbalancing dei servizi Grid
Gruppo Mailing Aggiornamento al 15/3/2007.
Centro di Ricerche Genomiche Università di Modena e Reggio Emila
Risultati ultimi mesi Piano di lavoro prossimi mesi Reclutamento
Richieste di upgrade dei link di accesso alla rete Geografica
Collegamento a Garr-X Il collegamento alla nuova rete Garr-X dovrà garantire il massimo della efficienza nella gestione della banda. Per identificare opportunamente.
Installazione Storage 2016
Cloud per HA nei Servizi
Attivita’ e compiti del Servizio Impianti Calcolo e Reti
PRIN Roma1 – status Luciano Barone, Alessandro De Salvo
Servizi Nazionali INFN
Gruppo storage CCR Nuove attivita’ 2007 Alessandro Brunengo CCR - Roma
Introduzione alla sessione sull’analisi per gli esperimenti LHC
INFN Il calcolo scientifico presso la sede INFN di Padova e di Legnaro
Carbone, Gianoli, Mezzadri
Aggiornamento sullo stato del Tier-2 di Catania
Nuove funzionalità e futura implementazione nella Sezione di Trieste
ATLAS-Italia Tier-3 Dario Barberis Università e INFN Genova
INFN-TS INFN - Sezione di Trieste - C. Strizzolo - L. Strizzolo.
Portal Architecture Data Management
MC-INFN.
Gruppo WebTools Workshop CCR – 12 Giugno 2008 Dael Maselli – INFN LNF.
Workshop dei Gruppi di lavoro CCR Michele Michelotto at pd.infn.it
Condivisione Documentazione Tecnica
INFN Il calcolo scientifico presso la sede INFN di Padova e di Legnaro
Interfacce SRM: l'utilizzo di STORM - Overview e prospettive (ALICE)
R.Gomezel Commissione Calcolo e Reti CNAF
Risultati del questionario sui servizi middleware aggiuntivi
Recupero polizze assicurative
Gruppo WebTools Workshop CCR – 12 Giugno 2008 Dael Maselli – INFN LNF.
© 2007 SEI-Società Editrice Internazionale, Apogeo
389 Directory Server Dael Maselli.
ATLAS PRIN Roma1 - status Alessandro De Salvo
Transcript della presentazione:

Attività su EOS Prime esperienze d’implementazione della soluzione storage prodotta al CERN presso la Sezione di Trieste Workshop della CCR maggio La Biodola1/16

Introduzione Il progetto nasce nell’aprile del 2010 dal Data and Storage Services group del CERN ed entra in produzione nel giugno dello stesso anno. Lo scopo è di fornire un accesso al disco veloce ed affidabile agli utenti LHC. La versione in produzione è denominata Beryl/Aquamarine v0.3.x, mentre la prossima sarà chiamata Citrine v0.4.x. Il core del progetto è XrootD, attualmente nella versione Il significato di EOS è misterioso: dea greca, Exploration Of Storage,… Workshop della CCR maggio La Biodola2/16

Struttura Un installazione tipica si compone di due nodi chiamati MGM in configurazione master/slave che gestiscono il namespace e i metadati (in memoria) e di una serie di nodi chiamati FST che immagazzinano i dati. Workshop della CCR maggio La Biodola3/16

Features Autenticazione: unix, sss, krb5 e gsi Permission sytem: posix, system e user acl RAIN (Redundant Array of Indipendent Nodes): Repliche 1->16, RAID-DP, RAID6 e Archive Fuse client: eosfsd (End-User mount) e eosd (Shared mount) Balancing system: stesso scheduling group Group balancer: bilanciamento tra scheduling group Drain system (automatico/manuale) Quota per user, group e project (path) GeoTag e Geo Balancer Recycle Bin Workshop della CCR maggio La Biodola4/16

Accesso Xrootd Fuse GridFTP SRM (BeStMan2 -> Berkeley Storage Manager) WebDAV Workshop della CCR maggio La Biodola5/16

Diffusione Attualmente EOS è diffuso in vari laboratori ed enti internazionali oltre che al CERN, tra questi: Fermilab, Subatech (IN2P3), Università di Vienna, Aarnet, JRC, Russia Tier1 e la Sezione di Trieste. Workshop della CCR maggio La Biodola6/16

Motivazioni Costi di sviluppo e mantenimento dell’infrastruttura GPFS basata su Fibre Channel. Efficienza di accesso al dato Flessibilità di configurazione (raid-hw vs JBOD, repliche) Accesso compatibile con farm e cloud Autenticazione forte krb5 gsi Workshop della CCR maggio La Biodola7/16

Hardware MGM Nodes: 2 x DELL PowerEgde R320 - Intel Xeon E V2 (six-cores) - 16GB – 1 Gb/s Ethernet FST Nodes: 3 x Supermicro SuperStorage Server 5048R- E1CR36L - Intel Xeon E5-2609v3 (six-cores) - 32GB – 36 dischi da 4/6 TB (4 x 9-disks RAID-6) – RAID AOC-S3108L-H8iR con batteria – Intel X520-DA2 10 Gb/s Ethernet EOSGW: DELL PowerEdge R320 - Intel Xeon E (six- cores) – 16GB – Qlogic QLE Gb/s Dual port – Intel NetEffect NE Gb/s Ethernet Workshop della CCR maggio La Biodola8/16

Installazione Pre-installazione: SO SLC 6.7 – configurazione file systems – accesso ssh password-less tra i nodi – configurazione delle iptables. Primo tentativo: script utilizzato da Alice per il deployment non ha funzionato. Secondo tentativo: script prodotto da Comtrade con documentazione (!!) si è rivelato più efficace anche se con qualche bug (nome istanza e rilevazione dei file system) Terzo tentativo: lo script ha funzionato meglio anche se è stato necessario ridefinire manualmente i file system./eossetup.sh eosinfnts --fst fst01.ts.infn.it,fst02.ts.infn.it --numfs 4 - -slave mgm02.ts.infn.it --verbose –validate Workshop della CCR maggio La Biodola9/16

Situazione attuale Ad oggi sono in linea 392TB ripartiti tra Alice, CMS, Compass e Wizard. L’autenticazione è Kerberos5 (AAI) per gli utenti locali, sss per eosgw e attiveremo a breve (speriamo) la GSI Non tutti utilizzano replica 2 Workshop della CCR maggio La Biodola10/16

To do list Creazione del MGM alias e script per il failover GSI Installazione interfaccia SRM – BeStMan2 Tuning Ulteriore nodo FST (€) Workshop della CCR maggio La Biodola11/16

Performance Non sono stati fatti approfonditi test prestazionali, questa è l’unica testimonianza: «Ho lanciato per due volte 346 job su normal, riuscendo a saturarla in un momento in cui ero l’unico utente di questa coda (su tutta la farm, 190 job di alice, 25 di cms e 60 di grid), in configurazione con lettura da GPFS e da EOS via XROOTD. Ciascun job ha analizzato un gruppo di 50 files, a gruppi totalmente disgiunti. Non ho osservato problemi con XROOTD, tutti i files sono stati letti correttamente. Complessivamente, sommando su tutti i job, trovo: real GPFS: 8355 minuti user GPFS: 2272 minuti sys GPFS: 29 minuti real EOS: 2660 minuti user EOS: 2407 minuti sys EOS: 41 minuti» Workshop della CCR maggio La Biodola12/16

Supporto Il supporto del team DSS in particolare nelle persone di Luca Mascetti e Massimo Lamanna è stato fondamentale. Per agevolare le comunicazioni abbiamo creato una mailing list anche per mantenere un archivio delle informazioni. Grande collaborazione anche con Comtrade che ha accolto un nostro suggerimento ed ha introdotto il parametro --dirfs per agevolare il rilevamento dei file system. Workshop della CCR maggio La Biodola13/16

Documentazione Purtroppo come spesso avviene nell’impeto del progetto la documentazione viene sacrificata, ci sono molte presentazioni, un wiki e perfino una pagina web dedicata: ma le informazioni riportate non sono strutturate, colgono alcuni aspetti e mancano di visione generale. Forse l’aumentare di utenti esterni contribuirà a stimolare la stesura di documenti più dettagliati. Workshop della CCR maggio La Biodola14/16

EOS nell’INFN Ritengo possa essere una valida soluzione per l’immagazzinamento dei dati. Collaborazione più ‘strutturata’ con il CERN, magari coordinata dal WG Storage. Possibile impiego di dischi di tipo archive Shingled Magnetic Recording? Workshop della CCR maggio La Biodola15/16

Referenze Documentazione: Repository: repo/eos/aquamarine/tag/el-6/x86_64/ depend/el-6-x86_64/ Presentazioni: Workshop della CCR maggio La Biodola16/16