Servizio Calcolo Alessandro Brunengo. Indice Attivita’ del servizio calcolo Infrastruttura (sala CED, rete) Servizi centrali Supporto al calcolo scientifico.

Slides:



Advertisements
Presentazioni simili
Cluster openMosix Linux Day ’04 Caserta Ing. Diego Bovenzi.
Advertisements

Progetto Speciale Prototipo Tier1 F. Ruggieri INFN – CNAF I Workshop CMS Italia del SW e Computing Roma 22 Novembre 2001.
Aspetti critici rete LAN e WAN per i Tier-2
Riunione CRESCO Infrastruttura HPC Cresco Analisi Preliminare.
1 M. Biasotto – Legnaro, 22 Dicembre 2005 Prototipo Tier 2 di Legnaro-Padova INFN Legnaro.
Case study Maiora srl.
Benvenuti a Un incontro informativo di grande valore ed alto contenuto sulla Virtualizzazione e sistemi ad alta disponibiltà per le PMI.
Architettura di storage ad alta affidabilita e bilanciamento di carico per volumi centrali e di esperimento A.Brunengo, M.Corosu INFN Sezione di Genova.
Soluzioni Windows Server per piccole imprese
© Sediin e Achab 2007 MDaemon in Cluster: il cluster in azione Milano, 5 luglio 2007 Emiliano Biocchetti - SEDIIN S.p.A. &
Dischi in RAID  Redundant Array of Independent Disk Configurazione che permette di combinare più dischi secondo obiettivi di performance e ridondanza.
1 Collaboration Server “La collaborazione verso il successo” Che cosa è un Collaboration Server? A cosa mi può servire?
SIARL ARCHITETTURA DEL SISTEMA E GESTIONE DELLA SICUREZZA Milano, 5 novembre 2003 Struttura Sistemi Informativi e Semplificazione.
Le “nuvole informatiche”
Servizio Sistema Informativo - Area Gestione Sistemi e Sicurezza – LNF – Dael Maselli Area Gestione Sistemi e Sicurezza LNF Plenaria Servizio Sistema Informativo.
Servizio Sistema Informativo - Area Gestione Sistemi e Sicurezza – LNF – Dael Maselli Area Gestione Sistemi e Sicurezza LNF Plenaria Servizio Sistema Informativo.
Calcolo LHC - F. Ferroni, P. Lubrano, M. SozziCSN1 - Catania Calcolo LHC 2003 (F. Ferroni, P. Lubrano, M. Sozzi)
Competenze e attività gestite dai servizi di calcolo e reti. Paolo Mastroserio.
CSN1 21 Giugno 2004 P. Morettini 1 Commissione Calcolo e Reti Ruolo e composizione della commissione I working groups I workshops Geant 4 Reti e potenziamento.
Servizio Sistema Informativo - Area Gestione Sistemi e Sicurezza – LNF – Dael Maselli Area Gestione Sistemi e Sicurezza LNF Plenaria Servizio Sistema Informativo.
Istituto Nazionale di Fisica Nucleare La Biodola, Isola d’Elba, 6-9 maggio 2002 AFS: Status Report WS CCR R.Gomezel Workshop sulle problematiche.
Workshop CCR Otranto - giugno 2006 Gruppo storage CCR Status Report Alessandro Brunengo.
Riunione CCR 21/12/2005 Gruppo Storage Relazione sulla analisi di infrastrutture Fibre Channel e presentazione attivita’ per il 2006 Alessandro Brunengo.
Presentazione Servizi. Di Cosa Ci Occupiamo Hera02 cura per le Aziende i seguenti tre assetti: 1 – I servizi di Telecomunicazioni: Connessione Dati verso.
Riunione Servizi Servizio Calcolo e Reti 13 settembre 2004 Silvia Arezzini.
Servizio Sistema Informativo - Area Gestione Sistemi e Sicurezza – LNF – Dael Maselli Area Gestione Sistemi e Sicurezza LNF Plenaria Servizio Sistema Informativo.
Servizio Sistema Informativo - Area Gestione Sistemi e Sicurezza – LNF – Dael Maselli Area Gestione Sistemi e Sicurezza LNF Plenaria Servizio Sistema Informativo.
Ing. Giovanni B. Barone Convegno PON RECAS - Napoli, 16 dicembre 2014 ReCaS Napoli.
Gruppo Mailing CCR Settembre. Progetto di lavoro  Studio della centralizzazione del servizio di posta elettronica Situazione attuale Scenari.
6° Workshop CCR LNGS 10 – 13 Giugno 2008 Sandra Parlati, Piero Spinnato Questionario sui Servizi di Calcolo.
SERVER FARM. Server Farm 800 mq di spazio suddiviso in 10 locali tecnici Sala di controllo per il monitoraggio delle reti e dei sistemi Sale tecniche.
BOLOGNA Prin-STOA Report L. Rinaldi Bari – 12/11/2015.
Riunione SICR E. P.. Aggiornamenti Certificati  Digicert  Server  Personali per dipendenti ed associati  Certificati INFN per laureandi non associati.
Riunione SICR 24/6/2015. Cluster Cluster oVirt – Pronto alla migrazione dei servizi – Macchina virtuale radius per guest_conf in funzione – Tempi migrazione.
Il nuovo sito della CSN1 Salvatore Costa (Catania) Andrea Ventura (Lecce) Roma - Riunione di CSN gennaio 2016.
Roberto Covati INFN di Parma. Workshop CCR/INFN GRID Palau maggio Sommario VmWare Server (in produzione dal 2004 al 2008) VmWare Infrastructure.
Roberto Covati – Roberto Alfieri INFN di Parma. Incontri di lavoro CCR dicembre Sommario VmWare Server (in produzione dal 2004) VmWare ESX.
26 Giugno 2007CSN1 - Frascati1 Temi di attualità nella CCR Accanto alla tradizionale attività di controllo dei finanziamenti per le infrastrutture di calcolo.
Riunione PRIN STOA - Bologna - 18 Giugno 2014 Testbed del T2 distribuito Napoli-Roma Dr. Silvio Pardi INFN-Napoli Riunione PRIN STOA – Bologna 18 Giugno.
Referaggio CALCOLO Esperimenti non LHC G. Carlino, D. Lucchesi, V. Vagnoni CSN1 – Lecce 30 Settembre 2015.
Domenico Elia1Riunione PRIN STOA-LHC / Bologna Attività per ALICE: sommario e prospettive Domenico Elia Riunione PRIN STOA-LHC Bologna, 18 Giugno.
Referaggio apparati di rete per il 2010 Gruppo referee rete Enrico Mazzoni Fulvia Costa Paolo Lo Re Stefano Zani Roma, CCR
Centralizzazione del servizio di posta elettronica per l’INFN ─ INTEGRAZIONE ─ Ombretta Pinazza Per il Gruppo Mailing CCR, Marzo 2008.
Claudio Grandi Workshop CCR 2015 Claudio Grandi INFN Bologna.
CCR - Frascati 29 settembre 2008 Gruppo storage CCR Status Report Alessandro Brunengo.
FESR Consorzio COMETA - Progetto PI2S2 Il Tier-2 di ALICE a Catania Roberto Barbera Università di Catania e INFN Visita Referee.
Referaggio sigla CALCOLO D. Bonacorsi, G. Carlino, P. Morettini CCR – Roma 9 Settembre 2014.
Referaggio apparati di rete 2014 Seconde priorità Gruppo referee rete Fulvia Costa Paolo Lo Re Enrico Mazzoni Stefano Zani CNAF, CCR 1-2 aprile 2014.
Sistema di monitoraggio integrato Introduzione a cura di P. Mastroserio Servizio Calcolo & Reti Infn-Napoli P. Mastroserio Workshop CCR - INFN Grid Acireale.
Attività e servizi di calcolo a Roma Tor Vergata R. Kwatera, R. Lulli, R. Sparvoli Roma Tor Vergata.
FORMAZIONE CCR ANNO 2016 Commissione Calcolo e Reti Trento 16 marzo 2016 Silvia Arezzini (per il gruppo di lavoro, composto anche da Luciano Gaido e Roberto.
Riunione gruppo reti E. P.. IPMI Porta da mascherare sul router Scan IPMI e piano di indirizzamento (privato ?) Da fare nel piano generale quando si ha.
Progetto iSCSI Report alla CCR 12-13/12/2006 Alessandro Tirel – Sezione di Trieste.
Riunione SICR E. P.. Certificati  Digicert  Server  Personali per dipendenti ed associati  Non associati e macchine su phys.uniroma1.it ?  Problema.
Martedi 8 novembre 2005 Consorzio COMETA “Progetto PI2S2” UNIONE EUROPEA Accesso all’infrastruttura Grid del Consorzio COMETA Grid Open Day alla Facoltà.
Progetti CCR Referaggio progetti della Commissione Calcolo e RetiReferaggio progetti della Commissione Calcolo e Reti Referees: Tommaso Boccali, Alessandro.
P. Morettini. Organizzazione della CCR Le principali attività della CCR consistono da un lato nell’assegnazione di fondi per le infrastrutture di rete.
Attività Gruppo Virtualizzazione Andrea Chierici CNAF CCR
Test di storage a 10 Gbps proposta. Storage server a 10Gbps Si vuole vedere quali prestazioni si possano ottenere da server connessi a 10 GE –capacita’
G. Maggi 24/1/2006 Il Progetto del TIER2 di Bari Giorgio Maggi.
20-21/03/2006Workshop sullo storage - CNAF Storage nei Servizi Calcolo delle sezioni INFN Alessandro Brunengo.
Silvia Arezzini 2 luglio 2014 Consiglio di Sezione per Preventivi.
INFN-AAI architettura del sistema e strategia di implementazione Enrico M.V. Fasanelli INFN - sezione di Lecce Riunione comitato di revisione progetto.
CCR - Roma 15 marzo 2007 Gruppo storage CCR Report sulle attivita’ Alessandro Brunengo.
L’infrastruttura del progetto ReCaS Paolo Lo Re on behalf of ReCaS collaboration.
La gestione della rete e dei server. Lista delle attività  Organizzare la rete  Configurare i servizi di base  Creare gli utenti e i gruppi  Condividere.
Esigenze di Rete degli Esperimenti LHC e di Gr1 G. Carlino – INFN Napoli CCR – Roma 8 Settembre 2014.
CCR, LNF ott 2011 Proposte assegnazioni server & storage L. Carbone, A. Gianoli, M. Serra.
Servizio Calcolo Alessandro Brunengo.
Attivita’ e compiti del Servizio Impianti Calcolo e Reti
Transcript della presentazione:

Servizio Calcolo Alessandro Brunengo

Indice Attivita’ del servizio calcolo Infrastruttura (sala CED, rete) Servizi centrali Supporto al calcolo scientifico Attivita’ di CCR User support Attivita’ prevalenti nell’ultimo anno Personale afferente Attivita’ future 2

Attivita’ del Servizio Calcolo 3

Sala Macchine Sala dedicata (40 m 2 ) Tre linee di alimentazione Da UPS (trifase 160 A) Da quadro elettrico PF0 (trifase da 160 A) Da quadro elettrico PF1 (trifase da 60 A) per backup Distribuzione interna a doppia blindosbarra UPS da 100 KVA con batteria (15 minuti a pieno carico) Condizionamento 4 CDZ (ridondanza 3+1) da KW Impianto allarme anti incendio collegato a bobine di sgancio sul quadro elettrico Calcolatori su RACK 19” (10 rack) 4

Rete geografica Connettivita’ Connessione fisica: 2 link 1 Gbps in FO diretto sulla MAN di Genuanet (in failover), diretti sul PoP GARR di Genova via MPLS Connessione logica (IP): 2 link 1 Gbps verso i PoP GARR di Milano (primario) e Pisa (secondario) in failover (BGP) Upgrade della linea non ancora necessario 5

Rete Locale Rete cablata (60 accessi 10GE, 220 GE, 600 FE) backbone (SM) 10 Gbps backbone (montante) 1 Gbps utenze server di disco e virtuali: dirette su backbone a 10 Gbps utenze nodi di calcolo (SM): 1 Gbps utenze laboratori/uffici: 100 Mbps 6 Rete Wireless SSID INFN-dot1x, INFN-Web, eduroam, dipfis 10 access point gestiti tramite wifi controller

Servizi centrali Servizi di base Firewall, DNS, DHCP, NTP, autenticazione e user db (unix su NIS e Windows su Active Directory), stampanti, videoconferenza Servizi di posta elettronica (mail relay, imap server, listserver, webmail, antivirus, antispam) Servizi web (web server, wiki, aree utente) Connettivita’ dall’esterno (VPN) Aree dati su windows (profili, home, aree di gruppo, distribuzione software, area scratch) su Windows Cluster Server ridondante Backup delle aree centrali e di alcune aree di gruppo Infrastruttra di virtualizzazione per servizi ed utenze di gruppo 7

Calcolo scientifico Grid (Tier3 di Atlas) Servizi di base: creamce, bdii, apel, storm, user interface, LSF Nodi di calcolo: 17 nodi, 124 core, 1.4 kHS06 Farm locali (farm centrale, farm Magic5) Servizi di base: user interface, LSF, SGE Nodi di calcolo: 64 nodi, 618 core, 9.0 kHS06 Farm HPC (utenze multidipartimentali) per applicazioni MPI Contributi: INFN (uno), Ingegneria, Fisica Connessione InfiniBand QDR Servizi di base: user interface, LSF, IB switch Potenza di calcolo: 9 nodi, 144 core, 2.5 kHS06 Calcolo parallelo (GPU/PHI) 4 nodi (teo, jlab12) con 16 GPU 1 nodo con 2 schede Intel Phi utilizzo solo interattivo (per ora) 8

Storage Storage per aree dati linux di servizio (home, farm) e di esperimento Volumi SATA/NL-SAS 7.2 krpm in configurazione RAID6, accessibili via SAN su Fibre Channel Volumi per metadati, virtualizzazione e mail su HD SAS 15 krpm, sempre su SAN File system GPFS no single point of failure performante (in particolare per accessi sequenziali) flessibile migrazione dati on line incremento/riduzione spazio complessivo on line spazio per le aree dati gestite con meccanismo di quota (modificabile on line) supporta quota, snapshot, ACL, … permette acquisti centralizzati, overprovisioning Spazio complessivo: 320 TB, assegnato: 340 TB serve: Tier3, farm centrale, home directory, volumi di servizio 9

Attivita’ in CCR Rappresentante della Sezione in CCR: Brunengo Responsabile nazionale gruppo storage di CCR (Brunengo) Attivita’ di R&D nei gruppi mailing, network, netarch, cloud, windows (Brunengo, Bersani, Corosu, Saffioti) Attivita’ di referee riferimento per la valutazione dei costi dello storage per le CSN referee dei preventivi per le richieste dei gruppi di lavoro legati a finanziamenti esterni referee per le richieste di aumento di banda delle sedi (nell’ambito del netgroup) Gestione di uno dei time server nazionali, ospitato a Genova 10

User support Supporto agli utenti per installazioni configurazioni di sistemi operativi e applicativi standard (office, mail client, accesso wireless, accesso vpn, stampanti) supporto puntuale per problemi di funzionalita’ del desktop per l’amministrazione e la segreteria scientifica (in realta’, per tutti) problemi hardware e fornitura di materiale di magazzino (alimentatori, HD, mouse, tastiere, cavi di rete,…) supporto psicologico nella lotta al computer spalla su cui piangere backup e recupero dei dati (se possibile) Supporto per conferenze ed eventi 11

Attivita’ dell’ultimo anno Virtualizzazione Manutenzione dei sistemi centrali Manutenzione e sviluppo Tier3 Sviluppo farm HPC 12

Sviluppo servizi centrali Virtualizzazione migrata infrastruttura su nuovo hardware e release di software 2 server, 64 core e 256 GB di RAM complessivi accesso diretto allo storage via SAN su Fibre Channel volumi SAS 15 krpm, in RAID6, 2 TB in uso, 4 disponibili 39 VM attive (~110 GB di RAM, 53 CPU), 11 inattive 17 server per servizi centrali 7 server per attivita’ di gruppo 2 server per calcolo (GRID) 9 server di test e sviluppo 4 server per servizi di dipartimento Upgrade di tutti i servizi su Contos6/Centos7 (80%) 13

Manutenzione Tier3 di Atlas Tier3 (Grid):manutenzione del sito Upgrade a nuova release di middleware Oltre job processati nei primi 6 mesi del 2015 Efficienza e affidabilità in linea con le (stringenti) richieste 14

Sviluppo farm HPC Farm HPC: setup della farm e relativo supporto utenti per il suo utilizzo (startup) 15

CCR Oltre ai lavori ordinari della commissione: Gruppo storage organizzazione e docenza su corso di formazione nazionale su file system parallelo supporto alle sedi che utilizzano GPFS Gruppo storage e cloud analisi di funzionalita’ dell’utilizzo di GPFS come backend per lo storage di OpenStack nei diversi servizi di cloud storage organizzazione e docenza corso nazionale su cloud storage Gruppo mailing PEC analisi su migrazione delle caselle PEC utilizzati da amministrazioni e RUP verso un indirizzo analisi gestione dei messaggi PEC per archiviazione locale 16

User support Generico supporto a gruppi sperimentali per l’utilizzo delle macchine di calcolo user support per l’utilizzo di MPI (anche su cluster HPC) adattamento di configurazioni ad hoc per utilizzo piu’ efficiente delle farm multiutente (centrale, HPC) recente attivita’ sull’uso di Intel Phi Storage locale acquisto e installazione nuovo storage (200 TB) e dismissione di storage obsoleto Eventi: meeting collaborazione Borex, anniversario sezione, LDMA

Personale afferente Alessandro Brunengo (tecnologo, Responsabile) coordinamento e linee di sviluppo supporto al calcolo scientifico (farm, storage) rete e servizi centrali attivita’ CCR (rappresentante, gruppi storage/cloud/net/mail) Mirko Corosu (tecnologo) sviluppo servizi centrali in ambiente linux attivita’ CCR (gruppo mailing) Andrea Bersani (tecnologo, tempo determinato) sviluppo servizi centrali in ambiente linux attivita’ CCR (cloud) user support (linux/MacOsX) 18

Personale Afferente (II) Paolo Lantero (CTER, in congedo) Francesco Saffioti (CTER) manutenzione e sviluppo sistemi centrali e servizi Windows print service manutenzione e sviluppo rete locale installazioni e distribuzione software user support (hardware e in ambiente Windows) manutenzione infrastrutture analisi per implementazione di un sistema di ticket Enrico Salvo (CTER, tempo determinato) user support sviluppo servizi web (joomla, wiki, ticket) auth* (migrazione Kerberos/LDAP) 19

Attivita’ future Attivita’ previste in particolare su infrastrutture e rete sviluppo servizi centrali calcolo parallelo attivita’ R&D (cloud computing, cloud storage) 20

Infrastruttura Connessione impianto anti incendio di SM con la centralina di dipartimento, e trasferimento della manutenzione a carico dell’ateneo Upgrade linee utenze a 1 Gbps con uplink a 10 Gbps dipende dai finanziamenti di CCR per il 2016 Potenziamento rete wireless in punti critici (PF5) definire politiche di convivenza con altre infrastrutture 21

Servizi centrali Virtualizzazione espansione a 3 nodi da 256 GB di RAM ciascuno migrazione su oVirt del 95% dei servizi Posta elettronica: configurazione imap server ridondato Autenticazione: migrazione verso piattaforma basata su Kerberos/LDAP implementare i server con migrazione trasparente dell’utenza sui nuovi db migrare gradualmente i servizi sulla nuova infrastruttura AA mantenere compatibilita’ con AAI (ove possibile) Introduzione di un sistema di ticket per le richieste di supporto Riscrivere interamente il sito del servizio calcolo 22

Supporto al calcolo scientifico Tier3 (Grid) manutenzione del sito (interventi i ripristino funzionalita’, upgrade middleware) Farm centrale upgrade LSF ultima release (supporto GPU/Phi) test di funzionalita’ di HTCondor (alternativa a LSF) Farm HPC: configurazione condivisione delle risorse (fail sharing) Calcolo parallelo su coprocessore approfondire competenze sull’utilizzo di coprocessori (GPU/Phi) supporto alle attivita’ proposte per i finanziamenti San Paolo (Big-DASH,Ocapie) 23

CCR Installazione del mail relay secondario di posta dell’INFN (con funzioni di backup per i mail relay delle sedi) che sara’ ospitato dalla sezione di Genova Attivita’ di R&D sulla funzionalita’ e prestazioni dei componenti di cloud storage (comparazione tra backend CEPH e GPFS) e network node in una installazione di OpenStack in configurazione di produzone 24

Cloud computing Identificazione di una soluzione di cloud storage per gli utenti della sezione, test e messa in produzione Installazione di una soluzione di cloud computing preferibilmente OpenStack per mantenere compatibilita’ con le scelte tecnologiche del gruppo di CCR obiettivo e’ rendere maggiormente flessibile e fruibile la potenza di calcolo delle diverse farm locali futura integrazione con la cloud federata sviluppata in ambito CCR 25