Sistema di monitoraggio integrato Introduzione a cura di P. Mastroserio Servizio Calcolo & Reti Infn-Napoli P. Mastroserio Workshop CCR - INFN Grid Acireale – 17 maggio 2010
Le attività del Servizio Calcolo e Reti Sedi M.S.Angelo Polo di Ingegneria Hardware Più di 15 rack di periferia con altrettanti UPS Circa 50 switch di rete Circa 40 server centrali tra macchine attive e di riserva Software Public login, public farm, mail, web, printserver, rete, grid, ecc. Grid Tier2 di Atlas Campus Grid (più di 10 Farm) Utenti Circa 1000 utenti tra ricercatori, docenti, non docenti, studenti ecc Circa 1500 indirizzi IP assegnati all’utenza tra computer desktop e farm e relativo supporto Sala utenti Stampanti dipartimentali Personale Il responsabile N. 6 collaboratori N. 1 unità fornita da ditta esterna per il supporto agli utenti P. Mastroserio Workshop CCR - INFN Grid Acireale – 17 maggio 2010
Perché un sistema di monitoraggio Difficoltà di tenere a mente tutti i servizi forniti e l’infrastruttura sottostante Incremento continuo sia quantitativo che qualitativo delle problematiche da affrontare Difficoltà nel racchiudere in una sola persona tutte le competenze necessarie per gestire il Servizio P. Mastroserio Workshop CCR - INFN Grid Acireale – 17 maggio 2010
La ricerca guasti Strani e improvvisi guasti dell’impianto elettrico Strane e improvvise congestioni della rete locale Strani e improvvisi guasti hardware dei server dipartimentali Strani e improvvisi problemi software dei server dipartimentali Difficoltà nell’individuare velocemente le cause di un guasto (da non trascurare le segnalazioni fuorvianti da parte dell’utenza) P. Mastroserio Workshop CCR - INFN Grid Acireale – 17 maggio 2010
Interruzioni programmate del Servizio Difficoltà nell’eseguire in maniera rapida e indolore le operazioni di reboot dopo gli shutdown delle macchine centrali dovute ad attività di manutenzione Pianificazione ed effettuazione di shutdown e reboot automatizzati anche da remoto P. Mastroserio Workshop CCR - INFN Grid Acireale – 17 maggio 2010
Il VOIP Se la rete telematica funziona allora funziona anche il telefono … P. Mastroserio Workshop CCR - INFN Grid Acireale – 17 maggio 2010
Visione di insieme dello stato del Servizio P. Mastroserio Workshop CCR - INFN Grid Acireale – 17 maggio 2010
Valutazione oggettiva del Servizio Esigenza di uno strumento in grado di individuare punti deboli (non necessariamente dei guasti) al fine di migliorare i servizi e decidere in che direzione investire Bisogno di elementi oggettivi per valutare nel tempo la qualità dei servizi offerti sia per quanto riguarda l’hardware che il software P. Mastroserio Workshop CCR - INFN Grid Acireale – 17 maggio 2010
C’è ancora molto da fare … Maggiore granularità nel monitoraggio dei singoli servizi software Maggiore granularità nel monitoraggio dell’hardware (temperature cpu, funzionamento dei sistemi di raffreddamento, ram, dischi…) Statistiche sulla qualità dei servizi offerti Inventario intelligente con scadenziere (garanzie, manutenzioni, sostituzione di server, switch e quant’altro vecchi, ecc.) P. Mastroserio Workshop CCR - INFN Grid Acireale – 17 maggio 2010
Stanno realizzando il sistema di monitoraggio: Gennaro Tortone Silvio Pardi P. Mastroserio Workshop CCR - INFN Grid Acireale – 17 maggio 2010