Sistema di Monitoraggio Integrato Paolo Mastroserio, Gennaro Tortone, Silvio Pardi Presenta per il gruppo Silvio Pardi.

Slides:



Advertisements
Presentazioni simili
Amministrazione dei servizi di stampa. Sommario Introduzione ai servizi di stampa Introduzione ai servizi di stampa Terminologia della stampa Terminologia.
Advertisements

VIA GIULIO RATTI, CREMONA – Tel. 0372/27524
IlTrovatore S.p.a. IlTrovatore RemoteSearch IlTrovatore mette a disposizione di portali Internet, piccole e medie imprese, tutto il suo know-how nel settore.
1 Introduzione ai calcolatori Parte II Software di base.
AVVIARE IL COMPUTER WINDOWS ‘98 Queta fase è definita BOOTSTRAP
Gestione dei laboratori Come rendere sicura la navigazione internet e l'uso della rete Lorenzo Nazario.
RETI INFORMATICHE.
IL NOSTRO LABORATORIO. Di INFORMATICA.. Presentazione: Nel nostro laboratorio abbiamo 24 postazioni con dei computer di tipo Desktop con queste caratteristiche:
IL NOSTRO LABORATORIO. Di INFORMATICA..
IL NOSTRO LABORATORIO. Di INFORMATICA.. Presentazione: Nel nostro laboratorio abbiamo 24 postazioni con dei computer di tipo Desktop con queste caratteristiche:
Protezione dai disastri. Sommario I disastri in una rete I disastri in una rete Disastri hardware e software Disastri hardware e software Il ruolo di.
Ospedale Pistoia ASL 3 Pistoia
Il Software: Obiettivi Programmare direttamente la macchina hardware è molto difficile: lutente dovrebbe conoscere lorganizzazione fisica del computer.
NetSaint: una soluzione OpenSource per il network monitoring
CSN1 2 Aprile 2003 P. Morettini 1 Relazione sulla CCR La riunione di Commissione Calcolo e Reti del 6 Marzo è stata in parte dedicata alla discussione.
JavaScript Laboratorio di Applicazioni Informatiche II mod. A.
1 STATO DELLINTEGRAZIONE TRA I 4 PROGETTI AVVISO 1575/2004 ATTIVITA DEL GRUPPO TECNICO OPERATIVO Riunione del Comitato Tecnico sullInteroperabilità MUR,
Aspetti critici rete LAN e WAN per i Tier-2
Gestione di Progetti Software 2 (A.A. 2004/2005) - Lezione 2 1 JAVA: obiettivi di progetto del linguaggio Nota storica: Il linguaggio JAVA (inizialmente.
Struttura dei sistemi operativi (panoramica)
2) Sistemi operativi Lab. Calc. AA2004/05 - cap.2.
Informatica per medici
Reti di Calcolatori L-S Un Sistema Decentrato di Allocazione del Carico per Applicazioni di Calcolo Distribuito Mauro Bampo.
TASK 2: Ftp Partecipanti A. Chierici INFN-CNAF T. Ferrari A. Forte INFN-TO L. Gaido S. Lusso P. Mastroserio INFN-NA G. Tortone Coordinatori A. Forte, G.
LNL M.Biasotto, Bologna, 13 dicembre Installazione automatica Massimo Biasotto – INFN LNL.
Grid monitoring: sviluppi futuri
Il sistema integrato per la sicurezza dei tuoi dati da attacchi interni alla rete Quanti software proteggono i tuoi dati dagli attacchi esterni alla rete?
MODULO 01 Unità didattica 04
Modulo 1 - Hardware u.d. 3 (syllabus – 1.3.5)
Modulo 1 - Concetti di base della Tecnologia dell'Informazione
La rete di istituto Maninder Bansal 5Bz Vital Ivo 5Bz Anno scolastico 2005/06.
VIRTUALIZZAZIONE Docente: Marco Sechi Modulo 1.
Soluzione per la gestione
Il modello di riferimento OSI
Servizi Grid ed agenti mobili : un ambiente di sviluppo e delivering
Networking Specialist
C. Aiftimiei 1, S. Andreozzi 2, S. Dal Pra 1, G. Donvito 3, S. Fantinel 4, E. Fattibene 2, G. Cuscela 3, G. P. Maggi 3, G. Misurelli 2, A. Pierro 3 1 INFN-Padova.
Creato da Riccardo Nuzzone
10 azioni per lo scheduling su Grid Uno scheduler per Grid deve selezionare le risorse in un ambiente dove non ha il controllo diretto delle risorse locali,
Test Storage Resource Manager per SC4 Giacinto Donvito Vincenzo Spinoso.
Temp Sentry: un sistema di rilevazione dati ambientali Guerra Alberto INFN-Sezione di Roma, P.le Aldo Moro, 2, I Roma, Italy Introduzione Il sistema.
Attivita' Grid in BaBar Workshop sulle Problematiche di Calcolo e Reti nell'INFN Maggio 2004.
INFN & sicurezza: aspetti legali Roberto Cecchini Paestum, 11 Giugno 2003.
Il software Componente del computer costituita dai: –programmi di base per la gestione del sistema –programmi applicativi per l’uso del sistema Queste.
Registrazione degli ospiti INFN e gestione del database via web M.Corosu, A.Brunengo INFN Sezione di Genova Linguaggio di programmazione: perl Web server:
Livello 3 Network (Rete)
SnippetSearch Database di snippet bilanciato e replicato di Gianluigi Salvi Reti di calcolatori LS – Prof. A.Corradi.
Io ho voluto dimostrarlo attraverso una delle mie passioni:
Luca Tampieri - INFN Firenze1 Intrusion Detection Systems Cosa sono gli Intrusion Detection Systems (IDS) e a cosa servono Snort Demarc, Acid e SnortSnarf.
La Farm di Alice a Torino Workshop sulle problematiche di calcolo e reti Isola d’Elba 6-9 maggio 2002 Mario Sitta (Università del Piemonte Orientale e.
GESTIONE RETI TCP/IP l troubleshooting è necessario per risolvere molti problemi che si possono verificare all'interno di una rete, una delle aspirazioni.
Riunione CCR 21/12/2005 Gruppo Storage Relazione sulla analisi di infrastrutture Fibre Channel e presentazione attivita’ per il 2006 Alessandro Brunengo.
Sintesi da pag. 8 a pag. 21. L’ Informatica è la scienza che studia il trattamento automatico dell’informazione. Deriva dal francese «Informatique»
I Sistemi Operativi. Che cosa sono? Il sistema operativo è un software di base che fa funzionare il computer. I Sistemi operativi più importanti sono:
I Sistemi Operativi. Definizione Per Sistemi Operativi (di seguito SO) si intendono quei pacchetti software, a loro volta costituiti da più sottoprogrammi.
I sistemi operativi Funzioni principali e caratteristiche.
CNAF 6 Novembre Layout del testbed  wn a OS SL5.0 8 GB RAM kernel xen_3.1.0 SMP  wn a OS SL5.0 8 GB RAM kernel.
Implementazioni di un analizzatore di protocollo Esistono quattro fondamentali tradeoff per la realizzazione di un analizzatore di protocollo:  Analisi.
Roberto Covati – Roberto Alfieri INFN di Parma. Incontri di lavoro CCR dicembre Sommario VmWare Server (in produzione dal 2004) VmWare ESX.
La Famiglia di Prodotti Network Analyzer. L’analizzatore J6801A DNA è un probe di cattura dati ultra leggero che comprende un sistema di acquisizione.
Riunione PRIN STOA - Bologna - 18 Giugno 2014 Testbed del T2 distribuito Napoli-Roma Dr. Silvio Pardi INFN-Napoli Riunione PRIN STOA – Bologna 18 Giugno.
Sistema di monitoraggio integrato Introduzione a cura di P. Mastroserio Servizio Calcolo & Reti Infn-Napoli P. Mastroserio Workshop CCR - INFN Grid Acireale.
Attività e servizi di calcolo a Roma Tor Vergata R. Kwatera, R. Lulli, R. Sparvoli Roma Tor Vergata.
Riunione gruppo reti E. P.. IPMI Porta da mascherare sul router Scan IPMI e piano di indirizzamento (privato ?) Da fare nel piano generale quando si ha.
Triggers and actions L’inizializzazione di un trigger permette di avviare delle azioni automatiche a partire da eventi significativi. Possibili azioni.
FatIn: Fatturazione Interventi Applicazione di facile utilizzo che permette la prenotazione, la gestione e la fatturazione di interventi e prestazioni.
G. Maggi 24/1/2006 Il Progetto del TIER2 di Bari Giorgio Maggi.
1 Le macchine di questo pool fanno parte di una lan privata (la 125 illustrata a pag.2), di cui t2cmcondor è il gateway. Sono presenti 3 macchine su rete.
La gestione della rete e dei server. Lista delle attività  Organizzare la rete  Configurare i servizi di base  Creare gli utenti e i gruppi  Condividere.
Transcript della presentazione:

Sistema di Monitoraggio Integrato Paolo Mastroserio, Gennaro Tortone, Silvio Pardi Presenta per il gruppo Silvio Pardi

ANALISI DEL PROBLEAMA INDIVIDUARE I PROTOCOLLI INDIVIDUARE I TOOLS INDIVIDUARE LA VITTIMA

DESIDERATA EFFICACIA FLESSIBILITA’: Possibilmente usare pochi tool per monitorare tutto. FACILE MANUTENZIONE: Deve aiutare l’amministratore e non mettergli bastoni tra le ruote. ROBUSTO E SCALABILITA’: L’aggiunta di servizi non deve incidere sulle prestazioni del sistema di monitoraggio ne su quelle dei sistemi stessi da monitorare. COMUNICATIVO

SOLO TECNOLOGIE MATURE

Nagios è un software per il monitoraggio di servizi e di apparti attivi. Nato nel 1999 Esso si basa su plug-in (probe) che possono essere scritti in qualsiasi linguaggio, compilato o interpretato purché rispetti la seguente convenzione all’uscita. Exit 0 – In caso si codice correttamente eseguito Exit 1 – Uscita con errore Exit 2 – Uscita con in messaggio di warning Exit 3 – Uscita con uno stato inconsistente

Nagios effettua i test implementati periodicamente secondo configurazione. Ogni test ha tre componenti fondamentali: indirizzo host: indirizzo dell' host da osservare comando: comando da eseguire per effettuare il test servizio: associa all'indirizzo host il comando da eseguire ed eventuali parametri. Una volta rilevato un problema su un dispositivo questo può essere visualizzato tramite l'interfaccia Web messa a disposizione da Nagios stesso.

I test che Nagios può effettuare (chiamati anche plugin) si possono suddividere in due categorie: a) Active checks: Test iniziati direttamente dal Nagios; Quest'ultimo decide se e quando eseguirli. b) Passive checks: Test iniziati non dal Nagios ma da applicativi esterni, i quali si dovranno far carico di comunicare al Nagios l'esito dei test effettuati. Questo tipo di test viene solitamente utilizzato nel caso (frequente) in cui l'host da controllare, solitamente coperto da firewall, non sia direttamente raggiungibile dal server su cui risiede Nagios.

Tramite il Nagios stiamo monitorando mediante il protocollo standard SNMP Lo stato di tutti gli UPS che servono la sala macchine Lo stato di tutti gli UPS degli armadi di piano Il carico di corrente sulle PDU di sala macchine e lo stato delle singole prese Tutti gli apparati di rete e il relativo traffico Lo stato di tutti i principali servizi, il load sulla CPU e sulla Memoria di tutti i server di sala macchine La raggiungibilità di tutti gli host di sala macchine

NASCONDERE LA COMPLESSITA’

CENTREON INTERFACCIA WEB PER LA CONFIGURAZIONE DI NAGIOS CONFIGURARE NAGIOS NON E’ MAI STATO COSI FACILE!

CENTREON Centreon gestisce un suo database interno nel quale salva la configurazione di host, comandi e servizi. Centreon possiede già una serie di plugins e comandi preconfigurati per monitorare server, apparati di rete e servizi. Quando tutto sembra configurato è possibile copiare tale configurazione sui file di nagios e riavviare il servizio.

AGGIUNTA DI UN HOST

AGGIUNTA DI UN COMANDO

AGGIUNTA DI UN SERVIZIO

CENTREON ASSOCIAZIONE SERVIZI -HOST

INTERFACCIA GRAFICA ALTERNATIVA PER NAGIOS

PLOT STORICI DEI DATI

TE COME LA VEDI?

Strumento di presentazione dei dati di Nagios. Consente di creare mappe sensibili sulla base dei dati forniti da Nagios e di creare un allarmistica visiva e sonora.

IL COCCO AMMUNNAT’ E BUONO

Full Automated Nagios FAN è una distribuzione di linux basata su CENTOS già preconfigurata coi seguenti tools: NAGIOS NAGVIS DATABASE PER NAGIOS CENTREON NAERTO

FRONT-END DI FAN

DESIDERATA EFFICACIA FLESSIBILITA’: Possibilmente usare pochi tools per monitorare tutto. FACILE MANUTENZIONE: Deve aiutare l’amministratore e non mettergli bastoni tra le ruote. COMUNICATIVO SCALABILITA’: L’aggiunta di servizi non deve incidere sulle prestazioni del sistema di monitoraggio ne su quelle dei sistemi stessi da monitorare.

DESIDERATA EFFICACIA FLESSIBILITA’: Possibilmente usare pochi tools per monitorare tutto. FACILE MANUTENZIONE: Deve aiutare l’amministratore e non mettergli bastoni tra le ruote. COMUNICATIVO SCALABILITA’: L’aggiunta di servizi non deve incidere sulle prestazioni del sistema di monitoraggio ne su quelle dei sistemi stessi da monitorare.

DESIDERATA EFFICACIA FLESSIBILITA’: Possibilmente usare pochi tools per monitorare tutto. FACILE MANUTENZIONE: Deve aiutare l’amministratore e non mettergli bastoni tra le ruote. COMUNICATIVO SCALABILITA’: L’aggiunta di servizi non deve incidere sulle prestazioni del sistema di monitoraggio ne su quelle dei sistemi stessi da monitorare.

DESIDERATA EFFICACIA FLESSIBILITA’: Possibilmente usare pochi tools per monitorare tutto. FACILE MANUTENZIONE: Deve aiutare l’amministratore e non mettergli bastoni tra le ruote. COMUNICATIVO SCALABILITA’: L’aggiunta di servizi non deve incidere sulle prestazioni del sistema di monitoraggio ne su quelle dei sistemi stessi da monitorare.

CONSIDERAZIONI DI SCALABILITA’ Attualmente presso la sezione di Napoli vengono monitorati 118 HOST 434 SERVIZI Il software è Installato su macchina virtuale con 2 CPU Intel(R) Xeon(R) CPU 2.66GHz RAM 4 GB DISK 30GB CentOS release 5.2 FAN 1.1

I GRAFICI SU UN ANNO MOSTRANO COME SIA LO SPAZIO DISCO OCCUPATO CHE LA CPU UTILIZZATA DAL SISTEMA DI MONITORING CONSENTONO UNA ELEVATA SCALABILTA’ DEL SISTEMA IL MONITORING DEL MONITORIG

CACTI SOFTWARE PER ANALISI DEL NETWORK CACTI OFFRE UN SISTEMA DI MONITORAGGIO SIMILE A NAGIOS INTEGRANDO UN TOOLS PER LA CREAZIONE DI MAPPE MENO VERSATILE DI NAGIOS E VERTICALIZZATO PER LE APPLICAZIONI DI RETE

LA RETE DELLA SEZION INFN DI NAPOLI E DEL DIPARTIMENTO DI FISICA

IL MONITORAGGIO COME STRUMENTO DI INDAGINE

CASO 1 LA RETE DI ATLAS

VECCHIA RETE DEL TIER2 DI ATLAS – LINK SATURATI DAL GRIDFTP IMPEDISCONO LE NORMALI OPERAZIONI DI ACCESSO AI SERVER E SERVIZI DI CENTRO CALCOLO

OCCUPAZIONE DELLA RETE SUL ROUTER GARR DI SEZIONE PROBLEMI SULLA LAN PER LE MACCHINE DI ATLAS PROBLEMI PER GLI ALTRI ESPERIMENTI DURATE L’ACCESSO A DATI DISTRIBUITI PACKET LOSS SULLA RETE PROBLEMI SU TEST SAM DI GRID

SOLUZIONE NUOVO LINK A 1GB DEDICATO PER LE ESIGENZE DEL TIER2

IL ROUTER DI SEZIONE PRIMA E DOPO

DALL’ANALISI DEI LOG TOCCHIAMO CON MANO LE PERFORMANCE DEL GRIDFTP. E’ COSI AGGRESSIVO DA OCCUPARE TUTTA LA BANDA DISPONIBILE PER EVITARE CHE I JOB SAM FALLISCANO PONIAMO UN LIMITE MASSIMO TRAMITE TRAFFIC SHAPING SUL ROUTER ATLAS IL SISTEMA DI MONITORAGGIO MOSTRA COME DURANTE I TRASFERIMENTI GRIDFTP LA BANDA NON VIENE SATURATA DELTUTTO

CASO 2 PROBLEMI DI RETE IN SEZIONE

CASO 3 BILANCIAMENTO SULLE FASI DELL’UPS DI SALA MACCHINE

APPENA MONITORIAMO L’UPS 20KVA DI SALA MACCHINE SCOPRIAMO CHE CI SONO DEGLI SBILANCIAMENTI SULLE FASI E DEGLI SPRECHI CHE NE RIDUCONO L’AUTONOMIA QUESTO SPINGE A RIVEDERE L’IMPIANTO ELETTRICO DI SALA MACCHINE

DOPO UN INTENSO LAVORO IL SISTEMA DI MONITORAGGIO CI DA SODDISFAZIONE RESTITUENDOCI LE FASI BILANCIATE E UNA MAGIORE AUTONOMIA

CASO 4 PROBLEMI SULLE BATTERIE DEGLI UPS

APPENA COMINCIAMO A MONITORARE GLI UPS SCOPRIAMO DEI PROBLEMI INASPETTATI SULLE BATTERIE

SPUNTI PER IL GRID IN AMBITO GRID E’ ATTUALMENTE IN CIRCOLO UNA VERSIONE DI NAGIOS, CHIAMATA SITE- NAGIOS CHE CONFIGURA UNA INSTANZA DEL SOFTWARE DI MONITORAGGIO SPECIFICA PER IL GRID. L’Installazione prevede una UI, il Nagios e degli script che sincronizzano la configurazione del nagios in base alla variazione dei test SAM

SPUNTI PER IL GRID IL NAGIOS DI SITO SI INSTALLA TRAMITE YUM. L’INSTALLAZIONE SEBBENE “STANDARD” PER LA RELEASE DI GRID RISULTA COMUNQUE NON DELTUTTO IMMEDIATA. IL NAGIOS DI SITO E’ CONFIGURATO AD HOC PER IL GRID MA POTREBBE ESSERE UNO STRUMENTO UTILE ANCHE PER ALTRI SERVIZI

ATTIVITA’ PROPOSTA FARE IL PORTING SU CENTREON DEI TEST DI NAGIOS E CREARE UNA SORTA DI FAN ESTESA UNA ISO CHE ABBIA AL SUO INTERNO I PACKAGE DELLA USER INTERFACE, PIU’ I TEST PRECONFIGURATI PER IL GRID. Obiettivo: Creare un prodotto che possa essere di reale utilizzo per i site-mangaer e non spinga solo la proliferazione dei tools

CONCLUSIONI I TRE PRODOTTI OPENSOURCE NAGIOS, CENTREON e NAGVIS UTILIZZATI INSIEME CONSENTONO DI CREARE STRUMENTI DI ALLARMISTICA EFFICACI, FLESSIBILI, FACILI DA MANUTENERE E CON UNA SCALABILITA’ ADEGUATA PER I SERVIZI DI UNA SEZIONE GRANDE COME QUELLA DI NAPOLI – 80 DIPENDENTI INFN E PIU DI 800 ASSOCIATI DEL DIPARTIMENTO DI FISICA DELLA FEDERICO II.

CONCLUSIONI FAN - Full Automated Nagios è un ottima soluzione per chi deve iniziare da zero o per chi volesse migrare da un Nagios vecchio. Invito a provarlo su una macchina di test, è possibile installare e configurare i primi test nell’arco di mezza giornata o anche meno.

RIFERIMENTI FAN - NAGIOS - CENTREON – NAGVIS – CACTI -