Domenico Diacono CNAF 22 Marzo 2006

Slides:



Advertisements
Presentazioni simili
1 CCL – Referenti P. Mazzanti 28 Febbraio Personale. A. Bassi (Tempo parziale: 1/3) D. Bortolotti F. Brasolin P. Calligola (Tempo parziale 3/4)
Advertisements

RHCS XEN Cluster Dael Maselli – Workshop CCR – Maggio 2009.
Dael Maselli – Workshop CCR – Maggio  SAN  Red Hat Cluster Suite ◦ RedHat Enterprise, Scientific Linux o CentOS  XEN.
Roberto Covati – Roberto Alfieri INFN di Parma. Incontri di lavoro CCR dicembre Sommario VmWare Server (in produzione dal 2004) VmWare ESX.
Servizio posta Situazione al 27/09/2012 Marco De Rossi Marco Esposito Antonio Forte.
Riccardo Veraldi, CCR Dic 2008 Xen Problematiche sulla virtualizzazione.
Dipartimento di Ingegneria elettrica, elettronica e informatica - LAUREA IN INGEGNERIA INFORMATICA, C. GRECO 23/11/2011 S YSTEM R ECOVERY E A FFIDABILITÀ.
Attività e servizi di calcolo a Roma Tor Vergata R. Kwatera, R. Lulli, R. Sparvoli Roma Tor Vergata.
Progetto iSCSI Report alla CCR 12-13/12/2006 Alessandro Tirel – Sezione di Trieste.
Posta elettronica me & mdr. Macchine SMTP – postino3/postino4 (postinomx) – postinoauth1 (smtp) IMAP – mailboxvm (mailbox) Altri servizi: web e mailing.
20-21/03/2006Workshop sullo storage - CNAF Storage nei Servizi Calcolo delle sezioni INFN Alessandro Brunengo.
Studio preliminare di IMAP e stato dei servizi di posta A cura del gruppo Mailing INFN CCR, 31 maggio 2007 Hanno contribuito a questo lavoro: Roberto Cecchini,
CCR, LNF ott 2011 Proposte assegnazioni server & storage L. Carbone, A. Gianoli, M. Serra.
Panoramica su Koozali SME Server Distribuzione Linux open source, stabile, sicura e versatile rivolta alle Piccole e Medie imprese (Novembrer 2015 v1.2)
Sistema Informativo. Mansioni Gestione della piattaforma hardware e sistemistica del sistema informativo INFN In realta’ il mansionario e’ in continua.
MUSE BT - CLIENT Music Everywhere BlueTooth progetto Client Acquaviva Luca Reti di Calcolatori LS AA
I dispositivi di rete. La Scheda Di Rete La scheda di rete, o LAN adapter è un circuito stampato che collega il cavo per il collegamento internet al PC.
Il sistema SIEMECA A.Brocca. Struttura del sistema Il sistema SIEMECA Il network si compone di:  Misuratori: inviano telegrammi dati o di installazione.
1 14 marzo 2006 sommaruga andrea Fondazione Ordine Ingegneri di Milano VPN: Reti Private Virtuali VPN: RETI PRIVATE VIRTUALI LE POSSIBILITA' DI ACCESSO.
RAID Redundant Array of Inexpensive Disks Che cos'è Perché si usa Come funziona I tipi (principali) di RAID.
Gabriele Cerami, Cluster di server ad alta disponibilita' con Pacemaker Bologna, ERLUG: Emilia Romagna Linux Users Group - erlug.linux.it 1.
FileSystem Distribuiti LinuxTrent - 07/07/2011. Cos'è un filesystem distribuito ? Un file system distribuito (in inglese, Distributed File System, o DFS)
Logical Volume Manager 2 Che cos'è Perchè si usa Come funziona Comandi principali.
Alma Mater Studiorum - Università di Bologna Facoltà di Scienze Matematiche Fisiche e Naturali Dipartimento di Scienze dell’Informazione Supporto al multihoming.
1 Virtualizzazione con KVM su sistemi operativi Ubuntu Francesco Stablum Studente di Informatica, sviluppatore software, talvolta sistemista.
Orientamento. Il Kernel Il Kernel è un programma scritto in linguaggio vicino all'hardware che ha il compito di fornire ai processi in esecuzione sul.
User Mode Linux. Cos'è user mode linux ● User mode linux è un kernel linux che gira come un'applicazione nello spazio utente.
Sezione propedeutica Le topologie di rete fondamentali.
Qmail - HA Qmail in configurazione High Availability Daniele Duca
Architetture p2p di supporto a servizi VoIP su dispositivi mobili Relatore: Dott. Vittorio Ghini Presentanta da : Renzi Federica Matr
20-21/03/2006Workshop sullo storage - CNAF Alessandro Brunengo.
Reti e comunicazione Appunti.
Sistemi e Applicazioni per l’Amministrazione Digitale
Infrastruttura cloud servizi realizzata nella Sezione di Napoli
Configurazione Router IR794- IG601
NAT, Firewall, Proxy Processi applicativi.
Riccardo Veraldi - Massimo Donatelli CCR 3-4 Marzo 2008
Resoconto delle attività del Gruppo di Lavoro DR
Comparazione File System Domenico Chiefali a.k.a. JDaemon
dCache Test effettuati al CNAF
Monitoring e loadbalancing dei servizi Grid
Servizio Calcolo e Reti
HackLab Catanzaro Installazione DEBIAN Lezione 2
Applicazione web basata su web service e web socket
Breve report su corso RedHat Enterprise Virtualization (RH318)
Cloud per HA nei Servizi
Analysis framework of distributed thread and malware data-sources
INTRODUZIONE AL NETWORKING
La configurazione dei sistemi in rete
Persistent Storage Provisioning
Aggiornamento sullo stato del Tier-2 di Catania
Portal Architecture Data Management
Topologia delle reti Appunti.
Configurare e gestire un server di posta
Condivisione Documentazione Tecnica
Sviluppo di server web e sistema di caching per contenuti dinamici
R.Gomezel Commissione Calcolo e Reti CNAF
Serie CTI 2500® I/O Compact.
Creare un server casalingo - 5
Istruzioni per gli amministratori
Organizzazione di una rete Windows 2000
Concetti introduttivi
© 2007 SEI-Società Editrice Internazionale, Apogeo
Le reti informatiche di Roberto Minotti 17/01/2019.
Le reti informatiche di Roberto Minotti 15/02/2019.
File System ed Input/Output
Serie CTI 2500® I/O Compact.
Job Management Systems ovvero
IA2 Massimo Sponza IA2 – Osservatorio Astronomico di Trieste 2018 ICT Workshop - Catania.
Parti interne del computer
Transcript della presentazione:

Domenico Diacono CNAF 22 Marzo 2006 Cluster Linux HA Domenico Diacono CNAF 22 Marzo 2006

Argomenti Descrizione cluster HA Esperienze in produzione Pro e contro

Il funzionamento in breve LAN Collegamento alla LAN DRBD0 Partizione dedicata al cluster su device RAID 5 EIDE (o SATA) DRBD0 Spazio disco replicato sul secondo nodo Servizi in HA caso DNS: DRBD IP Named Mon Webmin DNS La slide verrà spiegata a voce RELAY Seriale Secondo servizio su un’altra parti- zione condivisa DRBD1 DRBD1 Channel bonding Collegamento interno tra i due nodi, via ethernet e seriale

Il funzionamento in breve LAN DRBD0 DRBD0 DNS La slide verrà spiegata a voce RELAY Seriale DRBD1 DRBD1 Channel bonding

Lo spazio disco: DRBD Distributed Replicated Block Device (DRBD) Protocollo C: il segnale di conclusione dell'operazione di I/O sul nodo primario viene inviato al SO operativo solo quando il nodo secondario comunica di aver terminato la sua operazione di scrittura, quando cioè i dati sono stati fisicamente replicati (Mirror via rete) /proc/drbd

Lo spazio disco: LVM Logical Volume Management filter = [ "a/drbd.*/" , "r/.*/" ] types = [ "drbd", 16 ] Permette, montato su DRBD, di ottenere le “snapshot” per il backup del sistema. Su LVM si crea il filesystem.

Lo spazio disco: Channel Bonding Due interfacce di rete agiscono come una sola interfaccia, in questo caso duplicando il segnale su due cavi: fault-tolerance (broadcast) /usr/src/linux/Documentation/network/ifenslave.c /proc/net/bonding/bond0 Questa connessione è vitale.

Lo spazio disco: il filesystem Molto tempo perso inutilmente per i test di performance. DRBD introduce un certo overhead, quantificabile in circa 30% in scrittura, su ext3. MA con una mailbox di prova l'apertura via web-mail della INBOX con 4000 mail necessita, dal login alla visualizzazione della prima pagina di 25 sec con Ext3, 2 sec con XFS, 4 sec con JFS e 3 sec con Reiserfs.

Gestione del cluster: Heartbeat Controlla lo stato fisico delle macchine ma non dei servizi. In caso di failure sposta un resource group Es: poffice2 drbddisk::mail lvm Filesystem::/dev/mail0::/mail0::xfs IPaddr::192.135.10.19/24/eth3 postfix saslauthd cyrus stunnel2 apache2 mailman imapproxy mon stunnelgate Pericolo Split-Brain: STONITH? Canali di comunicazione ridondati: 3(+1) sul DNS, 5(+1) sul server imap

Gestione del cluster: IpFail Tecnicamente un plugin di Heartbeat. Controlla la raggiungibilità dell’host attraverso la interfaccia pubblica. Il resource group vien migrato se l’host esterno non viene più visto E il nodo secondario ha un ping count maggiore. In situazioni “estreme” può sbagliare.

Installare i servizi Creare dal nodo primario una directory nel device DRBD+LVM che contenga i file di configurazione e dati del servizio. Ad esempio: cp -a /etc/postfix /mail0/etc/postfix. Eliminare la directory di configurazione originale e sostituirla con un softlink alla directory condivisa.

Monitor dei servizi: MON Un servizio può bloccarsi anche se la macchina funziona. MON è molto flessibile. Ad esempio sui miei cluster tenta prima il riavvio, poi sposta il resource group. E’ possibile monitorare separatamente i vari servizi che compongono il resource-group, e cambiare l’azione da intraprendere a seconda del nodo sul quale si trovano.

MON watch serviziCritici service smtp_check interval 15s monitor smtp3.monitor -t 70 -T 30 period wd {Sun-Sat} hr {0-23} alertafter 3 alert mail.alert -S "Attenzione! postfix non risponde" postmaster@ba.infn.it alert postfixError.alert service smtp_takeover interval 120s alertafter 3 30m numalerts 1 alert mail.alert -S "Attenzione! postfix non risponde ancora: lo migro!" postmaster@ba.infn.it alert postfixTakeover.alert watch serviziSecondariImap service imap_check interval 2m monitor imap.monitor alertevery 10m alert mail.alert -S "Attenzione! Cyrus-imap non risponde" postmaster@ba.infn.it alert imapError.alert

Pros and Cons PROS: Facile da installare e FUNZIONA!  La manutenzione delle macchine è enormemente semplificata Costa poco (anche niente se AA). Nessuna modifica del kernel CONS: Scarsa scalabilità: progettazione critica Necessaria molta attenzione nell’allineare le due macchine. Nessun isolamento dei servizi

RIFERIMENTI http://www.ba.infn.it/calcolo/documenti/Cluster.html http://www.drbd.org/ http://sourceware.org/lvm2/ http://sourceforge.net/projects/bonding http://www.linux-ha.org/ http://www.kernel.org/software/mon/