Benigno Gobbo – INFN Trieste 1 CSN1 13 ottobre 2003 Obsolescenza dei PC Riunione CSN1 Roma, 13 ottobre 2003 Benigno Gobbo INFN Sezione di Trieste

Slides:



Advertisements
Presentazioni simili
Come scegliere un computer?
Advertisements

Il Computer.
Gli hard disk.
IL GENIO DELLA PORTA ACCANTO.
CSN1 22 Settembre 2003 P. Morettini 1 Manutenzione mezzi di calcolo Manutenzioni Le novità del mercato I consigli per gli acquisti.
Glossario. AGP Accelerated Graphics Port: architettura di bus che permette alle schede grafiche laccesso diretto al bus di sitema (fino a 100MHz), invece.
WP 2.4 al Cnaf Cnaf 13/11/00 P.M Hardware: - 12 PC Rack mountable IBM XSeries 330 (1U) 2 processori Pentium III 800 Mhz, FSB 133 Mhz 512 MB Mem Ecc, Controller.
3. Architettura Vengono descritte le principali componenti hardware di un calcolatore.
Tecnico hardware Di Adone Amaddeo
Linux Riunione Referenti-CCL 2-Luglio Utilizzo di Linux Principale (unica) piattaforma di calcolo per HEP Grid Supportato dalle maggiori industrie.
Michele Michelotto INFN-Padova
LNL M.Biasotto, Bologna, 13 dicembre La farm di Legnaro Massimo Biasotto – INFN LNL.
Execution benchmarks Obiettivi Test dettagliati e ben caratterizzati Esecuzione di benchmark standard Test di applicazioni dell'esperimento ALICE 20 Novembre.
LNL M.Biasotto, Bologna, 18 ottobre La farm CMS di Padova - Legnaro Proposta di acquisto hardware 2° semestre 2001.
LNL M.Biasotto, Bologna, 19 marzo La farm CMS di Padova - Legnaro Proposta di acquisto hardware 1° semestre 2001.
LNL CMS M.Biasotto, Firenze, 22 maggio Hardware e tools di installazione Massimo Biasotto INFN – Lab. Naz. di Legnaro.
5 Feb 2002Stefano Belforte – INFN Trieste calcolo per CDF in Italia1 Calcolo per CDF in Italia Prime idee per lanalisi di CDF al CNAF Numeri utili e concetti.
Come è fatto un computer
GIADA O N L I N E.
Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17 settembre 2002 Benigno Gobbo INFN Sezione di Trieste
Il Calcolatore Elettronico
L'ambiente informatico: Hardware e Software
COME È FATTO UN COMPUTER
Modulo 1 - Concetti di base della Tecnologia dell'Informazione
Benigno Gobbo – INFN Trieste 1 CSNI 21 maggio 2001 Stato della farm di COMPASS-TS CSNI Roma, 21 maggio 2001 Benigno Gobbo INFN Trieste
Tratto da “HW PC” – O. Maeran
Stefano Zani e Pierpaolo Ricci (INFN CNAF)
CORSO D’INFORMATICA AVANZATO
1 Collaboration Server “La collaborazione verso il successo” Che cosa è un Collaboration Server? A cosa mi può servire?
Works in progress.  Semplificazione e maggiore efficienza della gestione  Risparmio (nel medio periodo)  Riallocazione delle risorse (hardware e timesheet)
Manutenzioni e Mezzi di Calcolo Paolo Morettini – INFN Genova Valerio Vercesi – INFN Pavia CSN1 - Catania Settembre 2002.
Riunione gruppo storage – Roma 05/05/2005 Test di affidabilita’ e performance a Genova Alessandro Brunengo.
Extreme Cluster Administration Toolkit Alberto Crescente, INFN Sez. Padova.
6 Febbraio 2006CSN1 - Roma1 MEG : relazione dei referees P. Cenci R. Contri P. Morettini M. Sozzi.
LNL CMS M.Biasotto, Roma, 22 novembre I Tier2 in CMS Italia Massimo Biasotto - LNL.
Calcolo LHC - F. Ferroni, P. Lubrano, M. SozziCSN1 - Catania Calcolo LHC 2003 (F. Ferroni, P. Lubrano, M. Sozzi)
LNF Farm E. V. 9/8/2006. Hardware CE, LCFG, HLR, 3 WN: DL 360 1U; SE: DL 380 2U 5 WN: BL 25 P In totale 25 jobs general purpuse (coda Atlas) + una coda.
CSN1 2 Febbraio 2004 P. Morettini 1 La nuova politica di RedHat La linea di prodotti RedHat Enterprise Linux L’accordo HEP Europe – RedHat Che fare ?
Luglio 2004Accesso al Disco Fisso1 Velocità di accesso al disco fisso.
Tecnologie dell'informazione e della comunicazione - Stacey S. Sawyer, Brian K. Williams Copyright © The McGraw-Hill Companies srl Introduzione.
Io ho voluto dimostrarlo attraverso una delle mie passioni:
Istituto Nazionale di Fisica Nucleare La Biodola, Isola d’Elba, 6-9 maggio 2002 AFS: Status Report WS CCR R.Gomezel Workshop sulle problematiche.
Alessandro Tirel - Sezione di Trieste Storage Area Network Riunione gruppo Storage Padova, 5 ottobre 2005.
15/05/2007CSN1 Roma Presidenza1 KLOE: referee* KLOE Calcolo (referee calcolo) KLOE2 Tabelle con proposte di assegnazione * M. Livan, P. Paolucci, P.C.
La Farm di Atlas a Roma 1 Outline Architettura della farm Architettura della farm Installazione Installazione Monitoring Monitoring Conclusioni Conclusioni.
La Farm di Alice a Torino Workshop sulle problematiche di calcolo e reti Isola d’Elba 6-9 maggio 2002 Mario Sitta (Università del Piemonte Orientale e.
LNL CMS M.Biasotto, Bologna, 28 maggio Upgrade farm a RH-7.3  Due anni fa la farm era stata installata usando una versione customizzata di ANIS.
M.Biasotto, Bologna, 28 giugno 2004 M.Biasotto, Bologna, 28 giugno LNL CMS T2 Legnaro Stato attuale e richieste 2004/2005.
Istituto Comprensivo di Livigno BENVENUTI. Clemente Silvestri FONDAMENTI DI INFORMATICA.
Sintesi da pag. 8 a pag. 21. L’ Informatica è la scienza che studia il trattamento automatico dell’informazione. Deriva dal francese «Informatique»
I Sistemi Operativi. Che cosa sono? Il sistema operativo è un software di base che fa funzionare il computer. I Sistemi operativi più importanti sono:
Informatica di base giugno 2007.
Nuovo Ambiente CS7402. Attività Principali Gli obiettivi principali della migrazione sono stati quelli di ottenere: –Un’infrastruttura di produzione (Mainframe.
I sistemi operativi Funzioni principali e caratteristiche.
Hardware Software Computer 1. SOFTWARE 2 HARDWARE 3.
AULA INFORMATICA MULTIMEDIALE DONAZIONE MCKINSEY & COMPANY ITALIA.
Corso linux RiminiLUG presenta Rete a bassissimo budget per il piccolo ufficio architettura di rete LTSP in contesti professionali corso linux 2008.
Dischi magnetici e scheduling del braccio del disco Pag. 216 – 224.
Referaggio CALCOLO Esperimenti non LHC G. Carlino, D. Lucchesi, V. Vagnoni CSN1 – Lecce 30 Settembre 2015.
Centralizzazione del servizio di posta elettronica per l’INFN ─ INTEGRAZIONE ─ Ombretta Pinazza Per il Gruppo Mailing CCR, Marzo 2008.
Gruppo Multimedia CCR “Report” Stefano Zani (INFN CNAF) Alfredo Pagano (INFN CNAF) Commissione Calcolo e Reti Roma, Dicembre 2006.
Referaggio apparati di rete 2014 Seconde priorità Gruppo referee rete Fulvia Costa Paolo Lo Re Enrico Mazzoni Stefano Zani CNAF, CCR 1-2 aprile 2014.
Progetto iSCSI Report alla CCR 12-13/12/2006 Alessandro Tirel – Sezione di Trieste.
Concetti informatici di base. Concetti informatici di base Il computer o elaboratore è una apparecchiatura costituita da un insieme di dispositivi di.
1 ALICE I ITER2 DI ALICE IN ITALIA Bologna, 6 marzo 2007 M. Masera
Referaggio apparati di rete 2013 Seconde priorità Gruppo referee rete Fulvia Costa Paolo Lo Re Enrico Mazzoni Stefano Zani Referaggi aprile 2013.
Attività Gruppo Virtualizzazione Andrea Chierici CNAF CCR
Test di storage a 10 Gbps proposta. Storage server a 10Gbps Si vuole vedere quali prestazioni si possano ottenere da server connessi a 10 GE –capacita’
20-21/03/2006Workshop sullo storage - CNAF Storage nei Servizi Calcolo delle sezioni INFN Alessandro Brunengo.
Attività Gruppo Virtualizzazione Andrea Chierici CNAF Riunione CCR
Transcript della presentazione:

Benigno Gobbo – INFN Trieste 1 CSN1 13 ottobre 2003 Obsolescenza dei PC Riunione CSN1 Roma, 13 ottobre 2003 Benigno Gobbo INFN Sezione di Trieste

CSN1 Benigno Gobbo – INFN Trieste 2 13 ottobre 2003 Hardware Età della Farm PC Client Assemblati 1 a “nidiata”, dicembre 2000 (11 macchine) Motherboad MSI 694D Pro (soket 370, PC100/133 SDRAM, ATA/100, chipset VIA 694X), 2 P III a 800 MHz, 512 MB SDRAM, 2x 20 GB ATA a “nidiata”, novembre 2001 (19 macchine) Motherboad Abit VP6 (soket 370, PC100/133 SDRAM, ATA/100, chipset VIA 694X), 2 P III a 1 GHz, 512 MB SDRAM, 2x 40 GB ATA 100 PC Server Assemblati (10/2000) Motherboard ASUS CUR-DLS (soket 370, PC100/133 SDRAM, Ultra 2 SCSI, chipset ServerSet III LE), 2 P III a 800 MHz, 512 MB SDRAM, 2x 36 GB SCSI (12/2000) Motherboard Intel L440GX (slot 1, PC100 SDRAM, chipset I440gx), 2 P III a 700 MHz, 512 MB SDRAM, 2x x75 + 6x80 GB ATA 100 (*) (07/2001) Motherboard Intel STL2 (soket 370, PC100/133 SDRAM, chipset ServerSet III LE), 2 P III a 866 MHz, 512 MB SDRAM, 2x x80 GB ATA100 (*) (*) 3 anni di garanzia

CSN1 Benigno Gobbo – INFN Trieste 3 13 ottobre 2003 Hardware (cont.) Server “di marca” (04/2001) SunBlade 1000 (**) (2 Spark III a 750 KHz, 512 MB RAM, GB SCSI + 8x72 GB SCSI in RAID controller esterno CMD (***) (11/2001) DELL Power Edge 4400 (chipset: ServerSet III LE 2 Xeon a 1 GHz, 1 GB RAM, 2x36 + 6x72 GB SCSI in RAID controller interno (*) Switch di rete (10/2000) 3COM 3900 (36 Fast + 3 Giga SX) (**) (11/2001) 3COM 4900 (12 Giga SX) (**) Altro (12/2001) Tape Library STK L40 con 2 drive IBM Ultrium1 (12/2000) Switch KVM 16 porte Belkin OmniView Pro (12/2000) Monitor, tastiera, mouse Per i PC client ci si è dotati di un piccolo magazzino di pezzi di ricambio (soprattutto dischi); gli altri dispositivi hanno una garanzia triennale o sono in manutenzione. (*) 3 anni di garanzia (**) in contratto di manutenzione manutenzione (***) non mantenibile

CSN1 Benigno Gobbo – INFN Trieste 4 13 ottobre 2003 Cronistoria dei Problemi Hardware Singoli guasti Nei client subito dopo l’acquisto Client “vecchi”: 1 Power supply Client “nuovi”: 1 Power supply + graphic card Nei client, distribuite nel tempo Client “vecchi”: 5 dischi (02/02, 03/02, 11/02, 04/03, 08/03) Nei server “assemblati” Server “nuovo”: 3ware escalade 6800 (01/02), 3 dischi (11/01, 12/02, 06/03) Nei server “di marca” - In altro hardware -

CSN1 Benigno Gobbo – INFN Trieste 5 13 ottobre 2003 Cronistoria dei Problemi Hardware (cont.) Guasti su specifici hardware IBM DTLA (montati sul 1 o disk server) 7 dischi su 14 rotti (5 ~subito, 02/02, 02/03) Problema oggi noto, non lo ora quando vennero acquistati Per raffronto, su 26 Western Digital: 3 rotti MSI 694D Pro (motherboard dei client “vecchi”) Non si è ancora capito cosa succeda. Sintomi identici: reboot continuo della macchina. Le schede PCI, la pila, le CPU e la RAM sono state tutte testate e risultano funzionanti. 5 rotte su 11! Problema iniziato da poco, ma sembra un’epidemia: 02/09/03, 20/09/03, 25/09/03, 06/10/03, 06/10/03 Un’ipotesi? A fine agosto, con alte temperature esterne, c’è stato un blackout di 3 ore, una domenica notte. Le macchine sono rimaste in funzione per 30 min. e con alto load (running jobs) grazie all’UPS con condizionamento spento, la temperatura della stanza era salita oltre i 40 o. È molto difficile trovare in commercio schede per soket 370 biprocessori con bus a 133 e controller IDE. Non ho trovato MSI, Abit o SuperMicro. Sto aspettando una Asus CUV4X-D in prestito per fare dei test.

CSN1 Benigno Gobbo – INFN Trieste 6 13 ottobre 2003 Riassunto sull’hardware Le macchine più vecchie si avvicinano ai 3 anni di età, l’età media degli oggetti è comunque oltre i 2 anni Le macchine più vecchie si avvicinano ai 3 anni di età, l’età media degli oggetti è comunque oltre i 2 anni Ci sono due tipi di guasti Sporadici Su macchine nuove. Generico componente difettoso. La macchina è in garanzia ed essendo nuova ha poca installazione. Quindi il problema generalmente non è grave Distribuiti nel tempo. Praticamente solo dischi. In generale facile reperibilità sul mercato La creazione di un piccolo “magazzino” permette di ridurre al minimo il tempo di non disponibilità della macchina Facile operazione hardware di sostituzione Se non in RAID: problemi(ni) dal lato software (generalmente installazione ex-novo del sistema operativo, semplificata da utility come kickstart o simili) Legati a specifici componenti dimostratisi non affidabili In generale ci si aspetta che questi guasti avvengano su hardware nuovo, quindi con sostituzione in garanzia Ma non sempre avviene questo. Il caso delle motherboad è un esempio di caso peggiore: Non si trovano più sul mercato La sostituzione è particolarmente laboriosa

CSN1 Benigno Gobbo – INFN Trieste 7 13 ottobre 2003 Considerazioni Punto debole in caso di guasti Dopo poco più di 2 anni certi componenti fondamentali (es. schede madri) si trovano difficilmente sul mercato Sostituzione completa di una macchina in caso di rottura? Secondo me non è ragionevole: Dopo poco tempo è improbabile trovare una macchina gemella sul mercato L’omogeneità dei modelli aiuta moltissimo nella gestione di una farm Sostituzione “quantizzata” delle macchine guaste Preferibile Quando se ne sono rotte N se ne finanziamo es. M>N che devono bastare anche per successivi (almeno: le nuove sono più performanti) M-N guasti. Sostituzione di macchine per “limite di età” Trovo che a tutt’oggi macchine che si avvicinano ai 3 anni di età, con doppio PIII a GHz, siano del tutto dignitose in performance su problemi tipici dell’HEP (le performance non scalano coi MHz del clock: cfr risultati SPECint2000)cfr risultati SPECint2000

CSN1 Benigno Gobbo – INFN Trieste 8 13 ottobre 2003 Problemi Firmware CUR-DLS BIOS Leggeva male la temperatura della 2 a CPU ed abbassava il clock supponendo un surriscaldamento Risolto con un BIOS upgrade Schede 3ware 6800 Talvolta incompatibilità tra driver linux e firmware Difficoltà soprattutto in fase di installazione di linux Risolti con updare di driver e/o firmware Alcuni modelli di dischi Western Digital Bug in una “nuova feature” del firmware introdotta per renderli meno rumorosi Le 3ware li credevano guasti e li mettevano offline Risolto con patch al firmware dei dischi (che fortunatamente supportava i controller 3ware) Quindi: fastidiosi ma, almeno fin’ora risolvibili con “pezze”. Naturalmente bisogna controllare a priori che i produttori di hardware/software supportino il nostro environment.

CSN1 Benigno Gobbo – INFN Trieste 9 13 ottobre 2003 Software Non ho, per ora, riscontrato nessun tipo di problemi legati a software upgrade (piuttosto si possono riscontrare problemi legati ai driver per hardware “nuovissimo”). Questo vale per I sistemi operativi (RedHat Linux 6.x, 7.x, AS2.1) I software commerciali (Objectivity, CA ARCerve, Oracle 9.20i (?), …) I software HEP (ROOT, CLHEP, CERNLib, CASTOR, DATE, …) I software di esperimento (programmi di ricostruzione ed analisi) Problemi potrebbero esserci in futuro (vedi Fedora Project) Fedora ProjectFedora Project Vedremo: la situazione è confusa e tutta da capire … In generale le farm locali, per non rendere la vita di gestione troppo dura, devono necessariamente rimanere “software compatibili” con “qualche riferimento” Nel nostro caso la farm al CERN Se a causa di hardware obsoleto e non più supportato non si potesse fare l’upgrade del software, il problema sarebbe serio

CSN1 Benigno Gobbo – INFN Trieste ottobre 2003 In conclusione Secondo la mia esperienza, lo hardware di tre anni può ancora essere “dignitosamente” usato. Quattro anni possono ancora essere considerati come l’età buona per l’upgrade del materiale informatico. Cinque sembra un periodo lungo, assumendo gli attuali trend di evoluzione (raddoppio frequenza CPU/anno, in SPECint), e considerando anche che dopo un paio d’anni certi componenti non si trovano più sul mercato Naturalmente salvo necessità dovute a scelte non influenzabili (cambiamenti di tecnologie hardware od incompatibilità dovute a nuovi software necessari) Ed ancora più naturalmente salvo “sfighe” contingenti (cfr motherboard) Domanda, soprattutto legata alle future grosse farm: una volta fatto un upgrade, cosa si fa delle macchine dismesse se ancora funzionanti? Si tengono nell’environment? Ma questo richiede investimenti in es. networking Si riciclano ad altri usi? Quali?