La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

1 Prof. Fabrizio Camuso – www.camuso.it ago. ’15 Archiviazione dei dati Azienda  sistema  organizzazione  decisioni  informazione Sistema Informativo.

Presentazioni simili


Presentazione sul tema: "1 Prof. Fabrizio Camuso – www.camuso.it ago. ’15 Archiviazione dei dati Azienda  sistema  organizzazione  decisioni  informazione Sistema Informativo."— Transcript della presentazione:

1 1 Prof. Fabrizio Camuso – ago. ’15 Archiviazione dei dati Azienda  sistema  organizzazione  decisioni  informazione Sistema Informativo archivi / DBMS

2 2 Prof. Fabrizio Camuso – ago. ’15 Archivio Raccolta organizzata di informazioni: logicamente correlate rappresentate con un formato preciso persistenti (memorizzazione su un supporto) organizzate per una facile consultazione

3 3 Prof. Fabrizio Camuso – ago. ’15 Archivi - Operazioni creazione inserimento aggiornamento (modifica) cancellazione consultazione ordinamento (sort) fusione (merge)

4 4 Prof. Fabrizio Camuso – ago. ’15 Struttura logica di un archivio (record logico) Campo (field): singolo valore che descrive una caratteristica dell’entità rappresentata; è descritto da attributi Record: l’insieme di tutti i campi che descrivono una entità Tracciato record: la descrizione ordinata dei campi di un record

5 5 Prof. Fabrizio Camuso – ago. ’15 Struttura fisica di un archivio tipo supporto: nastro,disco, SSD, CD ecc. organizzazione: sequenziale? ad accesso diretto? tramite indici? dimensione iniziale ed incrementi successivi: aree temporanee di parcheggio in RAM dei blocchi da leggere/scrivere

6 6 Prof. Fabrizio Camuso – ago. ’15 Periferiche e supporti Supporto: parte del dispositivo di memorizzazione ausiliario su cui vengono registrati i dati (hd, floppy, cd, dvd); NB: viene spesso confuso con la periferica che li usa (drive)! supporto

7 7 Prof. Fabrizio Camuso – ago. ’15 Periferiche e supporti Drive: unità elettromeccanica in cui è inserito il supporto Controller: circuito elettronico che pilota il drive drive controller

8 8 Prof. Fabrizio Camuso – ago. ’15 Periferiche e supporti Interfaccia: definizione di tutti i particolari meccanici, elettrici, gestione dei segnali, cavi di collegamento, connettori e protocollo di scambio dati interfaccia connettore slot

9 9 Prof. Fabrizio Camuso – ago. ’15 Periferiche e supporti Driver: programma che regola lo scambio di dati tra controller e interfaccia in risposta a richieste del sofware (di solito il S.O.) Ogni costruttore potrà realizzare dispositivi anche molto diversi come tecnologia ma con la certezza di poterli vendere a patto di fornire il relativo driver

10 10 Prof. Fabrizio Camuso – ago. ’15 Struttura fisica di un record Blocco (record fisico): numero di bytes che la periferica usata per la memorizzazione è in grado di leggere/scrivere con una sola operazione Fattore di blocco: numero di record logici contenuti in un record fisico Buffers di I/O: aree temporanee di parcheggio in RAM dei blocchi da leggere/scrivere

11 11 Prof. Fabrizio Camuso – ago. ’15 Parametri comuni: capienza nient’altro che bytes … –(solo per il testo) ASCII / UNICODE / UTF-8 –GB, TB, PB, EB, ZB, YB.

12 12 Prof. Fabrizio Camuso – ago. ’15 Moltiplichiamo i multipli … GB = GigaByte = 2 30 bytes  1 miliardo –L’abitacolo di un furgoncino riempito di fogli –Una intera sinfonia in hi-fi –200 volte tutte le opere di Shakespeare –L’intera enciclopedia britannica –Tutto il genoma umano (ed avanza spazio) –9 metri di libri su uno scaffale –Un solo film (1,5GB) in qualità broadcast …

13 13 Prof. Fabrizio Camuso – ago. ’15 Moltiplichiamo i multipli … TB = TeraByte = 2 40 bytes  1000 GB = 1000 miliardi –Una colonna di CD (senza custodia) alta 2 metri e mezzo –Tutti i 350 episodi dei Simpson – alberi trasformati in carta –1 giorno di archivi di un motore di ricerca –45TB = tutti i video su YouTube (Agosto 2006) –150 TB = web indicizzato da Google, senza DataBase (Dic 2005) –274 TB = 1 anno di tutto l’Intant Messaging (2002).

14 14 Prof. Fabrizio Camuso – ago. ’15 Moltiplichiamo i multipli … PB = PetaByte = 2 50 bytes  1000 TB = GB –Un milione di ore di televisione –I dati su internet (2004) –Una pila di CD alta 3 chilometri –500 miliardi di pagine stampate –20 PB = la capacità di tutti gli hd prodotti nel 1995 –200 PB = tutto il materiale stampato esistente.

15 15 Prof. Fabrizio Camuso – ago. ’15 Moltiplichiamo i multipli … EB = ExaByte = 2 60 bytes  1000 PB = un miliardo di GB –5 EB = tutta l’informazione prodotta nel 2002 –12 EB = tutta la conoscenza mondiale (1999) –15 EB = tutte le telefonate effettuate nel mondo nel 2002 … ZB = ZettaByte = 1000 EB … YB = YottaByte = 1000 ZB Ma 1000 YB non sarebbero sufficienti a descrivere la posizione nello spazio di tutti gli atomi di un solo corpo umano …

16 16 Prof. Fabrizio Camuso – ago. ’15 Il consumismo, anche qui! Bit di parità, CRC, Red-Solomon Formattazione supporti: cluster sui dischi o gap sui nastri

17 17 Prof. Fabrizio Camuso – ago. ’15 Cluster e spreco di spazio

18 18 Prof. Fabrizio Camuso – ago. ’15 Parametri comuni: tipo di accesso Sequenziale: il dispositivo che legge il supporto può spostarsi solo da un blocco al successivo ABC Random: il dispositivo può spostarsi tra due blocchi qualsiasi impiegando lo stesso tempo ABC Pseudo random / diretto / relative

19 19 Prof. Fabrizio Camuso – ago. ’15 Parametri comuni - 2 Velocità di trasferimento (transfer rate): dipende dal dispositivo di memorizzazione e può o meno saturare la capacità teorica dell’interfaccia con cui è connesso al bus Velocità dell’interfaccia (controller) che collega la periferica al sistema (di solito non saturata da una singola unità di memorizzazione che la usa): –Serial ATA 1/2/3 ( / 600MB/sec), SCSI MB/sec), SAS (Serial Attached SCSI, punto punto: 3.0 Gbit e in futuro 6 Gbit/s) –USB 2.0: 480 Mbit/s (v. 3.0: 4.8 Gbit/s); pen drive veloce = 30MByte –FireWire (IEEE1394): 400 / 800 Mbit –Fiber Optic (4 Gb/s) Ci dobbiamo quindi ‘preoccupare’ della saturazione del bus solo in configurazioni che usano più dispositivi in parallelo come nelle configurazioni RAID (un HD da 7200rpm singolo arriva infatti a ‘soli’ 60MB/sec).

20 20 Prof. Fabrizio Camuso – ago. ’15 Parametri comuni: tempo medio di accesso (access time): tempo che intercorre tra il momento in cui un blocco viene richiesto al controller della periferica ed il momento in cui esso è pronto all’uso nel buffer (RAM) hard disk Consumer (5.000/7.200 rpm 10 ms) Pro (10.000/ rpm, 3/4 ms) SSD: 0.1 ms !!

21 21 Prof. Fabrizio Camuso – ago. ’15 Tempo Medio di Accesso (access time) Chipset (a) (b)(c) chipset Buffer (RAM) Tempo totale = (a) tempo che la meccanica (svogimento nastro, movimento testine/rotazione) + (b) tempo necessario per la trasmissione dei dati dal controller della periferica all’interfaccia sul PC cui è collegato (USB, SATA, ETHERNET, ecc.) (c) tempo necessario al chipset della scheda madre per trasferire i dati dall’interfaccia al buffer nella memoria centrale Note: a volte il controller della periferica è più veloce dell’interfaccia (come un disco SSD collegato all’USB o a SATA di prima generazione); oppure può essere vero il contrario (pen drive collegata all’USB); difficilmente il chipset diventa il collo di bottiglia che frena le periferiche (può capitare solo con più dischi veloci in RAID) +

22 22 Prof. Fabrizio Camuso – ago. ’15 Tempo Medio di Accesso (esempio) Tempo totale = (a) Seek time (posizionamento braccio porta testine) + latency time (rotazione) + (b) trasmissione dal controller SATA all’interfaccia SATA + (c) tempo necessario al chipset della scheda madre per trasferire i dati CHIPSET Interfaccia SATA BUS Seek + latency controller DRIVEDRIVE RAM

23 23 Prof. Fabrizio Camuso – ago. ’15 Bus di sistema Esempio per FSB Banda passante (bandwidth): word (64bit) x freq. (400Mhz) x word trasferite per ciclo macchina (4) 12.8 GB/sec

24 24 Prof. Fabrizio Camuso – ago. ’15 Parametri comuni - 3 Affidabilità durata supporto fault tolerance; MTBF sicurezza fisica: resistenza ad eventi naturali o dolosi; versioni ‘rugged’ o ‘tough’ dei dispositivi; RAID (più avanti) Nota: l’MTBF è solo uno degli aspetti da considerare per la fault tolerance

25 25 Prof. Fabrizio Camuso – ago. ’15 Parametri comuni - 4 Compatibilità: con diversi S.O. Facilità d’uso / grado automazione Costi: separatamente per il drive ed i supporti, software, manutenzione Espandibilità (scalabilità) Nota: l’MTBF è solo uno degli aspetti da considerare per la fault tolerance

26 26 Prof. Fabrizio Camuso – ago. ’15 Nastri (streaming tape) struttura e funzionamento

27 27 Prof. Fabrizio Camuso – ago. ’15 Nastri (streaming tape) - 1 Piste = i bit (tracks) longitudinali (8+1 bit) Frame = i byte (latitudinali)

28 28 Prof. Fabrizio Camuso – ago. ’15 Nastri – struttura geometria GAP

29 29 Prof. Fabrizio Camuso – ago. ’15 Nastri - formati Bobine (volume) Cartucce Cartridge)

30 30 Prof. Fabrizio Camuso – ago. ’15 Nastri - formati Bobine (volume) Cartridge.

31 31 Prof. Fabrizio Camuso – ago. ’15 Impianti robotizzati

32 32 Prof. Fabrizio Camuso – ago. ’15 Nastri - caratteristiche Tipo di accesso: sequenziale Capacità: 400 / 800 GB; si parla anche di BPI (Bits per Inch) Tempo medio di accesso: da secondi a minuti Transfer rate: decine MB/s Durata supporto: 30 / 100 anni Compatibilità: elevata MTBF drive: 10 5 ore Facilità d’uso: elevata Costi: bassi (30/50 € per 400/500 GB)

33 33 Prof. Fabrizio Camuso – ago. ’15 Vantaggi / Svantaggi / Uso Alta capienza Poco ingombro Basso costo Alterabilità (ambiente) Lentezza nelle ricerche

34 34 Prof. Fabrizio Camuso – ago. ’15 Hard disk struttura e funzionamento Disk Pack testina

35 35 Prof. Fabrizio Camuso – ago. ’15 Hard disk – geometria/1 Settore geometrico Settore di disco

36 36 Prof. Fabrizio Camuso – ago. ’15 Hard disk – geometria/2 formattazione a basso livello (low level formatting) e formattazione ad alto livello (high level formatting)

37 37 Prof. Fabrizio Camuso – ago. ’15 Hard disk - prestazioni Tipo di accesso: pseudo random Capacità: da alcune centinaia di GB ad alcuni TB Tempo medio di accesso: seek time (10 – 20 ms) + latency time (3 – 10 ms) Transfer rate: 40 – 150 MB/s Durata supporto: alcuni anni (necessita rinfresco) Compatibilità: elevata MTBF: 10 5 ore (da considerare insieme alla vita utile) Facilità d’uso: elevata Costi: bassi (100 € per 1 TB) USO supporto principale per il lavoro quotidiano

38 38 Prof. Fabrizio Camuso – ago. ’15 Hard disk – evoluzione tecnologia Aumento densità per pollice quadro: testine sempre più vicine Piatti più piccoli -> maggiori RPM -> maggiori transfer rate Zone Bit Recording (ZBR): le tracce più esterne hanno più spazio e quindi possono accogliere più blocchi di dati; il disco è diviso in zone (gruppi di tracce contigue) con le zone più esterne con tracce contenenti più settori di quelle più interne.

39 39 Prof. Fabrizio Camuso – ago. ’15 Hard disk – evoluzione tecnologia HAMR (un laser scalda la superficie che viene poi memorizzata): maggiore densità di registrazione (ci si aspetta fino a 100x) con speciali leghe metalliche (ad oggi un centinaio di Tbit/cm 2 ) Perpendicular recording: maggiore densità registrazione (10x e oltre)

40 40 Prof. Fabrizio Camuso – ago. ’15 SSD Access time assai ridotto (0.01ms!) Transfer rate: da 300MB/s ad alcuni GB/s Minore capacità (da 64GB; TB a prezzi ‘folli’) Bassi consumi Minor peso e dispersione calore Nessun rumore USO Disco sistema, DB server, audio video

41 41 Prof. Fabrizio Camuso – ago. ’15 Unità ottiche (CD / DVD / BR) Struttura e funzionamento

42 42 Prof. Fabrizio Camuso – ago. ’15 Track (traccia – a spirale) 1 capello = 50 tracce !

43 43 Prof. Fabrizio Camuso – ago. ’15 Multi layers (DVD-BR)

44 44 Prof. Fabrizio Camuso – ago. ’15 Unità ottiche (CD / DVD / BR) 1 o più layer / 1 o 2 facce 1 traccia a spirale Solido sistema di rilevazione e correzioni errori

45 45 Prof. Fabrizio Camuso – ago. ’15 Unità ottiche (CD / DVD / BR) Stampati Master usati in una pressa masterizzati

46 46 Prof. Fabrizio Camuso – ago. ’15 CD / DVD / BR lettura / scrittura WORM RW ROM Laser ad una intensità Laser a due intensità Laser a tre intensità

47 47 Prof. Fabrizio Camuso – ago. ’15 CD / DVD standard CD / DVD + -

48 48 Prof. Fabrizio Camuso – ago. ’15 CD / DVD / BR - prestazioni Tipo di accesso: pseudo random ma seek lento Capacità: (bassa) 650/700 MB 4.7/17GB 25/50/200 GB Tempo medio di accesso: (alto) 100ms Transfer rate: (basso) 7-8 MB/sec Durata supporto: da 2-3 anni a 100 anni Compatibilità: elevata Facilità d’uso: elevata Costi: bassi USO Backup, distribuzione di massa di documentazione e software

49 49 Prof. Fabrizio Camuso – ago. ’15 Sicurezza fisica dei dati Backup & restore UPS Fault Tolerance - 3 livelli di ridondanza: -Mirroring (RAID) -Duplexing -Intero sistema

50 50 Prof. Fabrizio Camuso – ago. ’15 RAID 0 Scrittura contemporanea di diverse porzioni di uno stesso file su dischi diversi = VELOCITA? Maggior velocità Minor sicurezza (il crash di un disco comporta la perdita di TUTTI i dati) Dal punto di vista dell’utente è come avere un HD capiente come la somma delle capienze WOW!!

51 51 Prof. Fabrizio Camuso – ago. ’15 RAID 1 - mirroring Scrittura in contemporanea dello stesso blocco di dati su più dischi. Per perdere i dati devono andare in crash TUTTI i dischi. Minor velocità Maggior sicurezza Sacrificio di spazio: con N dischi ho a disposizione la capienza del minore.

52 52 Prof. Fabrizio Camuso – ago. ’15 RAID 0+1 Velocità e sicurezza unendo livello 0 e 1 Ma usando ovviamente un controller più sofisticato ed il doppio dei dischi. Bello ma caro!

53 53 Prof. Fabrizio Camuso – ago. ’15 RAID 4 Un compromesso tra velocità e sicurezza ad un costo più contenuto: un discreto grado di ridondanza usando un solo disco in più. Perdita di dati con crash contemporaneo di due dischi, altrimenti con una sola rottura ricostruisco i dati usando gli altri. Disco di parità possibile collo di bottiglia: più scritture contemporanee sui dischi non di parità comporta più scritture (che non possono essere contemporanee) su quello di parità.

54 54 Prof. Fabrizio Camuso – ago. ’15 RAID 5 Distribuendo le informazioni di parità su tutti i dischi, accettando quindi una gestione più complicata a carico del controller, evito di sovraccaricare un unico disco di parità come nel caso RAID 4.


Scaricare ppt "1 Prof. Fabrizio Camuso – www.camuso.it ago. ’15 Archiviazione dei dati Azienda  sistema  organizzazione  decisioni  informazione Sistema Informativo."

Presentazioni simili


Annunci Google