La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

INFORMATICA UMANISTICA B 2: RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE.

Presentazioni simili


Presentazione sul tema: "INFORMATICA UMANISTICA B 2: RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE."— Transcript della presentazione:

1 INFORMATICA UMANISTICA B 2: RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE

2 Concetti di base Due tipi di informazione: in forma ANALOGICA, in forma DISCRETA (o simbolica) Per rappresentare o comunicare informazione occorre un CODICE Codici digitali: –Per numeri –Per testi –Per immagini –Per suoni

3 Informazione su computer Un computer deve: –Fare linput/output dellinformazione Usando i dispositivi di input/output –Memorizzare linformazione Usando la memoria principale/secondaria –Elaborare linformazione Usando il processore

4 Informazione su computer Mondo esterno informazione rappresentazione digitale codifica decodifica Computer: memorizzazione, elaborazione

5 Informazione in forma analogica (Immagine famosa / musica famosa) Come queste immagini convey information

6 INFORMAZIONE IN FORMA ANALOGICA

7 INFORMAZIONE IN FORMA DISCRETA

8 PROBLEMA DELLA RAPPRESENTAZIONE DELLINFORMAZIONE SU COMPUTER SVILUPPARE CODICI CHE PERMETTANO DI RAPPRESENTARE INFORMAZIONE DI TIPO DISCRETO IN MODO EFFICIENTE SU UN SUPPORTO FISICO RAPPRESENTARE INFORMAZIONE DI TIPO ANALOGICO CON CODICI DISCRETI

9 RAPPRESENTAZIONE DELLINFORMAZIONE E COMUNICAZIONE IL PROBLEMA DELLA RAPPRESENTAZIONE DELLINFORMAZIONE SI E GIA POSTO NEL CASO DELLA COMUNICAZIONE

10 COMUNICAZIONE ED INFORMAZIONE Soprattutto a partire dalla metà del novecento, il termine comunicazione è stato sempre più spesso adottato per designare quella particolare forma di trasporto immateriale ed astratto che è il trasferimento di informazione

11 COMUNICAZIONE E CODICI Il fatto che una certa immagine od un certo simbolo rappresentino informazione non è sufficiente perche possano essere usati per la comunicazione Un CODICE (o LINGUAGGIO) è un insieme di SEGNI (e di regole) che mittente e destinatario devono CONDIVIDERE affinché il primo sia in grado di formulare messaggi ed il secondo di comprenderli

12 CODICI NON DISCRETI

13 CODICI DISCRETI Codice non devessere necessariamente discreto, ma codice discreto piu pratico –E piu facile memorizzare i simboli (alfabeto Cinese) –E piu facile trasmetterli Teoria dellInformazione (sotto) quantifica questidea di piu pratico

14 LA SCRITTURA: DA IDEOGRAFICA A DISCRETA Le prime forme di scrittura furono tutte essenzialmente ideografiche La scrittura fonetica alfabetica appare, sempre in area mediorientale, intorno al 1500 a. C Ma furono solamente i Greci che, introducendo anche i segni per le vocali, ne completarono levoluzione intorno allottavo secolo a. C.

15 La scrittura Le conseguenze dellinvenzione della scrittura furono enormi Uno dei più eminenti studiosi di questi argomenti, Walter Ong, ha affermato la scrittura ha trasformato la mente umana più di qualsiasi altra invenzione Tra le conseguenze dellinvenzione della scrittura gli studiosi annoverano –La nascita del concetto di testo –Lo sviluppo della concezione occidentale della razionalità e del pensiero analitico –Laffermazione della astrazione concettuale

16 ALTRI ESEMPI DI CODICI DISCRETI I segnali stradali I simboli degli Evangelisti

17 UN ESEMPIO DI CODICE DISCRETO VISIVO

18 CODICI E STATI INFORMATIVI I CODICI VENGONO PROGETTATI SULLA BASE DELLA VARIETA DI INFORMAZIONE CHE DEVE ESSERE RAPPRESENTATA TIPO BASE DI INFORMAZIONE: STATI

19 UN ESEMPIO MINIMO DI INFORMAZIONE: LINTERRUTTORE Due possibilità –Acceso –Spento Linformazione sullo stato dellinterruttore corrisponde dunque alla scelta fra due sole alternative Possiamo rappresentarla usando una sola cifra con due valori: 0 od 1

20 UN ESEMPIO MINIMO DI STATI INFORMATIVI DA RAPPRESENTARE Il codice del termostato: –Messaggi: Temperatura sotto il limite e Temperatura sopra i limite –Segni: Corrente accesa e Corrente spenta –Eventi fisici:

21 Concetto di codice e linguaggio Un codice o linguaggio è un insieme strutturato di segni e di regole che il mittente ed il destinatario devono condividere affinché il primo sia in grado di formulare messaggi ed il secondo di comprenderli Il codice del termostato: –Messaggi: Temperatura sotto il limite e Temperatura sopra i limite –Segni: Corrente accesa e Corrente spenta –Eventi fisici:

22 UNA DEFINIZIONE SEMI-FORMALE DI CODICE (O LINGUAGGIO) a) una serie di nozioni sugli stati del mondo che possono essere il contenuto di ciascun atto comunicativo; chiamiamo questi elementi significati b) una serie di simboli astratti che possono essere connessi in modo convenzionale a significati; essi possono essere sottoposti a regole che ne governino la combinazione e la successione e che stabiliscano quali sequenze considerare e quali scartare; chiamiamo queste regole sintassi c) una serie di eventi fisici dotati di caratteristiche distintive, che possono essere adoperati per rappresentare le unità astratte della serie (b) d) una regola che associa in modo sistematico le unità della serie (a) a quelle della serie (b), ed in seconda istanza le unità della serie (b) a quelle della serie (c)

23 CODICI PER NUMERI Nel caso dei numeri, la necessita di sviluppare un codice limitato non motivata solo da facilita di memorizzazione, ma anche dalla necessita di usarli per MANIPOLAZIONI SIMBOLICHE

24 DUE CODICI PER I NUMERI Codice romano: –VII + IV = XI Codice decimale: –7 + 4 = 11 Differenza fondamentale: il codice decimale e un codice POSIZIONALE –8 = 8x10 0 –70 = 7x x10 0 I codici posizionali rendono le operazioni aritmetiche molto piu semplici

25 Rappresentazione digitale dei numeri Il codice decimale, benche molto comodo, non e il codice MINIMO Per rappresentare informazione sui computer, codice minimo essenziale perche occorreva poter rappresentare ogni simbolo diverso in modo FISICO (= con circuiti elettrici) Il minimo numero di simboli diversi necessari per rappresentare tutti i numeri e il codice BINARIO: 0, 1

26 Perché la rappresentazione binaria? I due simboli (0 e 1) possono essere rappresentate da: –Due stati di polarizzazione di una sostanza magnetizzabile –Due stati di carica elettrica di una sostanza –…

27 Rappresentazione digitale = rappresentazione binaria Lentità minima di informazione che possiamo trovare allinterno di un elaboratore prende il nome di bit –Binary digit – cifra binaria –Un bit può assumere due valori Rappresentazione binaria –Solo due simboli (0 e 1)

28 Numeri BINARI e numeri ESADECIMALI Sistema binario –vengono usate due cifre (0 e 1) per rappresentare un numero –problema: i numeri binari sono estremamente lunghi e difficili da ricordare Sistema esadecimale –ogni numero è rappresentato con 16 cifre (0-9, A-F) –i numeri sono più corti di quelli binari –estrema facilità di conversione tra binario ed esadecimale in una sequenza binaria, ogni stringa di 4 bits corrisponde ad una cifra esadecimale numero binario (6) (15) (6) (6) (15) (6) 6 F 6 numero esadecimale 6 F 6 numero esadecimale numero X 10 A 1010 rappresentazione di un numero

29 USO DELLA RAPPRESENTAZIONE BINARIA: DUE STATI Due possibilità –Acceso –Spento Linformazione sullo stato dellinterruttore corrisponde dunque alla scelta fra due sole alternative Possiamo rappresentarla usando un solo bit

30 NUMERO MAGGIORE DI STATI Per poter rappresentare un numero maggiore di informazione si usano sequenze di bit Per esempio, per rappresentare quattro informazioni diverse possiamo utilizzare due bit che ci permettono di ottenere quattro configurazione distinte Il processo secondo cui si fa corrispondere ad uninformazione una sequenze di bit prende il nome codifica dellinformazione

31 QUATTRO STATI DIVERSI Esempio: un esame può avere quattro possibili esiti: ottimo, discreto, sufficiente, insufficiente Codifico (due bit): –ottimo con00 –discreto con01 –sufficiente con10 –insufficiente con11

32 OTTO STATI Esempio: otto colori: nero, rosso, blu, giallo, verde, viola, grigio, arancione Codifico (tre bit): –nero con000 –rosso con001 –blu con010 –giallo con011 –verde con100 –viola con101 –grigio con110 –arancione con111

33 I numeri in rappresentazione binaria Il principio e lo stesso del codice decimale, ma con due soli simboli 8 = 8x10 0 = 1x x x x2 0 = = 7x x10 0 = 1 x x x x x x x2 0 = = 1x x x10 0 = 1x x x x x x x x2 0

34 BYTE Esiste una particolare aggregazione di bit che è costituita da 8 bit (2 8 = 256 informazioni) e prende il nome di byte Di solito si usano i multipli del byte KiloKB 2 10 (~ un migliaio, 1024 byte) MegaMB 2 20 (~ un milione, 1KB x 1024 byte) GigaGB 2 30 (~ un milliardo, 1MB x 1024 byte) TeraTB 2 40 (~ mille miliardi, 1GB x 1024 byte)

35 RAPPRESENTAZIONE DI INTERI SU COMPUTER Tipicamente 4 byte (= 32 bit) oppure 8 byte (= 64 bit)

36 RAPPRESENTAZIONE DIGITALE DI ALTRI TIPI DI INFORMAZIONE Per molti anni, lunico tipo di informazione rappresentata sui computers informazione di tipo numerico Ma di fatto, si scopri presto che lo stesso trucco poteva venire usato per I TESTI

37 La codifica digitale del testo che tipo di rappresentazione digitale del testo?

38 La codifica digitale del testo Il testo e la sua organizzazione titolo capitolo testo intestazione

39 La codifica digitale del testo Le avventure di Pinocchio Capitolo I Come andò che Maestro Ciliegia, falegname, trovò un pezzo di legno, che piangeva e rideva come un bambino. C'era una volta... - Un re! - diranno subito i miei piccoli lettori. - No, ragazzi, avete sbagliato. C'era una volta un pezzo di legno. Non era un legno di lusso, ma un semplice pezzo da catasta, di quelli che d'inverno si mettono nelle stufe e nei caminetti per accendere il fuoco e per riscaldare le stanze. Non so come andasse, ma il fatto gli è che un bel giorno questo pezzo di legno capitò nella bottega di un vecchio falegname, il quale aveva nome mastr'Antonio, se non che tutti lo chiamavano maestro Ciliegia, per via della punta del suo naso, che era sempre lustra e paonazza, come una ciliegia matura. Il testo come sequenza di caratteri Ciascun carattere alfanumerico, di punteggiatura o di controllo che compone il testo deve essere rappresentato nei termini di un codice binario

40 La codifica digitale del testo Due livelli di codifica del testo digitale –codifica di basso livello (codifica di livello 0) riguarda la rappresentazione binaria della sequenza ordinata dei caratteri –codifica di alto livello arricchisce il testo codificato al livello zero con informazione relativa a dimensioni strutturali –organizzazione del testo in strutture macrotestuali –articolazione del testo in strutture linguistiche La codifica di alto livello permette di rendere esplicita qualsiasi interpretazione, anche di tipo linguistico, si voglia associare al testo

41 La codifica di alto livello: il punto di partenza Il testo codificato al livello zero si presenta come un manoscritto in scriptio continua

42 Come sono rappresentati i caratteri nel computer? Repertorio di caratteri –un insieme di caratteri (es. A, a, !, à, P, ecc.) –i caratteri sono entità astratte, da non confondersi con il modo in cui sono realizzati graficamente (gliphs) a, a, a, a sono tutti lo stesso carattere a a, a, a, a sono tutti lo stesso carattere a la stessa realizzazione grafica può corrispondere a caratteri diversi (es. A latino e A cirillico e A greco) Set di carattere (codice) –una tabella che definisce una corrispondenza biunivoca (1-a-1) tra un repertorio di caratteri e un insieme di numeri interi non negativi a ogni carattere è assegnato un codice numerico (punto di codice o code position) Codifica di carattere –algoritmo che determina come i codici dei caratteri sono rappresentati in sequenze di bits (bytes)

43 Il codice ASCII Primo standard per lassegnazione di codici a caratteri (dal 1963) –set di caratteri riconosciuto da tutti i computer –conosciuto come ASCII Standard o ISO-646 Codifica –7 bits ciascun punto di codice è rappresentato con il numero binario corrispondente di 7 bits in realtà 1 byte = 8 bits di cui un bit non è usato per la codifica (bit di parità) –7 bits = 2 7 punti di codice = 128 caratteri rappresentati Sufficiente per rappresentare linglese –mancano i caratteri accentati, umlauts, ecc. per rappresentare altri alfabeti occidentali

44 ASCII (binario)

45 ASCII Standard decimale ed esadecimale

46 CODIFICA DI PAROLE IN ASCII Parole sono sequenze di caratteri Codifica della parole cane c a n e c a n e Il problema inverso: data una sequenza di bit, il testo che essa codifica può essere ottenuto nel modo seguente: –si divide la sequenza in gruppi di otto bit (byte) –si determina il carattere corrispondente ad ogni byte

47 Il set di caratteri ISO-Latin-1 ASCII Standard Caratteri di controllo ISO-Latin-1 (ISO o ASCII esteso) –unica estensione standard di ASCII –1 byte = 8 bits = 2 8 punti di codice = 256 caratteri rappresentati –sufficiente per lingue europee occidentali (italiano, francese, ecc.)

48 Dallanalogico al digitale OK, nel caso dei testi è tutto chiaro… …ma come la mettiamo con immagini, suoni, filmati? Cominciamo dalle immagini… Di nuovo, il trucco e convertire linformazione nelle immagini in forma binaria!!

49 Codifica delle immagini Suddividiamo limmagine mediante una griglia formata da righe orizzontali e verticali a distanza costante

50 Codifica delle immagini Ogni quadratino derivante da tale suddivisione prende il nome di pixel (picture element) e può essere codificato in binario secondo la seguente convenzione: –Il simbolo 0 viene utilizzato per la codifica di un pixel corrispondente ad un quadratino in cui il bianco è predominante –Il simbolo 1 viene utilizzato per la codifica di un pixel corrispondente ad un quadratino in cui il nero è predominante

51 Codifica delle immagini

52 Poiché una sequenza di bit è lineare, è necessario definire convenzioni per ordinare la griglia dei pixel in una sequenza. Assumiamo che i pixel siano ordinati dal basso verso lalto e da sinistra verso destra

53 Codifica delle immagini Non sempre il cortorno della figura coincide con le linee della griglia. Quella che si ottiene nella codifica è unapprossimazione della figura originaria Se riconvertiamo la sequenza di stringhe in immagine otteniamo

54 Codifica delle immagini La rappresentazione sarà più fedele allaumentare del numero di pixel, ossia al diminuire delle dimensioni dei quadratini della griglia in cui è suddivisa limmagine

55 EFFETTO DELLA RISOLUZIONE

56 ESERCIZIO (PER I TECNOFILI DANAROSI) Se avete sia un telefonino con camera che una camera digitale, provate a riprendere due immagini dello stesso oggetto ….

57 PIU DI DUE COLORI Se limmagine è solo in bianco e nero (senza grigi), basterà usare un 1 per i pixel neri, e uno 0 per i pixel bianchi Se limmagine ha più di due colori, si faranno corrispondere a gruppi diversi di 0 e 1 sfumature diverse di colore (o di grigio)

58 RAPPRESENTARE COLORI Così, ad esempio, se si fa corrispondere a ogni pixel un byte (cioè 8 bit), potremo differenziare 256 colori Al posto della tabella di codifica dei caratteri avremo una tabella di codifica dei colori Ad es: Ad es:

59 Digitalizzare le immagini La nostra immagine viene in questo modo fatta corrispondere a una larghissima matrice Ogni pixel dellimmagine viene codificato dal gruppo di 0 e 1 associato al suo colore dalla tabella di codifica dei colori utilizzata

60 I SUONI

61

62 CONVERSIONE IN DIGITALE VIA CAMPIONAMENTO

63 SUONO: DALLA RAPPRESENTAZIONE ANALOGICA ALLA RAPPRESENTAZIONE DIGITALE

64 Digitalizzare i suoni Sappiamo che le onde sonore sono rappresentabili attraverso funzioni È facile rappresentare londa sonora usando solo 0 e 1: ad esempio, si può usare laritmetica binaria per codificare i valori della x e della y

65 Digitalizzare informazione multimediale E i filmati? Un filmato non è altro che una successione di fotogrammi (frame) accompagnata da una colonna sonora Basterà codificare, uno per uno, tutti i fotogrammi (sappiamo come fare: ogni fotogramma è unimmagine)… e codificare la colonna sonora. Non stupisce che per codificare un breve filmato servano moltissimi bit!

66 `Convergenza digitale o `Multimedialita

67 TEORIA DELLINFORMAZIONE Dobbiamo a Claude Shannon e Warren Weaver la prima definizione teorica rigorosa del concetto di comunicazione ed il primo schema astratto di tutti i processi comunicativi, elaborati alla fine degli anni 40

68 Il concetto di comunicazione Ma, soprattutto a partire dalla metà del novecento, il termine comunicazione è stato sempre più spesso adottato per designare quella particolare forma di trasporto immateriale ed astratto che è il trasferimento di informazione

69 Lo schema di Shannon e Weaver La comunicazione è il trasferimento di informazioni mediante segnali da una fonte a un destinatario Lo schema della comunicazione di Shannon e Weaver è un modello astratto della comunicazione. Esso ha lobiettivo di individuare la forma generale di ogni processo comunicativo e i fattori fondamentali che lo costituiscono, quegli elementi, cioè, che devono essere presenti ogni qual volta si verifichi un passaggio di informazione

70 Lo schema di Shannon e Weaver

71 INFORMAZIONE COME SCELTA Con 2 bit si codificano 4 informazioni (2 2 ) Con 3 bit si codificano 8 informazioni (2 3 ) … Con N bit si possono codificare 2 N informazioni differenti

72 NUMERO DI BIT NECESSARI PER RAPPRESENTARE INFORMAZIONE Se il problema è quello di dover rappresentare M informazioni differenti si deve selezionare il numero di N bit in modo tale che 2 N >= M Esempio: per rappresentare 40 informazioni differenti devo utilizzare 6 bit perché 2 6 = 64 –5 bit non sono sufficienti perché 2 5 = 32

73 COMPRESSIONE Linformazione analogica richiede molti bit Per cercare di ridurre limpiego di bit, possiamo cercare di utilizzare tecniche di compressione Per cercare di ridurre limpiego di bit, possiamo cercare di utilizzare tecniche di compressione Le tecniche di compressione usano ogni trucco possibile per economizzare sul numero di bit utilizzati per la codifica

74 GIF VS. JPEG GIF (75279 bytes)JPEG (15975 bytes)

75 JPEG: PIU / MENO COMPRESSO

76 SUONO ORIGINALE / MP3 CD: –Musica campionata volte al secondo –16 bit per campione –Campioni per sinistra e destra (stereo) –Totale: bits x secondo –= 32 M per una canzone di 3 minuti

77 MP3 Sfrutta conoscenza dei limiti delludito umano per ridurre la quantita di informazione da immagazzinare: –Escludi suoni che lorecchio non puo udire –Quando ce un suono particolarmente rumoroso, non registrare gli altri suoni Fattore di riduzione: anche 10 volte (= 3M per canzone)

78 Crittografia

79 RIASSUNTO Due tipi di informazione: in forma ANALOGICA, in forma DISCRETA (o simbolica) Per rappresentare o comunicare informazione occorre un CODICE Codici digitali: –Per numeri: binario –Per testi: ASCII –Per immagini –Per suoni Compression: JPEG, MP3

80 RIFERIMENTI / SITI Ciotti e Roncaglia, capitolo 1 –Online: d_multimediale/lezioni/01/ d_multimediale/lezioni/01/ d_multimediale/lezioni/01/ Rappresentazione digitale delle immagini e compressione: –http://www.med.unifi.it/didonline/anno- I/informatica/node3.html I/informatica/node3.htmlhttp://www.med.unifi.it/didonline/anno- I/informatica/node3.html JPEG: MP3: –http://it.wikipedia.org/wiki/MP3

81 Acknowledgments Alcune slides prese dal sito online di Testo e Computer (Lenci / Montemagni / Pirrelli) Altre slides ereditate da Ciotti / Roncaglia (via Cuel / Ferrario) Altre slides ancora da Jeremy Sproston (Universita di Torino)


Scaricare ppt "INFORMATICA UMANISTICA B 2: RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE."

Presentazioni simili


Annunci Google