CODIFICA DELLE INFORMAZIONI
Nel linguaggio naturale Le informazioni possono essere: Numeriche Alfabetiche Alfanumeriche
Nel linguaggio informatico Le informazioni devono essere elaborate dando loro una rappresentazione simbolica idonea chiamata codifica Il sistema dei simboli usati si chiama codice
Linguaggio binario Le cifre binarie sono gli elementi fondamentali della tecnica dei calcolatori elettronici e prendono il nome di bit Il linguaggio binario è la più importante tecnica di codifica basata sui bit che possono assumere il valore 0 o il valore 1 Ogni carattere e ogni parola devono essere ridotti a una successione di bit
I codici Il codice del calcolatore è l’insieme delle configurazioni binarie usate dalla macchina per rappresentare i caratteri L’insieme dei caratteri che possono essere codificati è chiamato repertorio Per costruire un codice che converta in forma binaria ogni carattere del linguaggio naturale è necessario stabilire una corrispondenza biunivoca tra ciascun carattere e una particolare configurazionebinaria
Per costruire un codice che converta in forma binaria ogni carattere del linguaggio naturale è necessario stabilire una corrispondenza biunivoca tra ciascun carattere e una particolare configurazione binaria
Codice ASCII In questo codice ogni carattere viene rappresentato con otto bit e quindi può rappresentare 256 caratteri
BYTE Un gruppo di 8 bit prende il nome di byte Con un byte si possono rappresentare: Una lettera dell’alfabeto Una cifra numerica Un segno speciale
Caratteri non stampabili 33 dei caratteri del repertorio del codice ASCII non sono stampabili e vengono impiegati per segnalare condizioni particolari (per esempio eot che individua la fine del testo)
Al mondo esistono alfabeti diversi da quello latino per “forma del carattere” o per complessità. Per questi diversi alfabeti si è creato un codice di rappresentazione che comprende universalmente tutti i caratteri possibili: l’ UNICODE Codice UNICODE
Codice UNICODE Il codice UNICODE con i suoi 2 byte di rappresentazione può descrivere ben 65.536 caratteri diversi
UNICODE in evoluzione Attualmente lo standard Unicode non rappresenta ancora tutti i caratteri in uso nel mondo. Essendo ancora in evoluzione, si prefigge di coprire tutti i caratteri rappresentabili.
LA COMPRESSIONE DEI DATI La compressione dati è una tecnica utilizzata in ambito informatico per la riduzione della quantità di bit necessari alla rappresentazione in forma digitale di un'informazione.
Tecniche di compressione Le tecniche di compressione dati si dividono in due grandi categorie: compressione dati lossy: comprime i dati attraverso un processo con perdita d’ informazione che sfrutta le ridondanze nell'utilizzo dei dati; compressione dati lossless: comprime i dati attraverso un processo senza perdita d'informazione che sfrutta le ridondanze nella codifica del dato
Compressione dati lossless Le tecniche senza perdita consentono di preservare l'informazione originale in ogni sua parte. È l'unica via possibile quando si devono comprimere file di testo, programmi, documenti, database, schemi elettrici ecc.
ZIP Un esempio è il formato ZIP, il quale consente di archiviare o trasmettere uno o più file risparmiando sulle risorse necessarie (spazio su disco o tempo di trasmissione). Al momento in cui vengono recuperati i file dallo ZIP (decompressione) questi risultano indistinguibili dagli originali.
GIF e PNG Un altro esempio di caso in cui viene usata la compressione senza perdita è quello delle immagini non fotografiche. Per questo scopo esistono formati come il GIF o PNG. L'immagine compressa con uno di questi formati mantiene esattamente l'aspetto originale fino al dettaglio più insignificante.
Compressione dati lossy Le tecniche con perdita di informazione permettono anche delle compressioni molto spinte, quindi un grande risparmio di risorse, a discapito però della qualità dell'immagine o dell'audio che si è voluto comprimere. Generalmente queste tecniche si usano per comprimere i file multimediali. Pur mantenendo minima la perdita di qualità, il risparmio rispetto ad una compressione lossless sulla stessa informazione è sempre decisamente apprezzabile.
Esempi compressioni lossy Le informazioni multimediali come audio o video, in origine sono troppo grandi per essere agevolmente trasmesse o memorizzate, quindi si può preferire avere una piccola riduzione della qualità ma nel contempo file molto più leggeri. Alcuni esempi sono: la compressione di immagini in formato JPEG, largamente usata in fotografia digitale e sul Web, la compressione video in formato XviD oppure la compressione audio in formato MP3.
Fine