INFORMATICA UMANISTICA B 6: APPLICATION LAYER IPERTESTI WEB
RIASSUNTO PUNTATA PRECEDENTE Struttura e realizzazione fisica delle reti Protocolli di comunicazione a diversi livelli: Physical Network Transport Application Internet e TCP / IP
APPLICATION LAYER Si colloca al di sopra del livello Transport ed è il livello nel quale viene svolto il lavoro utile per lutente In questo livello si trovano diversi protocolli, alcuni relativi alle applicazioni che usiamo abitualmente in Internet SMTP: Simple Mail Transfer Protocol FTP: File Transfer Protocol TELNET HTTP: HyperText Transfer Protocol Application Transport Network Link & Physical
I PROTOCOLLI INTERNET IP TCPUDP HTTPFTPSMTPTELNETDNS… … Application layer Transport layer Network layer Link + physical layer
IL MODELLO CLIENT / SERVER
MODELLO CLIENT / SERVER I protocolli del livello Application sono basati sul modello di interazione client/server Per usare i servizi messi a disposizione mediante questi protocolli bisogna contattare un server Per esempio: tutte le volte che usate il browser e richiedete delle pagina di un sito web, di fatto state contattando un web server remoto Per esempio: tutte le volte che inviate una di fatto del vostro provider contatta il mail server del provider del vostro destinatario
IL PROGRAMMA CLIENT Gestisce linterazione con lutente Si preoccupa di fornire uninterfaccia intuitiva `Nasconde linterazione con il server Che avviene tramite messaggi secondo un protocollo tipo SMTP / HTTP / VOIP Esempio di client: browser, mail client (Outlook)
IL PROGRAMMA SERVER Mette a disposizione delle risorse (per esempio, pagine web) Accetta richieste da client locati ovunque (purche trasmesse seguendo protocollo) Potrebbe essere eseguito sullo stesso calcolatore su cui gira il client!! Per esempio, PC che gestisce un sito web
CLIENT / SERVER SU INTERNET
APPLICATION LAYER: POSTA ELETTRONICA Si basa sul protocollo SMTP e permette lo scambio dei messaggi tra gli utenti collegati alla rete È necessario fornire: L indirizzo del mittente L indirizzo del destinatario Il corpo del messaggio Gli indirizzi devono avere un formato ben preciso
LA POSTA ELETTRONICA Nome utente Separatore (simbolo a commerciale che si legge at) Nome host che ospita la casella postale dellutente
LA POSTA ELETTRONICA Per leggere i messaggi di posta elettronica arrivati nella nostra casella, e per scrivere ed inviarne ai nostri corrispondenti, dobbiamo usare uno specifico programma o client mail che preleva i messaggi e li porta sul nostro computer
CLIENT & SERVER MAIL SERVER
Application layer: DNS Gli indirizzi IP numerici sono difficili da ricordare Si usano quindi degli indirizzi simbolici che sono più significativi per lessere umano dit.unitn.it, essex.ac.uk, developer.netscape.com Questi nome vengono tradotti in indirizzi IP numerici mediante il Domain Name System (DNS) Gli indirizzi simbolici hanno un formato come quello seguente … nome5.nome4.nome3.nome2.nome1
Application layer: DNS Sono costruiti a partire da uno schema gerarchico di nomi basato sul concetto di dominio gnu comedugovmilnetorgauitzw unitnunito lettdit www di www … … root Livello 1 Livello 2 Livello 3 Livello 4
Application layer: DNS Domini di primo livello (top level) comAziende eduuniversità americane govistituzioni governative milistituzioni militari netfornitori daccesso orgorganizzazioni non-profit …… auAustralia frFrancia itItalia jpGiappone ukRegno Unito ……
Application layer: DNS Ogni dominio deve essere in grado di risolvere i nomi dei calcolatori di sua competenza Si usano i name server che gestiscono la corrispondenza tra nomi simbolici e indirizzi IP numerici Quando un applicazione deve collegarsi ad una risorsa di cui conosce il nome logico (ad es. invia una richiesta al suo name server localewww.unitn.it
Application layer: DNS Il name server, se conosce la risposta, la invia direttamente al richiedente Altrimenti interroga il name server di top level; questi può conoscere l indirizzo oppure inoltrare l interrogazione ai suoi figli nella gerarchia Si continua con le interrogazioni fino a quando non si ottiene l indirizzo IP numerico della risorsa Quando l applicazione riceve la risposta crea una connessione TCP con la destinazione, usando l indirizzo IP appena ricevuto
APPLICATION LAYER: WORLD WIDE WEB Una `ragnatela di DOCUMENTI collocati su computer in tutto il mondo Il piu grande serbatoio di informazioni che sia mai esistito Si accede tramite: Un client chiamato BROWSER Servers sui siti che distribuiscono informazione Basato su: Il protocollo HTTP per la trasmissione di documenti La nozione di ipertesto
ASPETTI CHIAVE DEL WWW Meccanismo di indirizzamento universale: URL Protocollo HTTP per la trasmissione di documenti Linguaggio HMTL per la formattazione dei documenti
STORIA BREVE DEL WWW Fine anni 80: iniziativa di Tim Berners-Lee al CERN di Ginevra per la condivisione di documenti tra fisici delle alte energie : prime definizioni di URL, HTTP, ed HTML : primo browser facile da usare, NCSA MOSAIC 1995: Nascita di NETSCAPE, inizio della crescita esplosiva Oggi: almeno 8 miliardi di pagine Web
DALLIPERTESTO AL WEB Un ipertesto (HYPERTEXT) e un testo diviso in parti testuali vere e proprie collegate da rimandi (LINKS)
TESTI: LETTURA SEQUENZIALE
IPERTESTI
ESEMPI DI IPERTESTI Quasi tutte le opere enciclopediche oggi hanno forma ipertestuale Esempio: Formato molto comune anche per articoli scientifici (bibliografia, note a pie di pagina) Per esempio, nella BiomedicinaBiomedicina Ma anche nelle materie umanistichematerie umanistiche Narrativa ipertestuale: Lettore puo scegliere che percorso seguire Primo esempio riconosciuto: Afternoon, a story di Michael Joyce La Electronic Literature Organization mantiene una Electronic Literature Directory Electronic Literature Directory
DALLIPERTESTO AL WEB 1945 Vannevar Bush: lorganizzazione lineare dei testi non corrisponde veramente a come pensiamo Il termine HYPERTEXT introdotto da Ted Nelson (1965) Nel 1980 Bill Atkinson sviluppo per la Apple il programma HYPERCARD che permetteva di creare ipertesti tramite il linguaggio HYPERTALK 1989 Tim Berners-Lee sviluppa come parte del progetto WWW il linguaggio HTML, che permette di esprimere links. Il WWW e un immenso hypertext distribuito
HTML Il linguaggio storico della Web Un linguaggio di annotazione dei documenti che permette di collegare documenti in un ipertesto Due funzioni principali: Specificare come il documento devessere visualizzato Specificare links (usando URL) Discusso nei laboratori
ESEMPIO DI HTML: CODICE DI UNA PAGINA WEB
RISULTATO
INDIRIZZI SU RETE: URL URL (Uniform Resource Locator) e lo standard per gli indirizzi delle risorse su Web Specifica: Come accedere alla risorsa (PROTOCOLLO) Dove si trova la risorsa (indirizzo dellhost) Nome della risorsa (path) Formato: protocollo://host/path
URL PER HTTP Forma generale: scheme://host:port/path?parameter=value#anchor Esempi:
ALTRI TIPI DI URL indirizzo di documenti sullo stesso computer: file://localhost/path file://C:/Documents%20and%20Settings/poesio/ documenti su altri computer via FTP: ftp://ubvm.cc.buffalo.edu/vmsysu%3alistserv.web share
HTTP Si basa sul protocollo HTTP (HyperText Transfer Protocol) che gestisce l interazione tra un client e un server web Client e server si scambiano dei messaggi Richieste da parte del client Risposte da parte del server Pi ù precisamente: L utente richiede una pagina residente su un server e il suo browser richiede una connessione TCP con il server Il server accetta la connessione iniziata dal browser Il browser ed il server si scambiano messaggi La connessione viene chiusa
ESEMPIO DI COMUNICAZIONE HTTP GET /wiki/Pagina_principale HTTP/1.1 Connection: Keep-Alive User-Agent: Mozilla/5.0 (compatible; Konqueror/3.2; Linux) (KHTML, like Gecko) Accept: text/html, image/jpeg, image/png, text/*, image/*, */* Accept-Encoding: x-gzip, x-deflate, gzip, deflate, identity Accept-Charset: iso , utf-8;q=0.5, *;q=0.5 Accept-Language: en Host: it.wikipedia.org BROWSER SERVER HTTP/ OK Date: Mon, 28 Jun :47:31 GMT Server: Apache/ (Unix) PHP/4.3.4 Content-Language: it Content-Type: text/html; charset=utf-8 …. [...]
MOTORI DI RICERCA Dato il numero enorme di documenti sul Web, qualche modo per trovare linformazione e necessario Due modi principali Catalogo tematico ( Ricerca (altavista, Lycos, google) Motori di ricerca: Indicizzano miliardi di documenti Permettono di ritrovare I documenti giudicati rilevanti data una query
TRATTAMENTO DI TESTI PER I MOTORI DI RICERCA: Vedi modulo C
APPLICATION LAYER: ALTRI ESEMPI TRASFERIMENTO FILE: Si basa sul File Transfer Protocol (FTP) Permette di collegarsi a siti remoti per prendere (download)/salvare (upload) file L accesso può essere riservato (tramite login e password) oppure aperto a tutti (si parla di anonymous ftp) COLLEGAMENTO REMOTO: Telnet: permette di collegarsi a calcolatore che si trovano in localit à remote per lavorare interattivamente su di essi SSH VOIP (Skype e simili)
LETTURE Ciotti e Roncaglia, capitoli V-VI Simona Casciano, Filologia ed informatica, disponibile su Griselda OnlineFilologia ed informatica Su Wikipedia: World Wide Web HTTP URL