IL SITO WEB DI TORINO 2006: PROGETTO, REALIZZAZIONE, ESERCIZIO Luca Mazzocchi – Senior Solution Architect
Contesto Descrizione del progetto Descriveremo il progetto, la realizzazione e lerogazione dei siti web delle: XX Olimpiadi Invernali di Torino 2006 IX Paralimpiadi Invernali di Torino 2006 Entrambi i progetti sono stati realizzati da Matrix, una società del gruppo Telecom Italia. Il mio ruolo nel progetto è stato di: Responsabile tecnico Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni
Storia Crescita di internet 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni
Il progetto I requisiti 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni Per rispondere ai seguenti requisiti fino a 50 milioni di pagine viste al giorno risultati competizioni in tempo reale velocità di accesso costante da tutto il mondo ridondato geograficamente gestione picchi di traffico e attacchi DoS
Il progetto Capacity plan 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni pagine erogate nellora di massimo traffico = 50 Milioni *0,1 = 5 Milioni media pagine viste al secondo = pagine erogate nellora di massimo traffico / 3600 sec = 1388 pag/sec coefficiente di picco = 2 picco = media pagine viste al secondo * coefficiente di picco = 2777 pag/sec Ipotizzando una pagina d dimensione media di 150 KByte implica una capacità di banda di circa 3,1 GBit/sec = 2770 * 150 Kbyte * 8
Il progetto Studio di fattibilità 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni CMS, pagine statiche vs. pagine dinamiche Ricerche, database vs. search engine Modalità di erogazione, pull vs. push (Akamai) Piattaforma Linux vs. Microsoft
Il progetto Le soluzioni – Architettura basata su CDN Integrazione con CDN di Akamai Nessun web server in data center Telecom Italia Erogati solo file statici CMS Output HTML WAI A e AAA Sistema dei risultati Output HTML WAI A e AAA Motore di ricerca full-text Indicizzazione su file system tipizzazione file HTML 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni
Il progetto Le soluzioni – Architettura basata su CDN 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni Architettura basata Content Delivery Network (Akamai) Overlay Network Contenuti erogati vicino alla richiesta Risoluzione del first mile, last mile, peering e backbone problem reti server 20% traffico internet
Il progetto First mile, last mile, peering e backbone problem 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni
Il progetto First mile, last mile, peering e backbone problem 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni BGP ignora la congestione Esistono rapporti economici internet provider (Tier 1 contro Tier 2,3) Gli internet provider aumentano (così le sessioni BGP) Errori umani (Level 3)
Il progetto Soluzione Akamai - Edge computing 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni
Il progetto Soluzione Akamai - Edge computing 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni
Il progetto Risoluzione DNS 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni
Il progetto Cenni storici 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni Cambridge, MA Founded by MIT research team –F. Thomson Leighton, Chief Scientist –Danny Lewin, CTO –Fondata nel 1995 come iniziativa dellMIT per migliorare le performance di internet Investitori: Apple ($12M), Microsoft ($15M) and Cisco ($49M) stenHashingandRandomTreesDistributedCachingprotocolsforrelieving HotSpotsontheworldwideweb.pdfhttp:// stenHashingandRandomTreesDistributedCachingprotocolsforrelieving HotSpotsontheworldwideweb.pdf Consistent Hashing Akamai vs. Peer to peer
Il progetto Le soluzioni – Architettura basata su CDN 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni Architettura basata Content Delivery Network (Akamai) Nessun web server in data center Telecom Italia Solo pagine statiche (eccetto ricerca con XML/XSLT e linguaggio ESI)
Il progetto Architettura di rete Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni
Il progetto Architettura di rete Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni
Il progetto Data center 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni
Il progetto Le soluzioni – Content management system basato su XML 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni CMS Output HTML Separazione contenuto/presentazione supporta specifiche WAI A e AAA
Il progetto Le soluzioni – Sistema dei risultati 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni Sistema dei risultati Output HTML pipeline di esecuzione indipendenti Scalabile verticalmente e orizzontalmente tempo massimo di gestione messaggio 15 sec
Il progetto Le soluzioni – Motore di ricerca full-text 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni Motore di ricerca Indicizzazione su file system dove possibile Pagine HTML tipizzate con tassonomie Erogazione su server Akamai con trasformazione XML/XSLT
Dati di traffico Indicatori di traffico in sintesi 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni Il picco di consumo di banda è stato di 3,4 Mbit/sec con hit/sec. tempo medio di permanenza per ogni visita è stato di 12 minuti con circa 23 pagine viste Il numero di p.v. per visita ed il tempo di sessione medio indica che gli utenti finali hanno usato il web per seguire le competizioni
Dati di traffico Pagine viste: comparazione con Atene e Salt Lake 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni Sorprendentemente landamento del traffico (misurato in p.v.) di Atene 2004 e Torino 2006 è praticamente uguale Il sito di Torino 2006 ha sviluppato completamente il potenziale di traffico della base di utenti Le pagine dinamiche al crescere del traffico rallentano, gli utenti abbandonano il sito
Costi di progetto Budget e digitalizzazione dei contenuti 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni Il sito di Salt Lake è costato quasi 6 volte quello di Torino Quello di Atene 2004 è costato 3 volte più di quello di Torino Limiti di budget impongono scelte progettuali semplici ma efficaci. Gli indicatori di di performance di Torino 2006 sono migliori di quelli delle precedenti Olimpiadi Limpegno in gg/uomo per le attività di produzione di contenuti digitali ha quasi superato quello delle attività tecnologiche E in linea con la tendenza insita nella convergenza digitale che pone lenfasi sulla produzione di contenuti rispetto ai media con cui si fruiranno
Ruolo della tecnologia Utilizzare tecnologie appropriate 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni Lesperienza di Torino 2006 mostra come la disponibilità di tecnologie appropriate influenzi il web design E stato analizzato il circolo virtuoso rappresentato dalladozione di CDN, pagine statiche, CMS con output HTML e Search Engine Utilizzo della CDN=>Pagine statiche Pagine statiche=>Sito veloce Pagine statiche=>URL usabili Pagine statiche=> Indicizzabili CMS con output HTML=>Architettura informazione regolare Search Engine=>Tassonomizzazione contenuti Tassonomizzazione contenuti=>Contenuti appropriati Semplicità Velocità Contenuti appropriati
Conclusioni Perché sono importanti le tecnologie delle comunicazioni 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni Uomini e donne, età medio giovane Istruzione e reddito alti Professionisti, Imprenditori, Funzionari Centralità sociale, Apertura al cambiamento Sperimentazione, Accettazione del rischio Progettualità professionale e culturale Forti istanze sociali: - partecipazione politica - efficienza servizi - questione morale - iniziativa economica Uomini, età media Istruzione e reddito medio alti Professioni alte e medie Innovazione e rischio Leadership Progettualità professionale Iniziativa economica Questione morale Uomini, età medio-giovane Istruzione e reddito medio bassi Operai e Professioni autonome Decisione, Disponibilità al rischio Individualismo Piacere e divertimento Libertà dai doveri Potere ai lavoratori Elites Contesti adulti maschili
Conclusioni Il futuro 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni La tecnologia ha il compito di essere appropriata rispetto allobiettivo di orientare la base di utenti potenziali allutilizzo del media, qualunque esso sia A Beijing 2008 i problemi che dovranno essere risolti saranno analoghi a quelli di Torino 2006, amplificati dallaccesso al sito della comunità di lingua cinese A Vancouver 2010 lo scenario sarà radicalmente diverso perchè i fenomeni di convergenza digitale renderanno il web uno dei possibili strumenti di comunicazione (IPTV, cellulari evoluti, TV) Diventerà cruciale saper utilizzare tecnologie appropriate (CDN, CMS e Search Engine) per non indurre i potenziali utenti ad utilizzare altri media digitali.
Conclusioni The real life 1.Contesto 2.Storia 3.Il progetto 4.Dati di traffico 5.Costi di progetto 6.Ruolo tecnologia 7.Conclusioni