La misura dell’audience nel web

Slides:



Advertisements
Presentazioni simili
Presentazione della tesi di laurea di Flavio Casadei Della Chiesa Newsletter: un framework per una redazione web.
Advertisements

LA PUBBLICITA’ E I MEDIA
Il gestore di posta elettronica per le aziende e per gli studi
1 Consorzio interuniversitario per le Applicazioni del Supercalcolo Per Università e Ricerca Stelline 2008 Sala Volta, venerdì 7 marzo 2008 Seminario:
Corso di Fondamenti di Informatica
Dati Nielsen//NetRatings
INTERNET : ARPA sviluppa ARPANET (rete di computer per scopi militari)
La Navigazione in Internet
LA MICROSEGMENTAZIONE DEL MERCATO
Reti Informatiche.
IL NOSTRO LABORATORIO. Di INFORMATICA..
Giovedì, 4 dicembre 2003 Nuovo marketing tra tecnologia e creatività Francesca Bodini direttore di Mkt
1 Progettare e operare nella scuola dellautonomia Attività di formazione del personale del sistema scolastico Tratto da LA SCUOLA per lo Sviluppo Programma.
TESTO ARGOMENTATIVO PASSI SMONTAGGIO SCHEMA 2. RICONOSCIMENTO PARTI
Strumenti e strategie del web 1.0 Gino Roncaglia (Università della Tuscia)
Web Information Systems (I parte) Prof. Barbara Pernici Politecnico di Milano.
EDITORIA ON-LINE INDAGINE FRA I SOCI ANES settembre - dicembre 2006 A cura della Segreteria ANES.
La vendita online b2c. PROBLEMATICHE (I) 1.Le caratteristiche del prodotto è adatto alla vendita online? 2.Il mercato in cui si opera come avviene la.
1 Itis Gastaldi-Giorgi Genova SOMMARIO 50 anni di Tv Tv: grande strumento mediatico Tv interattiva La Tv con la tastiera Confronto tecnologie televisive:
Apprendimento collaborativo in rete
Danco Singer Larga Banda Master in Editoria Multimediale La velocità di trasportare contenuti.
Danco Singer Larga Banda Master in Editoria Multimediale La velocità di trasportare contenuti.
Architettura del World Wide Web
percorso guidato in 4 fasi
RISORSE WEB Internet Per un uso consapevole delle risorse della Rete
4 Cosa è una rete? ã Punto di vista logico: sistema di dati ed utenti distribuito ã Punto di vista fisico: insieme di hardware, collegamenti, e protocolli.
Cos’è un CMS? Content Management System
Ecdl modulo 7.
Decreto Interministeriale 16 agosto 2005 Misure di preventiva acquisizione di dati anagrafici dei soggetti che utilizzano postazioni pubbliche non vigilate.
Corso di Informatica per Giurisprudenza Lezione 7
Social network Internet. Eun sito web di reti sociali, ad accesso gratuito. È il secondo sito più visitato al mondo, preceduto solo da Google. Il.
OSSERVATORIO IPSOS per conto di. DIFFUSIONE di COMPUTER e INTERNET tra le famiglie italiane 2 Valori % Fonte: speciale Eurobarometro – Luglio 2013 Base:
Modulo 7 – reti informatiche u.d. 2 (syllabus – )
Modulo 1: 1.3 Le Reti.
AMS - DICEMBRE 2001 UTENZA DA CASA & UFFICIO Copyright Nielsen//NetRatings 1 Legenda Active Internet Universe Tutti i membri delluniverso che usano Internet.
Modulo 7 – reti informatiche u.d. 1 (syllabus – )
+ eLogic Incontri 2013: #NextToYou eLogic S.r.l. Anno di fondazione: 2001Numero di addetti: 18 Fatturato 2012: Clienti: circa 150.
1 3SKL. 2 Triskel e 3SKL (the e-container) La tecnologia web consente oggi diverse opportunità di business fornendo servizi mirati, raggiungibili in tutto.
La vita cittadina entra nel Sito del Comune. Lo Strumento La Città Virtuale si propone come uno strumento di contatto e interfaccia con i cittadini, le.
Internet L’essenziale.
Test Reti Informatiche A cura di Gaetano Vergara Se clicchi sulla risposta GIUSTA passi alla domanda successiva Se clicchi sulla risposta ERRATA passi.
Roma, 15 Novembre 2007 Stefano Spaggiari Come sfruttare efficacemente il Web 2.0 e lo user generated content.
A SCUOLA DI PODCASTING nell’era del web 2.0 Lecco
Lo Shop di MLOL e il prestito digitale
Canale Alfa Srl – Copyright 2013
SISTEMA INOLTRO TELEMATICO ISTANZE DECRETO FLUSSI 2010
1 Ripassino Reti di Computer Carasco 19/02/ Che cosa è una rete informatica? Una rete informatica è un insieme di computer connessi tra di loro.
Idea di Progetto. Comunica: è la soluzione sviluppata da RicercAzione associati e Omnia comunicazione per creare un vero e proprio canale televisivo interno.
Cosa Proponiamo…… Il Centro C.E.A. Centro Emergenza Amica ,
EM 09 INTERNET … UN PO DI STORIA. EM 09 Nasce per garantire comunicazioni efficienti … Tra le sedi delle forze armate americane Tra le sedi delle forze.
Evolve. Il software EVOLVE consente un veloce accesso, visualizzazione ed estrazione dei dati contenuti nel data base dellAmministrazione del Personale.
P.L. Fabbri Gli Hard Disks sono oggetti molto affidabili. Strategie di Backup dei dati … fino a che non si guastano !!!
Internet: una panoramica
Il portale di commercio elettronico per le pmi italiane Napoli,
Creato da Riccardo Nuzzone
UNIVERSITÀ DEGLI STUDI DI PAVIA Dipartimento di Lettere e Filosofia, Scienze Politiche, Giurisprudenza, Ingegneria, Economia Corso di Laurea Interdipartimentale.
PIATTAFORMA MAESTRA.
1 Storia di Internet Internet non è un’invenzione degli anni ’90….. Nata dagli studi di un’agenzia detta ARPA (Advanced Research Projects Agency) Internet.
InternetInternet Sede: Salvo D’acquisto 2010/2011 Docente: Vito Monno.
T4T nasce da alcune riflessioni sul Web Un’iniziativa mirata alla definizione di uno strumento software che possa aiutare le attività professionali dei.
Reti di computer Condivisione di risorse e
Servizi Internet Claudia Raibulet
Pag. 1/23 AOL – Albo pretorio on-line Sistema informativo per l’esposizione pubblica degli atti su Internet.
2 Una overview sui dati Fonte Audiweb, marzo 2015 Quanti sono gli Italiani online?
Flipped classroom e nuove metodologie didattiche Modulo 2 – Terza lezione Antonio Todaro “ Il Sito Web del docente ” prima parte.
Le basi di dati.
Padova, 17 novembre
SVILUPPO E GESTIONE DEL CONTENUTO Lo sviluppo e la gestione del contenuto è un elemento fondamentale su Internet perché il web permette di arricchire,
"La presenza straniera in Italia: l'accertamento e l'analisi" L’integrazione straniera nel tessuto economico: fonti attuali e prospettive Manlio Calzaroni.
Transcript della presentazione:

La misura dell’audience nel web Prof. Sergio Brasini Dipartimento di Scienze statistiche Alma Mater Studiorum - Università di Bologna brasini@stat.unibo.it

I contenuti dell’intervento Introduzione La diffusione di Internet in Italia Le metodologie di rilevazione dell’audience sulla Rete L’architettura client-server L’indirizzo IP e i cookies La misurazione site-centric La misurazione ad-centric La misurazione user-centric Le tendenze future Considerazioni finali

La relazione tra pubblicità e risposta del consumatore Le campagne di comunicazione pubblicitaria diffuse attraverso i mass media determinano nei consumatori/utenti risposte che si articolano su tre distinti livelli: a) risposta cognitiva; b) risposta affettiva; c) risposta comportamentale.

Le misurazioni sui mezzi di diffusione della pubblicità Nell’attività di pianificazione di queste campagne è di importanza fondamentale la conoscenza delle informazioni rilevate tramite le principali indagini statistiche sui profili di fruizione dei mezzi di diffusione della pubblicità.

Le misurazioni sui mezzi di diffusione della pubblicità Gli uomini di marketing e gli esperti di comunicazione hanno bisogno di dati attendibili, e quindi di sistemi di misurazione affidabili, per poter prendere al meglio le loro decisioni. Conoscere lo stato di un mercato significa anche conoscere il modo in cui le informazioni vengono generate ed elaborate.

Le misurazioni sui mezzi di diffusione della pubblicità Tra gli elementi fondamentali per chi deve decidere un investimento pubblicitario vi è l’accertamento dell’audience. Questo accertamento è essenziale per la messa a punto delle campagne pubblicitarie in ragione del pubblico al quale il messaggio è rivolto e degli obiettivi della comunicazione. Ogni mezzo ha il suo sistema di rilevazione.

Le misurazioni sui mezzi di diffusione della pubblicità Audience televisiva (AUDITEL) Audience radiofonica (AUDIRADIO) Audience di quotidiani e periodici (AUDIPRESS) Audience di cartellonistica e affissioni (AUDIPOSTER) Audience di Internet (?)

Che cos’è Internet? Internet può essere considerato in molti modi diversi. Come un mezzo di comunicazione e di scambio interpersonale: one to one (mail, sms, cartoline, chat private, instant messanging, ecc.); one to many (bacheche, forum, chat, ecc.); many to one (newsletter, streaming broadcast, ecc.); many to many (chat, gruppi di discussione, gruppi di acquisto, ecc.). Come un mass medium interattivo: diffusione di contenuti e di servizi; piattaforma di trasporto per produzioni multimediali (audio, video, dati, ecc.); enciclopedia universale (motori di ricerca, directories, ecc.). Come un canale commerciale: mezzo per informarsi, vedere e provare in vista di acquisti off-line; mezzo per effettuare acquisti on-line di beni e servizi. Come un veicolo di marketing diretto: comunicazione diretta con i propri clienti e raccolta di informazioni; invio mirato di messaggi (anche pubblicitari).

La diffusione di Internet in Italia La situazione del numero di utenti Internet italiani a novembre 2001, in relazione al luogo di accesso, era la seguente (dati in milioni): Fonte: Onetone Research, dicembre 2001 Per utente Internet si intende un individuo di almeno 15 anni di età che accede alla Rete autonomamente almeno una volta al mese. Dunque ormai l’85 per cento degli utenti Internet dispone di una connessione da casa, il 37 per cento dall’ufficio.

La diffusione di Internet in Italia Andamento del numero di utenti Internet residenziali in Italia dal febbraio 2000 al novembre 2001 7,71 milioni di utenti Internet residenziali in Italia al novembre 2001 Fonte: Onetone Research, dicembre 2001

La diffusione di Internet in Italia A partire dalla primavera del 2001 si è registrata una brusca frenata nel tasso di crescita degli utenti residenziali che oggi prosegue ad un ritmo inferiore ad un punto percentuale al mese. Nonostante si parli spesso del free Internet, in realtà esso non è mai esistito perché il tempo speso on-line dagli utenti è sempre stato pagato agli Internet Service Provider (ISP). Il free Internet è una leggenda (e un’ottima trovata di marketing) nata dal fatto che fino al 1998 per collegarsi a Internet bisognava acquistare una password da un provider e quindi pagare a Telecom l’importo basato sul consumo telefonico ad ogni accesso alla Rete.

La diffusione di Internet in Italia Con la liberalizzazione del mercato telefonico e la definizione delle tariffe di interconnessione, lo scenario del mercato è cambiato in modo radicale nel giro di pochi mesi. Grazie alla forza dell’offerta di Tiscali, il primo ISP a credere nell’idea del “pay as you go”, il precedente modello è stato sostituito da un sistema nel quale la password di accesso diveniva gratuita e l’unica spesa da sostenere era quella di connessione (destinata, in parte, allo stesso ISP grazie all’interconnessione degli operatori). Di qui l’introduzione del termine free, relativo in realtà ad una sola parte del servizio di connettività, cioè quella dell’iscrizione ad uno specifico ISP.

La diffusione di Internet in Italia All’introduzione del “pay as you go” hanno fatto seguito due anni di fortissima crescita del numero dei sottoscrittori. Tiscali ha forzato gli altri grandi ISP ad adottare in brevissimo tempo lo stesso modello e il numero di famiglie connesse è pressoché triplicato. Il “pay as you go” ha avuto un grande effetto di accelerazione nella penetrazione residenziale della Rete e nel giro di due anni ha consolidato la posizione dei tre più grandi ISP (Tiscali, Tin.it e Wind-Infostrada). Questi hanno detenuto stabilmente una quota variabile tra l’83 e l’88 per cento del mercato residenziale, ciascuno incrementando notevolmente la propria base di utenti.

La diffusione di Internet in Italia Il “pay as you go” è un modello che ha dimostrato di funzionare. Tiscali sta per raggiungere il pareggio operativo grazie ai ricavi derivanti dalla connettività. Altre realtà che non possono contare sui ricavi dell’accesso (ad es. Virgilio, Kataweb, ecc.) hanno registrato invece forti perdite e sono ancora alla ricerca di un modello economico sostenibile. Eppure sono proprio i servizi e i contenuti erogati in Rete a spingere gli utenti a collegarsi. Qui emerge con evidenza l’asimmetria: chi spende per offrire i contenuti e i servizi on-line generalmente non è colui che riscuote il pagamento della loro fruizione da parte degli utenti.

La diffusione di Internet in Italia Il rallentamento della crescita degli utenti residenziali sta facendo sì che da alcuni mesi il mercato sia sostanzialmente saturo. Per gli ISP acquisire nuovi utenti può avvenire solo a scapito dei concorrenti. La penetrazione del pc nelle famiglie italiane ha superato ormai il 30 per cento. Se tutte queste famiglie fossero connesse alla Rete, potremmo avere 11 milioni di utenti Internet da casa (si ha infatti una media di 1,5 utenti attivi mensili per nucleo familiare connesso). Ancora oggi però il 30 per cento dei pc presenti nelle case italiane non dispone di una connessione alla Rete.

La diffusione di Internet in Italia A sua volta il numero di utenti attivi per famiglia continua a rimanere stabile, segnalando l’assenza di un effetto formativo che la presenza di un individuo connesso in famiglia potrebbe esercitare sugli altri familiari, educandoli all’uso di Internet. Esiste tuttora una barriera culturale nell’approccio al pc che costituisce un fattore di forte inibizione all’accesso a Internet.

La diffusione di Internet in Italia L’accesso ai servizi on-line non si limita al web: vi sono diverse attività che gli utenti svolgono quando sono connessi a Internet. Volumi di consumo di banda (assoluti e per utente) delle diverse applicazioni (protocolli) Internet nel caso dell’utenza residenziale Fonte: Onetone Research, dicembre 2001

La dimensione del mercato pubblicitario sulla Rete Secondo le rilevazioni dell’Osservatorio Internet Advertising di IAB (Internet Advertising Bureau - sigla che raggruppa i più importanti editori e concessionarie pubblicitarie che promuovono e vendono pubblicità interattiva su Internet, wireless e altri media) e di PricewaterhouseCoopers, il mercato della web advertising ha generato in Italia nel corso del 2000 267 miliardi di lire di entrate, con una crescita che si avvicinava al 400 per cento rispetto all’anno precedente.

La dimensione del mercato pubblicitario sulla Rete L’andamento del 2001, per il quale non sono ancora disponibili i dati definitivi, ha fatto segnare al contrario una flessione. Nel corso del 2000 i settori che hanno investito maggiormente in pubblicità on-line sono le telecomunicazioni (51 miliardi) e i servizi finanziari (45 miliardi). Al terzo posto segue il comparto dei New Media (37 miliardi).

La dimensione del mercato pubblicitario sulla Rete Lo strumento più diffuso è il banner (63 per cento del totale del fatturato pubblicitario on-line), seguito dai progetti di sponsorship di vario genere (19 per cento) e da e-mail, interstitial e altre tipologie (18 per cento).

Strumenti e informazioni per la pianificazione pubblicitaria Lo sviluppo della comunicazione e della pubblicità on-line necessita di maggiori informazioni quantitative e qualitative sui target e sull’audience dei siti web. Le imprese hanno sempre più bisogno di nuovi strumenti per misurare il ritorno sugli investimenti.

Strumenti e informazioni per la pianificazione pubblicitaria Internet è per sua natura un mezzo misurabile. Non esiste tuttavia un unico sistema di misurazione per la valutazione dell’audience di Internet. Le indagini disponibili attualmente si avvalgono di tre diversi sistemi di rilevazione.

Le metodologie di misurazione dell’audience sulla Rete Elementi propedeutici: l’architettura client-server; il codice HTML; l’indirizzo IP e i cookie; i log-file. Le tre tipologie di misurazione quantitativa: la misurazione site-centric; la misurazione ad-centric; la misurazione user-centric.

L’architettura client-server

L’architettura client-server Il computer client effettua la richiesta di una pagina. Il server risponde, invia la pagina e registra l’attività. Il client può visualizzare o meno l’informazione richiesta …

L’architettura client-server … di conseguenza ciò che viene registrato sul server non è l’effettiva visualizzazione della pagina ma la sua sola richiesta (hit).

Il codice HTML Il codice HTML fa riferimento a diversi file e a diversi formati. Una pagina HTML può essere composta di: testo; immagini; file multimediali di diverso tipo; altre pagine HTML (frame).

Il codice HTML Ogni singolo oggetto, immagine o testo inserito in una pagina HTML equivale ad un hit. Perciò non può esistere una relazione precisa tra il numero delle pagine viste da un utente e il numero degli hit generati dal server web a fronte delle richieste del client.

L’indirizzo IP Ad ogni computer connesso a Internet è associato un numero come questo: In base a tale numero si possono identificare alcune informazioni: la nazione di collegamento; l’Internet Provider o l’azienda; il singolo computer (ma solo in condizioni di indirizzo IP statico). Se l’indirizzo IP è statico, diventa possibile riconoscere lo stesso utente quando torna a visitare un dato sito. 193 . 45 . 45 . 1

I cookie I cookie sono dei file di testo che il server web rilascia automaticamente al browser del client collegato: il cookie consiste in una specie di codice che viene salvato sul pc dell’utente (se impostato per accettarlo): alla visita successiva, il server controlla la presenza di un suo cookie su quello stesso pc al fine di riconoscerlo;

I cookie un esempio di cookie è il seguente: RMID#d42d6252399c1080#ilsole24ore.it/#0#3567004032#30124358#668302416#29362279#* esistono diversi tipi di cookie (permanente o di sessione); il contenuto informativo del cookie varia da sito a sito, ed è conservato nella maggior parte dei casi sul server, dove i software più evoluti provvedono ad elaborarlo assieme alle altre statistiche di traffico.

I log-file Si tratta di file di registrazione dell’attività del server che ospita il sito web preso in esame. Esistono quattro tipi di log-file che esprimono diversi stati e tipologie di richieste: il transfer-log registra tutti i file trasferiti dal server web all’utente; l’error-log registra gli errori che si sono presentati durante il trasferimento; l’agent-log descrive lo user/agent che ha effettuato una richiesta al server (ad es. un tipo di browser o un motore di ricerca); il refer-log registra la provenienza dei visitatori.

I log-file 194.244.79.133 - - [15/Apr/2002:16:28:22 +0100] "GET /pic/titolo.gif HTTP/1.0" 200 7224 "http://www.stat.unibo.it/" "Mozilla/4.5 [en] (Win98; I)” 194.244.79.133 - - [15/Apr/2002:16:28:22 +0100] "GET /pic/news.gif HTTP/1.0" 200 3549 "http://www.stat.unibo.it/" "Mozilla/4.5 [en] (Win98; I)" 194.244.79.133 - - [15/Apr/2002:16:28:22 +0100] "GET /pic/freccia.gif HTTP/1.0" 200 262 "http://www.stat.unibo.it/" "Mozilla/4.5 [en] (Win98; I)" 194.244.79.133 - - [15/Apr/2002:16:28:22 +0100] "GET /pic/separatore.gif HTTP/1.0" 200 273 "http://www.stat.unibo.it/" "Mozilla/4.5 [en] (Win98; I)" 194.244.79.133 - - [15/Apr/2002:16:28:22 +0100] "GET /pic/titolosotto.gif HTTP/1.0" 200 1373 "http://www.stat.unibo.it/" "Mozilla/4.5 [en] (Win98; I)" 194.244.79.133 - - [15/Apr/2002:16:28:30 +0100] "GET /download/pic/download.gif HTTP/1.0" 200 6820 "http://www.stat.unibo.it/download/index.html" "Mozilla/4.5 [en] (Win98; I)"

I log-file http://www.stat.unibo.it CLIENT SERVER WEB LOG-FILE HIT = unità di base che rappresenta la singola informazione registrata dai log-file di un server web. Ogni singolo oggetto, immagine o testo inserito in una pagina equivale a un hit.

Metodi di misurazione La misurazione site-centric: si basa sull’analisi dei dati contenuti nei log-file; provvede all’identificazione dei computer tramite l’indirizzo IP o i cookie. La misurazione ad-centric: pone al centro dell’attenzione i dati provenienti da un ad-server ed è concettualmente identica a quella site-centric; per ad-server si intende un insieme di hardware e software dedicato all’invio di banner (ma anche di bottoni ed interstitial) ai diversi siti web secondo parametri predefiniti. In pratica, ogni volta che un utente si collega ad una pagina web, l’ad-server intercetta la richiesta e in base ai parametri più vari (casualità, dominio di partenza dell’utente, tipologia della pagina di provenienza, parola ricercata, ecc.) invia il banner più appropriato.

Metodi di misurazione La misurazione user-centric: si basa sulla registrazione dell’attività di navigazione di un campione statistico rappresentativo (panel) di utenti di Internet tramite pc meter; determina l’interazione di un utente con la Rete e non con un solo sito, offrendo una visione più completa; fornisce dati uniformi e comparabili per i diversi siti; consente l’identificazione degli utenti tramite dati socio-demografici e psicografici.

La misurazione site-centric Attraverso l’analisi dei log-file si conteggiano le pagine di un sito web inviate in seguito alle richieste degli utenti, ma non quelle effettivamente visualizzate dai browser o visualizzate attraverso un server proxy (una specie di server fotocopia che ha la funzione di alleggerire il traffico in arrivo a un sito, per problemi di affollamento o di dislocazione geografica) o registrate sulla cache memory del computer client. Offre un quadro completo sulle performance di un sito, ma non fornisce alcun dato sugli altri siti presenti in Rete.

Il problema delle duplicazioni Tramite la metodologia site-centric non è sempre possibile riconoscere il singolo utente, se lo stesso accede alla Rete da pc differenti (da casa, dall’ufficio, dall’università o da altri luoghi). Identico problema si ha se l’identificazione avviene tramite un indirizzo IP dinamico anziché statico. L’uso di cookie, in alcuni casi, può rappresentare una soluzione, ma anch’essa non è esente da limiti.

La misurazione site-centric Nei log-file di un server web sono registrati in maniera censuaria tutti gli eventi relativi al sito in esame. Poiché misurano richieste di pagine, non sono oggetto di errori statistici o di distorsioni campionarie. Hanno però lo svantaggio di non offrire una misura uniforme: tecnologie diverse utilizzate da siti diversi spesso danno informazioni diverse pregiudicando analisi comparate tra siti.

La misurazione site-centric Gli indicatori fondamentali sul flusso di traffico di un sito web. Hits qualificati: il numero di richieste dei singoli file che compongono la pagina web, al netto degli errori e delle richieste abortite durante il trasferimento della pagina da parte dell’utente. Il numero degli hits qualificati registrati da un sito è utile per definire grossolanamente il volume di traffico di un sito, ma non il numero di persone che lo hanno visitato.

La misurazione site-centric Gli indicatori fondamentali sul flusso di traffico di un sito web. Page views (visualizzazioni delle pagine): il numero di pagine HTML richieste al server web. Visits (visite): il numero di sessioni di visita al sito in un certo periodo di tempo; una visita inizia con il primo hit e termina dopo la scadenza del time out (di solito venti minuti o mezz’ora) dall’ultimo hit registrato. Visitors (visitatori): il numero di singole persone che visitano il sito in un certo periodo di tempo.

Perché Internet è diverso dagli altri media? Perché consente di indirizzare messaggi personalizzati e di interagire con gli utenti. E’ essenziale produrre conoscenze sui visitatori del sito.

Le tipologie di visitatore Visitatore non identificato ( o di sessione): di lui non sappiamo nulla se non l’attribuzione di un indirizzo IP in un dato periodo di tempo dell’analisi. ? Visitatore rintracciato: di lui conosciamo solo un codice numerico (ad es. un cookie). Visitatore identificato: di lui sappiamo molte cose (ad es. si è registrato sul sito, utilizza servizi, acquista prodotti on-line, ecc.)

Le tipologie di visitatore Per i visitatori non identificati si rendono disponibili solo informazioni quantitative sul loro: numero; tempo di permanenza; provenienza. Per i visitatori identificati si hanno a disposizione informazioni qualitative e di efficacia in termini di: personalizzazione dei banner; copertura; frequenza; duplicazione di esposizione; flussi di navigazione.

La misurazione site-centric Il comportamento di navigazione all’interno del sito costituisce uno degli aspetti di analisi più importanti. Le variabili più rilevanti prese in considerazione sono: dettaglio pagine di ingresso/uscita; dettaglio pagine viste singolarmente; dettaglio Url (uniform resource locator) di provenienza; dettaglio keyword di ricerca; frequenza delle visite; durata delle visite; tempi di permanenza per pagina.

La misurazione site-centric L’analisi della provenienza del traffico consente di valutare in prima istanza l’efficacia della pianificazione pubblicitaria on-line. I dati che si rendono disponibili sono particolarmente utili per un’analisi diagnostica del sito web e sono indispensabili per le funzioni di verifica della qualità dei contenuti editoriali.

I software di log-analysis Principali funzioni dei software Elaborano i dati contenuti nei log-file. Procedono al conteggio degli indicatori fondamentali (hits, page views, visits, visitors, ecc.). Producono report più o meno dettagliati a seconda del prodotto relativamente a: sito di provenienza dei visitatori; flusso del traffico nel sito; aggregazioni dei dati per sezione/sottosezione/pagina. Consentono la creazione di database per l’archiviazione dei dati sotto forma di serie temporali e per facilitare analisi di data webhousing. Sono assolutamente indispensabili per le funzioni di internal audit di quei siti che basano sul traffico il proprio modello di business.

I software di log-analysis L’uso di questi programmi è dunque prevalentemente interno: i publisher li acquistano per controllare il traffico nelle diverse sezioni di un sito, in modo da stabilire quali sono quelle maggiormente frequentate e quelle che denotano invece uno scarso successo. I report tecnici che si ottengono possono aiutare i webmaster a risolvere eventuali problemi in tempi rapidi.

La misurazione ad-centric: una variante di quella site-centric Tecnologia di ad-serving L’ad-server (una evoluzione del log-analyzer) è un insieme di hardware e software che gestisce l’invio di banner, bottoni e interstitial ai diversi siti ogni volta che l’utente richiede una pagina web. Se il visitatore è rintracciato o identificato diventa possibile inviargli banner personalizzati in base alle sue abitudini di navigazione. Le concessionarie di pubblicità on-line lo utilizzano anche per certificare l’andamento delle campagne. Alcune Internet Solution Companies hanno iniziato ad usarlo per gestire autonomamente le attività di reportistica e di certificazione.

La misurazione ad-centric Come funziona Il set-top box (server) è un sistema a scatola chiusa ed impedisce che i log-file vengano alterati dagli editori dei siti. I software di log-analysis leggono i log-file ed elaborano le statistiche di accesso. Le società di certificazione producono le statistiche di base avvalendosi dei software di log-analysis e del set-top box. L’Internet Advertising Bureau ha definito i criteri di misurazione delle grandezze base più importanti dal punto di vista pubblicitario.

Il set-top box Si tratta del server (in-house o remoto) su cui vengono trascritti i log-file. I log-file vengono copiati in uno spazio all’interno del set-top box. Il software di log-analysis risiede su questa macchina. Solo le società di certificazione possono accedere ai log-file e alla configurazione del software.

Le grandezze più importanti dal punto di vista pubblicitario Impression: numero di volte in cui un banner è stato richiesto dai client; indica in sostanza il numero lordo di volte che un annuncio è stato potenzialmente visto dagli utenti. Click-through: numero di volte in cui un banner (o un altro oggetto pubblicitario) è stato cliccato dai navigatori consentendo la visualizzazione della pagina bersaglio. Frequenza: numero di volte in cui un navigatore è stato esposto ad un annuncio pubblicitario. Reach: quota percentuale di un target group esposta ad un oggetto pubblicitario.

Le grandezze più importanti dal punto di vista pubblicitario E’ interessante notare la perfetta analogia tra i concetti di Page views in ambito site-centric e di Impression in ambito ad-centric: essi possono però assumere valori diversi per motivi legati all’infrastruttura sistemistica degli ISP (presenza di server proxy) o alle modalità di accesso da parte degli utenti (ricorso alla memoria cache del pc). Per motivi identici si possono presentare discrepanze tra i click-through dichiarati dall’editore del sito ospitante il banner, evidenziati sui report generati dall’ad-server, e i reali accessi al sito dell’inserzionista pubblicizzato dal banner.

La misurazione user-centric Come funziona I dati fanno riferimento ad un panel rappresentativo della popolazione in oggetto. A tutti i componenti del panel viene installato sui personal computer un meter. Una società di ricerca raccoglie i dati dai pc meter e li elabora secondo le richieste.

La misurazione user-centric L’affidabilità di una ricerca user-centric dipende essenzialmente da tre elementi: la bontà della costruzione del panel; la qualità del software (meter); la metodologia adottata e il processo di analisi dei dati.

Le informazioni rilevanti in ottica user-centric La rilevazione basata sulle persone permette di incrociare le modalità di navigazione e l’esposizione ai banner con: le caratteristiche socio-demografiche di utente e famiglia; le informazioni su siti e servizi concorrenti (i miei utenti consultano anche il sito xyz); le caratteristiche psicografiche di utente e famiglia (per le metodologie più evolute); le propensioni all’acquisto e i consumi (per le metodologie più evolute).

Le informazioni raccolte sull’attività di navigazione in ottica user-centric Frequenza d’uso di Internet, orari, durate delle sessioni. Siti e pagine visitati (con frequenze, durate e orari delle visite). Modalità di navigazione (scrittura delle URL, ricorso ai bookmark, uso dei link intrasito/intersito, uso dei motori di ricerca, ecc.). Memorizzazione di siti preferiti. Ricorso a FTP e attività di scaricamento di file. Iscrizione a servizi a pagamento. Acquisti on-line. 

Caratteristiche della misurazione user-centric Si fa uso di tecniche longitudinali di rilevazione del traffico che si basano sull’osservazione del comportamento di un campione di utenti tipo. La metodologia di questa rilevazione è identica a quella che si adotta generalmente per gli altri media tradizionali (televisione, radio, stampa quotidiana e periodica).

Caratteristiche della misurazione user-centric L’organizzazione che si propone come parte terza seleziona di solito un campione panel di utenti, quanto più possibile rappresentativo dell’universo degli utenti Internet. Successivamente, verificata la disponibilità delle unità selezionate, si procede all’installazione di un pc meter sulle macchine collegate ad Internet. Il pc meter contiene un software che analizza i dati di traffico dell’utente, li precodifica e li invia al centro di raccolta.

Caratteristiche della misurazione user-centric La metodologia è dunque campionaria. Quanto più il campione è somigliante alla composizione generale dell’utenza Internet, tanto più il risultato sarà attendibile. I vantaggi di questa metodologia stanno nella sua estrema flessibilità e nel fatto che, rilevando i comportamenti dell’utenza piuttosto che del server web, si possono avere immediatamente i dati relativi a tutti i siti.

Caratteristiche della misurazione user-centric Il dato di principale interesse ai fini pubblicitari è costituito dalla audience unica mensile (o reach). Questa metodologia di rilevazione soffre notoriamente di alcuni limiti, dovuti in primo luogo alla forte autoselezione del campione. Questo inconveniente rende necessari procedimenti di reintegrazione delle unità che non hanno aderito, spesso costosi e non sempre sufficienti ad assicurare che la perdita d’informazione iniziale sia compensata.

Caratteristiche della misurazione user-centric In secondo luogo con questo tipo di metodologia si rinuncia ad una delle peculiarità della Rete, cioè la cosiddetta “tracciabilità” delle attività dei server (punto di forza delle metodologie site-centric). Contrariamente a quanto accade per la maggior parte degli altri media, su Internet è infatti possibile la rilevazione puntuale degli accessi.

La misurazione user-centric versus quella site-centric Le unità osservate sono solo una parte della popolazione complessiva Tutte le grandezze di interesse sono frutto di un processo statistico di stima e di riporto all’universo

La misurazione user-centric versus quella site-centric Il campione deve essere rappresentativo rispetto alla popolazione degli utenti Internet. In genere tale popolazione è fortemente dinamica e non è mai nota nelle sue caratteristiche individuali. La qualità delle ricerche di base, che costituiscono il momento fondativo del disegno campionario dell’indagine panel, diviene assolutamente cruciale.

La misurazione user-centric versus quella site-centric Le unità osservate sono persone fisiche con le loro caratteristiche e non computer associati ad indirizzi IP Le grandezze rilevate portano con sé il valore della conoscenza delle persone

La misurazione user-centric versus quella site-centric il sistema segue l’utente in tutte le sue postazioni abituali Site-centric vengono rilevate le attività del server, ma non si conosce nulla dell’utenza

La misurazione user-centric versus quella site-centric: caratteristiche a confronto Il valore del numero delle “teste”. Informazioni socio-demografiche, comportamentali e psicografiche unite alle informazioni sulla navigazione. Site-centric Come avviene Chi (*) Da dove Quante volte (*) Quanto a lungo Quando la visita al sito

Alcune analisi possibili dal punto di vista user-centric Analisi della fedeltà: riporta in quale percentuale il pubblico visita un sito web in un dato mese e lo rivisita il mese successivo. Analisi dei flussi: fornisce un riassunto dei siti web che gli utenti visitano prima di accedere ad un dato sito web e indica dove vanno una volta lasciato il sito in questione. Analisi di duplicazione: quantifica in quale misura un sito web condivide il pubblico con altri siti o properties, indicando le quote esclusive e doppie. Analisi del contenuto del sito: analizza aree specifiche di contenuto o canali definiti dall’utente all’interno di un sito web e fornisce tutte le misure chiave.

La misurazione user-centric: i principali protagonisti Nielsen//NetRatings NetRatings è stata acquisita da Nielsen Media Research per integrare la misurazione della audience televisiva con quella di Internet. Più recente è la joint venture con AC Nielsen per l’Europa. E’ attiva anche in Asia. Misura anche la pubblicità on-line, offrendo a corredo una serie di servizi di pianificazione pubblicitaria realmente innovativi. Ha recentemente unito le sue forze a Jupiter Media Metrix Inc., la più grande struttura di ricerca Internet-oriented del mondo.

La misurazione user-centric: i principali protagonisti OneTone Società di diritto belga nata per iniziativa di Marco Benatti. Oggi rappresenta il braccio italiano di NetValue, società francese attiva nella misurazione della audience dei media tradizionali (tv e radio). Si avvale della collaudata esperienza di Doxa per quanto riguarda la realizzazione e gestione del panel e di NetValue per quanto attiene alla metodologia di rilevazione e al software.

La misurazione user-centric: i principali protagonisti Audinet Sinottica Nasce da una collaborazione tra Inferentia DNM ed Eurisko, leader nei rispettivi ambiti di competenza, con l’apporto di Biz2000 Consultants. La società si propone di: predisporre a livello europeo informazioni di mercato a elevato valore aggiunto; sviluppare nuovi strumenti di ricerca sfruttando le potenzialità di Internet e dei media digitali.

La misurazione user-centric: i principali protagonisti Red Sheriff Società nata dalla joint venture tra AGB, attiva nella misurazione della audience di media tradizionali come tv e radio (vedi Auditel), e la multinazionale australiana IMR. Già operante in Europa, Asia e Oceania, è attiva ora anche in Italia. Con il prodotto RedGauge si propone di integrare strumenti di misurazione site-centric e user-centric.

La sfida di RedGauge La caratteristica principale di RedGauge è di essere un sistema terzo che, in modo indipendente, elabora i dati provenienti da due fonti informative distinte. La prima fonte è RedMeasure, un sistema fondato sulla tecnologia browser based measurement che consente di rilevare via web l’avvenuta visualizzazione di una pagina da parte del browser dell’utenza “incollando” codici Java nella pagina stessa, evitando così le sottostime generate dalla presenza di proxy o firewall.

La sfida di RedGauge La seconda fonte è rappresentata dal panel Red Sheriff, composto da un campione di circa 3.000 utenti di Internet da casa e dal lavoro. Il software RedMeter, installato sui pc, consente di registrare tutti i dati di navigazione dei partecipanti al panel. Nel processo di data fusion delle informazioni provenienti dalle due fonti RedGauge mira ad effettuare un’operazione di calibrazione dei dati campionari, garantendone una maggiore precisione e affidabilità.

Misurazione o certificazione? Certificare non è fondamentale per il singolo editore, ma lo è per il mercato: ogni editore e ogni inserzionista dispongono di strumenti propri, che possono essere così tarati in base alle proprie esigenze; il mercato ha invece bisogno di dati unici e condivisi, in modo tale da costruire delle certezze. Ad oggi non esiste in Italia un organismo di certificazione delle quantità relative a Internet.

Misurazione o certificazione? In Italia operano in realtà due differenti società: Audiweb: dovrebbe certificare i principali siti italiani; la sua metodologia è ancora in fase di definizione. ABC Interactive (ABVS, USA): certifica da tempo i soli siti del gruppo Manzoni (La Repubblica - L’Espresso) e di Lycos.

Considerazioni finali Internet viene considerato come “il più misurabile” dei media. Per molti aspetti questo è vero. Esiste però un trade-off fondamentale tra: ricchezza ed affidabilità statistica dell’informazione; costo di realizzazione dell’indagine.

Considerazioni finali Allo stato attuale non esiste un sistema di misurazione migliore in assoluto. Ogni metodologia offre vantaggi e svantaggi ed è probabile che tutte quante tenderanno a convivere con obiettivi in parte differenti.

Considerazioni finali Diverse società di ricerca hanno messo a punto “prodotti” significativamente differenti. In questo momento il mercato italiano sta vivendo una fase di forte consolidamento. La contrazione degli investimenti in e-business si riflette sui budget a disposizione per la ricerca. Solo gli attori più forti saranno in grado di resistere alla selezione in atto.

Considerazioni finali Il limite degli ambiti di collegamento Il prossimo limite è dato dalla tecnologia: browser, sistemi di content management e protocolli evolvono lasciando le società di misurazione a inseguire i cambiamenti. La sfida più grande è quella di monitorare il net usage dai dispositivi wireless. NetValue spera ad esempio che la sua tecnologia (controllo del traffico Tcp/Ip anzichè dei browser) lo renda possibile, ma i protocolli sono altamente instabili (ad es. Wap 1.0 / Wap 1.1).

Considerazioni finali La performance di un sito web non può essere riferita solo al numero di accessi, ma deve essere valutata in base alla capacità di attrarre il “giusto” target, di comunicare in modo appropriato e di fornire un servizio che stimoli un ritorno frequente. Spesso ciò non accade: l’esperienza negativa degli utenti può provocare danni notevoli in termini di brand equity, di mancate vendite o di diminuzione nella propensione all’acquisto.