Search Engines and Web Advertising

Slides:



Advertisements
Presentazioni simili
MODELLI DI INTERAZIONE STRATEGICA
Advertisements

IlTrovatore S.p.a. IlTrovatore RemoteSearch IlTrovatore mette a disposizione di portali Internet, piccole e medie imprese, tutto il suo know-how nel settore.
Capitolo 8 Sistemi lineari.
Matematica I: Calcolo differenziale, Algebra lineare, Probabilità e statistica Giovanni Naldi, Lorenzo Pareschi, Giacomo Aletti Copyright © The.
Teoria dei giochi Eliminazione iterata delle strategie strettamente dominate Il diritto di proprietà.
Corso di “Economia Industriale Internazionale”
Analisi delle Decisioni Funzioni di utilita’ e lotterie
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Sistemi di Supporto alle Decisioni I Lezione 2 Chiara Mocenni Corso di laurea L1.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Sistemi di Supporto alle Decisioni I Scelte di consumo Chiara Mocenni Corso di laurea.
Hash Tables Indirizzamento diretto Tabelle Hash Risoluzioni di collisioni Indirizzamento aperto.
Sistemi di supporto alle decisioni 2. Features space
Lezione 10 LOLIGOPOLIO. LE IPOTESI DELL'OLIGOPOLIO I VENDITORI FANNO IL PREZZO GLI ACQUIRENTI NON FANNO IL PREZZO I VENDITORI ADOTTANO COMPORTAMENTI STRATEGICI.
"In Internet non siamo in grado di selezionare, almeno a colpo docchio, fra una fonte credibile e una folle. Abbiamo bisogno di una.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
Introduzione alla Teoria dei giochi
Scenario Archi di un grafo controllati da agenti egoistici
Meccanismi one-parameter. Riepilogo Archi di un grafo controllati da agenti egoistici Solo lagente conosce il peso associato al proprio arco Obiettivo:
Negoziazione e vincoli di qualità Rapporto D. Ardagna, M. Comuzzi – WP 2.
Giochi statici (o a mosse simultanee) con informazione completa
Apprendimento Non Supervisionato
Equilibrio di Nash ed aste GSP
Economia Aziendale Le aste al ribasso online: giochi dabilità, dazzardo o aste vere e proprie Economia Aziendale A.A. 2009/2010Professore Studente.
OLIGOPOLIO vi sono più imprese consapevoli di essere interdipendenti
1 Esempi di consistenza sui limiti Non consistente sui limiti, considera Z=2, poi X-3Y=10 Ma il dominio qui sotto e consistente sui limiti: Confrontare.
Routing egoistico.
Processi Aleatori : Introduzione – Parte I
EQUAZIONI DI PRIMO GRADO
Algoritmi e Strutture Dati (Mod. B)
1 Querying - Parte II Modelli per la ricerca. 2 Rappresentazione e Vector Space (VS) Ogni doc. j è un vettore di valori tf idf Si può normalizzare a lunghezza.
Ricerca della Legge di Controllo
Access: Query semplici
Modelli probabilistici
Lezione 5 Domande: Laverage path length di Chord con 2^b identificatori e N=2^b nodi è (giustificare la risposta) Laverage path length di Chord con 2^b.
Cercare informazioni sul Web. 5-2 Organizzazione dellinformazione tramite gerarchie Classificazione gerarchica Linformazione è raggruppata in un piccolo.
PARTE XII LOLIGOPOLIO. LE IPOTESI DELL'OLIGOPOLIO I VENDITORI FANNO IL PREZZO GLI ACQUIRENTI NON FANNO IL PREZZO I VENDITORI ADOTTANO COMPORTAMENTI STRATEGICI.
Convergence to Approximate Nash Equilibria in Congestion Games
Modulo 7 – reti informatiche u.d. 3 (syllabus – )
Studio di euristiche per il miglioramento di algoritmi di ranking per il World-Wide Web Università degli Studi di Milano Corso di Laurea in Informatica.
Metodo della moltiplicazione
INFORMATICA MATTEO CRISTANI. INDICE CICLO DELLE LEZIONI LEZ. 1 INTRODUZIONE AL CORSO LEZ. 2 I CALCOLATORI ELETTRONICI LEZ. 3 ELEMENTI DI TEORIA DELL INFORMAZIONE.
Esercizio 10.* Un cassiere vuole dare un resto di n centesimi di euro usando il minimo numero di monete. a) Descrivere un algoritmo goloso per fare ciò.
Radix-Sort(A,d) // A[i] = cd...c2c1
RAZIONALITA’ E TEORIA DEI GIOCHI
INFORMATICA PER IL COMMERCIO ELETTRONICO
Efficient Region- Based Image Retrieval di Roger Weber e Michael Mlivoncic Swiss Federal Institute of Technology (ETH) Presentazione di Laura Galli, Mauro.
Web Communities and their identificaton
COMUNICAZIONE ONLINE, RETI E VIRTUALITA MATTEO CRISTANI.
Introduzione alla Teoria dei Giochi Parte prima
Teoria dei giochi e comportamento strategico
Evoluzione della teoria del rischio finanziario
Implementazione di dizionari Problema del dizionario dinamico Scegliere una struttura dati in cui memorizzare dei record con un campo key e alcuni altri.
MOTORI DI RICERCA. Un motore di ricerca è un sistema automatico che analizza un insieme di dati spesso da esso stesso raccolti e restituisce un indice.
Economia dell’Informazione: Strategia, Network ed Esternalità di rete
Didattica e Fondamenti degli Algoritmi e della Calcolabilità Terza giornata: principali classi di complessità computazionale dei problemi Guido Proietti.
IL CAMPIONE.
R. Soncini Sessa, MODSS, L21 Accettare la casualità Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.
L’ISTITUTO DI RICERCHE DI MERCATO ONLINE. 2 per DATI SOCIO-DEMO.
Intervalli di confidenza
F U N Z I O N I Definizioni Tipi Esponenziale Logaritmica
6. LIMITI Definizione - Funzioni continue - Calcolo dei limiti
La nostra società è caratterizzata dalla presenza di persone che svolgono ruoli sempre più specialistici, che richiedono conoscenze e competenze molto.
Collusione Davide Vannoni Corso di Economia Manageriale e Industriale a.a
Cercare In Internet. Cercare in Rete La scuola ha un ruolo preciso in relazione a quella che nei paesi anglosassoni viene denominata: Information Literacy.
La teoria dei giochi (Cabral cap. n.4 )‏ Davide Vannoni Corso di Economia Manageriale e Industriale a.a
Analisi ed Approfondimento dell’Equilibrio di Nash: Lo studio di situazioni critiche UNIVERSITA' DEGLI STUDI "G.d'ANNUNZIO" CHIETI-PESCARA LAUREANDA: Ileana.
L’effetto delle asimmetrie informative sul mercato del credito Fausto Panunzi.
La Teoria dei Giochi: Gli Equilibri di Nash Scuola Militare Nunziatella 10 gennaio 2014 Luigi Taddeo.
Giochi Bayesiani 19/07/2011 Università degli studi di Napoli “Federico II” Emiliano Iuliano Francesco De Domenico Corso di teoria dei giochi Prof.ssa Lina.
10/5/061 Lez. 12 Previsioni di traffico Generalità Previsioni di scenario.
Un evento è un fatto che può accadere o non accadere. Se esso avviene con certezza si dice evento certo, mentre se non può mai accadere si dice evento.
Transcript della presentazione:

Search Engines and Web Advertising Antonio Panciatici ISTI-CNR

The Advertising market Internet 2006: first half 2006 vs. first half 2005 (+18.9%)

The Advertising market

Tecniche di Advertising Flash Richiedono Flash Player Immagini GIFs animate, JPEGs Sponsored links Text Based Ads (Search-Based Advertising or Content-Targeted Advertising)

Our Focus Search-Based Advertising: ogni volta che l’utente immette una query, il motore di ricerca mostra gli Ads più rilevanti nella pagina dei risultati Le keywords contenute nella query vengono confrontate con quelle selezionate dall’advertiser Content-Targeted Advertising: ogni volta che l’utente visita una pagina di contenuto (trigger page), il motore di ricerca mostra gli Ads più rilevanti nella pagina stessa Il contenuto della pagina visitata viene confrontato con keywords selezionate dall’advertiser

Search-Based Advertising Keyword Advertisement Advertisements più rilevanti

Content-Targeted Advertising

Key Points Punto di vista dell’advertiser Quali keyword comprare (problema del matching) ? Quanto pagare (problema del pricing) ? Punto di vista del motore di ricerca Come suggerire buone keyword (problema del matching) ? Come far pagare le keyword (problema del pricing) ? Come mostrare gli advertisers più rilevanti (problema del ranking) ?

Key Points Se l’advertisement è rilevante  il motore di ricerca guadagna, sia da un punto di vista economico sia dal punto di vista della credibilità Se l’advertisement è rilevante  aumenta la probabilità che anche l’advertiser guadagni

Il problema del matching Il problema del matching varia in base al tipo di advertising che si adotta Search-based Advertising Content-targeted Advertising

Search-Based Advertising Advertisement = (Keywords, titolo, descrizione, URL) Query = (Search keywords, contesto) Il processo di matching è keyword-driven

Search-Based Advertising Keyword Advertisement Titolo Descrizione URL Advertisements più rilevanti

Content-Targeted Advertising Advertisement = (Keywords, titolo, descrizione, URL) Query = (Triggering page, contesto) Il processo di matching riguarda il contenuto di una pagina (molte keywords)

Search-Based Advertising Problema principale: poche informazioni (sostanzialmente solo le kewords) Ranking dipende anche da quanto hanno offerto gli advertisers

Content-Targeted Advertising Problema principale: gap semantico Linguaggi differenti (esempio bottiglia, bottle, contesti diversi) Sinonimi Matching approssimato ?

Algoritmi per il matching (Content-Targeted Advertising) Impedance Coupling in Content-tergeted Advertising (Berthier Ribero-Neto, Paulo B. Golpher, Marco Cristo, Edleno Silva de Moura)

Impedance Coupling in Content-targeted Advertising Due diversi insiemi di algoritmi matching diretto tra il contenuto della pagina (trigger page) il testo dell’advertisement e le keywords associate matching tra il contenuto della pagina arricchita con nuove keywords. Approccio giustificato dal fatto che spesso I vocabolari della pagina e dell’advertisement sono diversi (Vocabulary impedance)

Impedance Coupling in Content-targeted Advertising Advertisement composto da un titolo, una descrizione e un URL p trigger page A insieme di advertisements ai si vuole effettuare il ranking degli advertisements ai rispetto a p

Impedance Coupling in Content-targeted Advertising Vector Space Model Vettori dei pesi della query e del documento q = (w1q,…,wiq,…,wnq) dj = (w1j,…,wij,…,wnj) wiq = peso associato al termine ti nella query q wij = peso associato al termine ti nel documento dj I pesi sono calcolati utilizzando tf-idf (prodotto term frequency, inverse document frequency) (tf = importanza del termine nel documento, idf = rarity del termine nel documento)

Impedance Coupling in Content-targeted Advertising Il ranking della query q rispetto al documento dj è il seguente (cosine similarity formula)

Impedance Coupling in Content-targeted Advertising Primo algoritmo (AD) Matching contenuto dell’ advertisement (titolo + descrizione) e il contenuto della trigger page AD(p, ai) = sim(p, ai)

Impedance Coupling in Content-targeted Advertising Secondo algoritmo (KW) Matching keyword (può essere composta da più termini) associate all’advertisement e il contenuto della pagina p KW(p, ai) = sim(p, ki)

Impedance Coupling in Content-targeted Advertising Terzo algoritmo (AD_KW) Molte volte le keyword scelte dall’advertiser sono presenti anche nell’advertisement. Si può usare questa informazione per migliorare AD. Matching dell’advertisement e le sue keyword con il contenuto della pagina p AD_KW(p, ai) = sim(p, ai  ki)

Impedance Coupling in Content-targeted Advertising Quarto algoritmo (ANDKW) Molte volte le keyword scelte dall’advertiser non sono presenti nella pagina p anche se l’advertisement può avere un rank alto. Si può pensare che la presenza delle keyword nella pagina p fornisca un indicatore della rilevanza dell’advertisement (le keyword danno una sintesi dell’advertisement) Matching dell’advertisement forzando la presenza delle keyword nella pagina p sim(p, ai) se ki  p ANDKW(p, ai) = 0 altrimenti

Impedance Coupling in Content-targeted Advertising Quinto algoritmo (AD_ANDKW) Matching dell’advertisement e delle sue keyword forzando la loro presenza nella pagina p sim(p, ai ki ) se ki  p AD_ANDKW(p, ai) = 0 altrimenti Algoritmo migliore tra tutti quelli visti fino ad ora

Impedance Coupling in Content-targeted Advertising Problemi La trigger page appartiene ad un contesto più ampio di quello relativo all’advertisement La correlazione tra l’advertisement e la trigger page può essere legato a topic che non compaiono esplicitamente nel contenuto della pagina

Impedance Coupling in Content-targeted Advertising Il primo problema è dovuto al fatto che il contenuto delle pagine può riguardare qualsiasi argomento. L’advertisement è molto coinciso e mirato per sua natura Il secondo problema è dovuto al fatto che molte volte gli advertiser scelgono keyword generiche che non coincidono con i termini specifici contenuti nella pagina (vino, chianti)

Impedance Coupling in Content-targeted Advertising Algoritmi Impedance Coupling per ridurre i problemi esposti sopra Idea di base: aggiungere nuove parole (termini) più generali alla trigger page Per farlo analizza i vocabolari di documenti simili alla ricerca di termini generali che possano caratterizzare meglio il contenuto della pagina p

Impedance Coupling in Content-targeted Advertising Bayesian Network Model per determinare la probabilità che un termine ti sia un buon candidato a rappresentare il contenuto della pagina p

Impedance Coupling in Content-targeted Advertising P(Ti | R) probalità che il termine ti sia un buon candidato a rappresentare il contenuto della pagina p R nodo nella Bayesian Network rappresentante la nuova pagina r (pagina p con nuovi termini) 0 ≤ ≤ 1 ( = 0  R = p)  constante di normalizzazione wij peso associato al termine ti nel documento dj (dj documento simile a p) d0 = p

Impedance Coupling in Content-targeted Advertising Si effettua il ranking dei termini ti in base alla loro bontà ttop quello per cui vale maxt P(Ti | R) (quello con il rank più alto) Aggiunge alla pagina p (trasformandola nella pagina r) tutti i termini per cui P(Ti | R) / P(Ttop | R) ≥  (in questo caso = 0.05)

Impedance Coupling in Content-targeted Advertising Sesto algoritmo (AAK_T) Matching dell’advertisement e keywords solo rispetto al set e dei nuovi termini AAK_T(p, ai) = AD_ANDKW (e, ai)

Impedance Coupling in Content-targeted Advertising Settimo algoritmo (AAK_EXP) Matching dell’advertisement e keywords rispetto alla pagina estesa r (termini in p + termini in e) AAK_EXP(p, ai) = AD_ANDKW (p  e, ai)

Impedance Coupling in Content-targeted Advertising Ottavo algoritmo (H) Matching della landing page dell’advertisement rispetto alla pagina p. Giustificato dal fatto che landing page (hyperlink della landing page hi) dell’advertiser descrive il target reale dell’advertisement H(p, ai) = sim (p, hi)

Impedance Coupling in Content-targeted Advertising Nono algoritmo (AAK_H) Combinazione di AD_ANDKW con H Matching dell’advertisement, delle keyword, della landing page rispetto alla pagina p forzando la presenza delle keyword nella pagina p sim(p, ai  hi  ki) se ki  p AAK_H(p, ai) = 0 altrimenti

Impedance Coupling in Content-targeted Advertising Decimo algoritmo (AAK_EXP_H) Combinazione di AD_EXP con H Matching dell’advertisement, delle keyword, della landing page rispetto alla pagina p forzando la presenza delle keyword nella pagina p  e sim(p  e, ai  hi  ki) se ki  p  e AAK_H(p, ai) = 0 altrimenti

Impedance Coupling in Content-targeted Advertising AAK_EXP_H ottiene i risultati migliori (tra tutti gli algoritmi), abbastanza naturale dato che utilizza tutte le possibili fonti di informazioni

Performance Nel content-targeted advertising gli advertisements sono associati alle pagine quando le pagine vengono pubblicate Tutte le informazioni (landing pages, triggering page, etc..) sono ottenute tramite page crawling, link crawling, sono ottenibili off-line Gli advertisement che arrivano a run-time possono essere assegnati alle pagine già pubblicate in modo off-line Se ne deduce che il problema della performance non è critico

Algoritmi per Search-Based Advertising An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services (Paat Rusmevichientong, David P. Williamson)

Punto di vista dell’advertiser An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services Il problema: dato un budget giornaliero e una probabilità di click-through non conosciuta, fornire un algoritmo in grado di selezionare le keyword da acquistare in modo da massimizzare il guadagno medio Punto di vista dell’advertiser

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services Supponendo di avere N keywords rappresentate dai numeri {1, 2, 3,…, N} Per ogni A  {1, 2, 3,…, N} , sia ZA la variabile aleatoria (v.a) che indica il profitto che si ottiene se si seleziona l’insieme di keyword da A Sia  = (A1, A2,…) una politica, cioè una sequenza di v.a. At indica l’insieme di keyword che l’advertiser seleziona nel periodo t. At può dipendere dalle osservazioni al tempo t-1 Per tutti i T ≥ 1 quello che si vuole trovare è una politica  = (A1, A2,…) tale che sia massimo:

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services Alcune osservazioni Il costo totale dipende dal numero di click Massimizzare il guadagno, dato un certo budget, richiede la conoscenza della probabilità di click-through dell’advertisement associato ad una data keyword. La probabilità di click-through non è conosciuta (si può determinare osservando il comportamento delle keyword per un dato periodo, però può avere un costo notevole) La maggior parte degli algoritmi assume la conoscenza di una stima della probabilità di click-through

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services L’approccio seguito dagli autori è quello di trovare un trade-off tra le keyword selezionate basandosi sulle performance passate, e le keyword selezionate tra quelle mai usate

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services L’algoritmo parte dal caso in cui si conosce la probabilità di click-through e poi fornisce anche una tecnica che elimina questa restrizione Noi vedremo solo il caso in cui si conosce la probabilità di click-through, il modello che definiremo in realtà vale per entrambi i casi

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services Modello: Spazio di probabilità (, F, P) N keyword {1, 2, 3,…, N} Per ogni t ≥ 1 sia St una v.a rappresentante il numero totale di search query arrivate nel periodo t S1 , S2, … sono indipendenti ed identicamente distribuite con media 1 <  < ∞ Supponiamo di conoscere St

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services Modello (continua): In ogni periodo, le query arrivano in modo sequenziale ed ogni query può essere una delle N keyword {1, 2, 3,…, N} Per ogni t ≥ 1 e r ≥ 1 sia Qtr una v.a rappresentante la keyword associata alla query r arrivata nel periodo t Qtr sono indipendenti ed identicamente distribuite e P{ Qtr = i } = i con i  {1, 2, 3,…, N} e  i =1 Supponiamo di conoscere i

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services Modello (continua): Il budget in ogni periodo è 1€ (non si perde di generalità) pi probabilità di click-through per keyword i  {1, 2, 3,…, N}, con 0  pi  1 ci (CPC) cost per click Supponiamo di conoscere ci rimane costante i guadagno per click con la keyword i Supponiamo di conoscere i rimane costante

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services Modello (continua): At indica l’insieme di keyword che l’advertiser seleziona nel periodo t BrAt budget rimanente al periodo t quando la query r viene immessa e l’advertiser ha scelto di selezionare le keywords in At Xtri variabile aleatoria di Bernulli con parametro pi (probabilità di click-through) P{Xtri = 1} = pi Per ogni i con t ≥ 1 e r ≥ 1 vale che Xtri sono indipendenti ugualmente distribuite Xtri indipendenti dall’arrivo delle query

Dato il modello visto si ha che An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services Dato il modello visto si ha che 1(.) funzione indicatrice i  At (l’advertiser effettua un offerta sulla keyword i all’inizio del periodo t) Qtr = i (la query r-esima corrisponde alla keyword i) BrAt ≥ ci (c’è abbstanza budget per pagare il costo della keyword i se l’utente va sull’advertisement) Xtri = 1 (l’utente effettivamente va sull’advertisement)

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services Supponendo di conoscere pi il problema diventa (static binding problem) Non è più dipendente dal tempo ! S numero di query BrA budget rimasto quando la query r-esima viene immessa e l’advertiser ha scelto di selezionare le keywords in A Xri variabile di Bernulli (indica se l’utente va sull’advertisement relativo alla keyword i durante l’arrivo della query r-esima)

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services Così formulato, il problema è NP-completo (stochastic knapsack problem) se pi = 1 per ogni i  il problema dello zaino standard Gli autori forniscono un algoritmo approssimato (trova soluzione near-optimal) sotto alcune ipotesi

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services Ipotesi Le keyword sono ordinate in modo discendente secondo il rapporto profitto/costo 1/c1≥ 2/c2 ≥… ≥ N/cN icipii > 1 (i probabilità query che r-esima contenga la keyword i) si possono aggiungere keyword fittizie con  = 0 in modo da ottenere questa disequazione Esistono k ≥1 e 0 ≤  < 1 tali che ci ≤ 1/k e i  ≤ k per tutti gli i (i  = numero medio di query contenenti la keyword i)

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services Le ipotesi sopra sono derivate da esperimenti su dati reali Teorema: siano k e  definiti secondo le ipotesi, supponendo di conoscere pi e supponendo anche che 1/k + 1/k1- + 1/k(1-)/3 ≤ 1 si definisce Intuitivamente significa cercare il valore l tale che il costo delle prime {1,...,l} keyword ordinate secondo le ipotesi non ecceda il budget

An Adaptive Algorithm for Selecting Profitable Keywords for Search-Based Advertising Services Se  = E[min {S,}] / (misura quanto la distribuzione del numero delle query è vicina alla propria media) Se P = {1,2,…,Iu} e Z* il profitto ottimo abbiamo

Il problema del Pricing (Search-based Advertising) Ogni keyword è un mercato nel quale gli advertisers competono per avere la posizione migliore Il mercato varia in base alle keywords Per ogni keyword competono molti advertisers, quali di questi devono essere visualizzati ? Il motore di ricerca utilizza uno schema di pagamento PPC (Pay per Click). Quanto devono pagare per ogni click ?

Il problema del Pricing (Search-based Advertising) Scenario Una keyword (un mercato) Un insieme di compratori (Advertisers) Un venditore (motore di ricerca) Ogni compratore ha una sua funzione di pay-off Come organizzare il pricing in modo che tutti siano soddisfatti ?

Game Theory “Game Theory is a bag of analytical tools designed to help us understand the phenomena that observe when decision-makers interact”. (Martin J. Osborne, Ariel Rubistain, A Course in Game Theory)

Game Theory Alcuni concetti importanti Gioco strategico Equilibrio di Nash Giochi legati al Web Advertising Aste generalizzate di secondo prezzo (GSP)

Game Theory Ipotesi I giocatori hanno un comportamento razionale e sfruttano le loro conoscenze su strategie e comportamenti (conosciuti) degli altri giocatori Non c’è cooperazione tra giocatori (Giochi non cooperativi) Strategic Game: Ogni giocatore sceglie la sua strategia una volta per tutte, tutti i giocatori prendeno le loro decisioni simultaneamente (dal punto di vista del gioco). Quando un giocatore adotta una strategia non è informato della strategia adottata dagli avversari

Strategic Game (due giocatori) Il giocatore i-esimo adotta un insieme di strategie Ai non vuoto, con ai  Ai strategia pura Il giocatore i-esimo è rappresentato da una funzione di pay-off ui : A -> R dove A = A1 x A2 Nota: ui dipende anche da ciò che fanno gli altri giocatori

Game Theory Chiameremo profilo il vettore a = (a1 , a2) con a1  A1 e a2  A2 Diremo che una strategia aj è weakly-dominant per il giocatore i-esimo se ui(aj,*) ≥ ui(ak,*) per ogni ak  Ai indipendentemente da quale sia la strategia degli altri giocatori Diremo che una strategia aj è strongly- dominant per il giocatore i-esimo se ui(aj,*) > ui(ak,*) per ogni ak  Ai indipendentemente da quale sia la strategia degli altri giocatori

Equilibrio di Nash Un equilibrio di Nash in un gioco strategico <N=(1,2), (A1 , A2), (u1 , u2)> con due giocatori, è un profilo a* = (a*1 , a*2) tale che u1 (a*1 , a*2 ) ≥ u1(ai , a*2 ) for all ai  A1 u2 (a*1 , a*2 ) ≥ u2(a*1 , aj ) for all aj  A2 Intuitivamanente: fissate le strategie degli altri giocatori, nessun giocatore è incentivato a cambiare la propria

Game Theory Esempi di giochi strategici con strategie pure Due giocatori Dilemma del Prigioniero, Back o Stravinsky, etc.. Aste Aste di secondo prezzo (Vickrey Auction) Generalized Second Price Auction (GSP) Vickrey (Aste legate al Web Advertising)

Il Dilemma del Prigioniero Due sospetti sono messi in due celle diverse Se confessano entrambi vengono condannati entrambi a tre anni Se uno solo di essi confessa, questo viene liberato e la sua testimonanzia viene utilizzata per condannare a quattro anni l’altro Se nessuno dei due confessa vengono entrambi condannati ad un anno

Il Dilemma del Prigioniero Confessa Non confessa Confessa Non confessa 3 4 1 3 4 1 Confessa Confessa Non confessa Non confessa Esiste un solo equilibrio di Nash (Confessa, Confessa), non è l’ottimo Confessare è una strategia strongly-dominant L’ottimo è (Non confessa, Non confessa) ma non è un equilibrio !

Nash Equilibrium Un equilibrio di Nash in un gioco strategico <N, (Ai), (≥i)> è un profilo a* in A di azioni con la proprietà che per ogni giocatore i  N vale (a*-i , a*i ) ≥i (a*-i , ai) for all ai  Ai Dove Per ogni giocatore i  N esiste una relazione di preferenza ≥i definita su A = Xj  NAj a-i = (aj) j  N/i

Nash Equilibrium Per giochi strategici con un numero qualsiasi di partecipanti (N ≥ 2) può esistere un equilibrio di Nash, più di uno, o anche nessuno Equilibrio di Nash (generale) Se per ogni giocatore i l’insieme Ai è compatto e convesso, e ≥I è continua e quasi concava allora il gioco strategico <N, (Ai), (≥i)> ha un equilibrio di Nash Ogni gioco strategico finito (se ogni Ai finito) con strategie miste ha un equilibrio di Nash

Asta di primo prezzo Asta di primo prezzo Lo scopo è assegnare un oggetto ad uno tra N possibili compratori Ogni giocatore i ha una sua stima (privata) vi del valore dell’oggetto vi > 0 per ogni i Simultaneamente, ogni giocatore i fa un offerta bi privata (offerta  strategia) L’oggetto viene assegnato al giocatore che offre di più (se ce ne è più di uno, in modo random) Per avere l’oggetto, il vincitore paga la sua offerta Dire la verità non è una strategia dominante !

Asta di secondo prezzo Asta di secondo prezzo (Asta di Vickrey) Lo scopo è assegnare un oggetto ad uno tra N possibili compratori Ogni giocatore i ha una sua stima (privata) vi del valore dell’oggetto vi > 0 per ogni i Simultaneamente, ogni giocatore i fa un offerta bi privata (offerta  strategia) L’oggetto viene assegnato al giocatore che offre di più (se ce ne è più di uno, in modo random) Per avere l’oggetto, il vincitore paga la seconda offerta più alta

Asta di secondo prezzo Per ogni giocatore i, offrire il massimo possibile (bi = vi) è una strategia weakly-dominant. Infatti, posto ri = max(bj) per ogni j ≠ i si ha 0 se bi ≤ ri ui = vi - ri se bi > ri Supponiamo bi > vi allora Se ri ≥ bi  ui = 0 lo stesso guadagno ottenibile offrendo vi Se ri ≤ vi  ui = vi - ri lo stesso guadagno ottenibile offrendo vi Se vi < ri < bi  ui = vi - ri < 0 offrendo vi  ui = 0

Asta di secondo prezzo Per ogni giocatore i, offrire il massimo possibile (bi = vi) è una strategia weakly-dominant. Infatti, posto ri = max(bj) per ogni j ≠ i si ha 0 se bi ≤ ri ui = vi - ri se bi > ri Supponiamo bi < vi allora Se ri ≥ vi  ui = 0 lo stesso guadagno ottenibile offrendo vi Se ri ≤ bi  ui = vi - ri lo stesso guadagno ottenibile offrendo vi Se bi < ri < vi  ui = 0 se il giocatore avesse offerto vi  ui = vi - ri

Asta di secondo prezzo Esiste un equilibrio di Nash in cui tutti i giocatori offrono la loro stima del valore dell’oggetto

Asta generalizzata di secondo prezzo (GSP) Asta generalizzata di secondo prezzo (Vickrey) Lo scopo è assegnare simultaneamente 0 < M < N di oggetti tutti uguali ad un sottoinsieme degli N possibili compratori Ogni giocatore desidera un oggetto Ogni giocatore i ha una sua stima (privata) vi del valore dell’oggetto vi > 0 per ogni i Per il giocatore i, ogni oggetto ha lo stesso valore vi Simultaneamente, ogni giocatore i fa un offerta bi privata Gli M giocatori che hanno offerto di più si aggiudicano gli oggetti Il giocatore che ha offerto di più paga la seconda offerta più alta, il secondo la terza, e così via

Asta generalizzata di secondo prezzo Per ogni giocatore i, offrire il massimo possibile (bi = vi) non è una strategia weakly-dominant. Infatti, date (r1 > r2 >….> rM) le M offerte più alte 0 se bi  rM ui = vi - rh se bi = rh-1 con h = {2,…,M} Supponiamo rM < bi = rM -1< r1 < vi allora ui = vi – rM Se il giocatore i-esimo avesse offerto bi allora ui = vi – r1 < vi – rM  offrire il massimo possibile (bi = vi) non è una strategia dominante

GSP e Web Advertising Modello GSP applicato al Web Advertising Google, Yahoo utilizzano GSP Google adotta alcune modifiche che rendono l’asta ancora più complicata (CTRi = expected click-through rate dell’advertiser i-esimo) Yahoo (CTR non dipende dall’advertisement)

How to price keywords Advertisers preferiscono questo slot Click through rate 200 per ora Click through rate 150 per ora

GSP e Web Advertising (Yahoo) N slots nella pagina di ricerca K advertisers interessati ad una keyword ci numero medio di click per periodo per un advertiser nello slot i Ogni advertiser desidera un solo slot vk valore del click per l’advertiser k uk = ci vk – pij guadagno advertiser k in posizione i (strategia del giocatore) Advertisers sono risk neutral (tendono a massimizzare uk)

GSP e Web Advertising Alcune considerazioni ci non dipende dall’advertiser, ma solo dalla posizione vk non dipedende dallo slot pij dipende dagli altri advertisers

GSP e Web Advertising Pay-off del giocatore i-esimo nella posizione j-esima ui = cj (vi – bj+1) Il giocatore che ha acquistato lo slot N-esimo in teoria non paga (in realtà i motori di ricerca impongono un prezzo minimo)

GSP e Web Advertising Anche in questo caso dire il vero non è una strategia dominante Tre giocatori, con v rispettivamente uguale a 17€, 12€, 3€ per click Due slots Click-through rates per la prima posizione 250, per la seconda 248 (quasi gli stessi) Se tutti I giocatori dicono il vero e offrono la loro stima del valore, il pay-off del giocatore che vince la prima posizione è: (17 - 12) * 250 = 1250€ Se solo il giocatore che ha vinto avesse offerto 11€ (mentendo) avrebbe avuto un pay-off maggiore: (17 - 3) * 240 = 3360€ > 1250€

GSP e Web Advertising Nel caso reale di Google o Yahoo, l’asta è ripetuta continuamente: le assunzioni sulla riservatezza di alcune informazioni (v, b) possono non essere più vere. I giocatori imparano (v, b) giocando Cambiano gli equilibri Minimo prezzo di entrata,…

GSP e Web Advertising Equilibri simmetrici: un dato advertiser non è interessato ad uno slot più in alto se deve pagare di più Equilibri asimmetrici: un dato advertiser può essere interessato ad uno slot più in alto anche se deve pagare di più Ci possono essere diversi equilibri di Nash (simmetrici, non simmetrici)

Il problema del ranking (Search-based Advertising) In che ordine visualizzare gli advertisments ? Yahoo ordina solo rispetto al prezzo pagato Google ordina rispetto al prezzo pagato ed ad un fattore legato alla rilevanza dell’advertisement (CTRi) Pagamento è sempre secondo il modello GSP

Il problema del ranking Yahoo (solo prezzo) apprezzato dagli advertisers per la trasparenza presenta qualche problema legato alla rilevanza dei risultati Chi ha pagato di più non è detto che sia quello più rilevante !

Il problema del ranking Google (prezzo e rilevanza) Forse meno apprezzato dagli advertisers (meno trasparenza) Aumenta la rilevanza dei risultati È in testa chi ha il miglior trade-off tra l’offerta e la rilevanza !

Il problema del ranking (Google) Ri = bi x CTRi dove CTRi = expected click-through rate dell’advertiser i-esimo (misura rilevanza dell’advertisement i-esimo) bi = pagamento dell’advertiser i-esimo Gli advertisements sono ordinati secondo il loro Ri

Alcuni problemi aperti Granularità del mercato Ferrari e Red Ferrari devono essere due mercati diversi ? Utilizzo di robots per effettuare il bidding Attualmente I motori di ricerca lo permettono Quali nuovi meccanismi (incentivi) introdurre ?

Alcuni problemi aperti Che modello di costo adottare se il numero di slot è variabile Cosa succede se il numero di slot a disposizione cambia ?

Bach o Stravinsky ? Due persone desiderano andare insieme ad un concerto di musica classica. Una preferisce Bach, l’altra Stravinsky

Bach o Stravinsky ? Bach Stravinsky Bach Stravinsky 2 1 1 2 Bach Bach Stravinsky Stravinsky Ci sono due equilibri di Nash (Bach, Bach), (Stravinsky, Stravinsky) Non ci sono strategie dominanti