Leggi di potenza e di Zipf

Slides:



Advertisements
Presentazioni simili
Matematica e statistica Versione didascalica: parte 3
Advertisements

Joseph-Louis Lagrange
I COSTI DI PRODUZIONE Remunerazione dei fattori produttivi
Reti sociali Reti sociali.
Corso di esperimentazione di fisica 1 Il metodo dei minimi quadrati
Equazioni differenziali
Capitolo 9 La produzione
Notes on Growth Accounting
Chemical evolution of the milky way
Commenti C#.
Autovalori e autovettori
LE SUCCESSIONI Si consideri la seguente sequenza di numeri:
6. Catene di Markov a tempo continuo (CMTC)
Esercizio 1 Un filo indefinito è costituito da due semirette AB e BC formanti un angolo retto, come in figura Il filo è percorso da una corrente I = 10.
2.VARIABILI CONTINUE A. Federico ENEA; Fondazione Ugo Bordoni Scuola estiva di fonetica forense Soriano al Cimino 17 – 21 settembre 2007.
Introduzione alle curve ellittiche
Fisica: lezioni e problemi
Standardizzazione. Situazione standardizzata: tutto resta costante Misura standardizzata: il singolo dato empirico è ricondotto a un sistema di riferimento.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa Sistemi di Supporto alle Decisioni I Scelte di consumo Chiara Mocenni Corso di laurea.
LE FUNZIONI Definizione Campo di esistenza e codominio
6. Catene di Markov a tempo continuo (CMTC)
Gli Integrali.
3. Modelli di reti complesse
Algoritmi Paralleli e Distribuiti a.a. 2008/09 Lezione del 20/03/2009 Prof. ssa ROSSELLA PETRESCHI a cura del Dott. SAVERIO CAMINITI.
INTRODUZIONE AI CONVERTITORI ANALOGICO-DIGITALI (ADC)
La distribuzione del reddito
Matematica e statistica Versione didascalica: parte 1
CALCOLO DIFFERENZIALE PER FUNZIONI DI PIÙ VARIABILI - 4.
Indici Statistici Descrittivi
Algoritmi e Strutture Dati (Mod. A)
Geometria euclidea, affine e proiettiva
INTERNET 1. WWW WWW, World Wide Web è unenorme banca dati mondiale, distribuita su un grandissimo numero di locazioni (siti), collegati fra loro da reti.
IL CABRI e la GEOMETRIA Annamaria Iezzi VB.
Crawling Saverio Caminiti.
Lezione 6 informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università
Lezione 6 informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università
Classi seconde programmazione didattica
STATISTICA PER LE DECISIONI DI MARKETING
Equazioni lineari in due incognite
Radix-Sort(A,d) // A[i] = cd...c2c1
Interazione di JavaScript e HTML
STATISTICA PER LE DECISIONI DI MARKETING
Attivazione dei recettori
Di Cunzolo Alessandro Farioli Giuseppe 10 Gennaio 2012
Corso di Formazione per docenti di Scuola Superiore: Il calcolo infinitesimale nei licei non scientifici Febbraio-Marzo 2013 LaboratorioDidattico effediesse.
LA CIRCONFERENZA.
Creare pagine web Xhtlm. Struttura di una pagina.
Caratteristiche allegato Suggerimenti per la buona riuscita dellupload Il file non deve superare i 10 MG Il file dovrebbe sempre essere protetto Il file.
COMUNICAZIONE ONLINE, RETI E VIRTUALITA MATTEO CRISTANI.
BIOINFO3 - Lezione 301 CGI-BIN Abbiamo visto che CGI-BIN sono chiamati i programmi la cui esecuzione può essere richiesta attraverso il WEB. In particolare.
DATA MINING PER IL MARKETING
Corso di Formazione per docenti di Scuola Superiore: Il calcolo infinitesimale nei licei non scientifici Marzo-Aprile 2014 LaboratorioDidattico effediesse.
Introduzione a Excel.
Convergenza.
Classi terze programmazione didattica Col terzo anni si abbandona l’ algebra, che rimane un prerequisito fondamentale, e si introduce, in modo più strutturato,
Integrale Definito - Calcolo delle Aree
LUCIDI dell'insegnamento di COMUNICAZIONI ELETTRICHE eo/in/bi
IL CAMPIONE.
Laurea Ing. EO/IN/BIO;TLC D.U. Ing EO 3
Calcolo delle probabilità a cura di Maurizio Brizzi
“La cassetta degli arnesi”
EVENTI Gli eventi sono delle azioni che possono essere identificate da javascript. 1 - onMouseOver, che viene messo in atto quando l'utente fa scorrere.
(II) Integrazione delle funzioni razionali fratte
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Regressione lineare Misure Meccaniche e Termiche - Università di Cassino2 Distribuzioni Correlate Una variabile casuale z, può derivare dalla composizione.
In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Se il piano è perpendicolare (ortogonale) all’altezza del cono abbiamo la CIRCONFERENZA! LA CIRCONFERENZA COME LUOGO GEOMETRICO: la circonferenza.
Potenza ad esponente intero positivo PARI (x->x^(2n))
Transcript della presentazione:

Leggi di potenza e di Zipf Social Networks

Distribuzione di parametri Esempio: supponendo di avere a disposizione i dati sul numero di accessi a un certo insieme S di n siti Web, studiare la distribuzione di A(x) rispetto a x, dove: x = # accessi nell’ultimo mese A(x) = # di siti ai quali sono stati fatti x accessi nell’ultimo mese Social Networks

Piu’ formalmente… Interessa il seguente problema: data una popolazione S di n individui e un parametro P (reale o intero) di interesse, determinare l’andamento di A(x), dove x = valore del parametro A(x) = # individui per cui P = x Social Networks

Esempio: distribuzione degli accessi a siti Web x = # accessi, A(x) = # siti a cui sono stati fatti x accessi A(x) = (1/x), dove  > 2 Social Networks

Esempio: distribuzione del reddito - curva di Pareto x = # reddito, A(x) = # individui con reddito x A(x) = (1/x), dove  > 2 Social Networks

Esempio: distribuzione del numero di link entranti x = # di link entranti, A(x) = # pagine Web con x link entranti A(x) = (1/x), dove  ≈ 2.1 Scala logaritmica Social Networks

Legge di potenza A(x) segue una legge di potenza su una popolazione di N individui se: Per semplicita’ xmin = 1 Si osservi che x  {1, … , X} e che ∑xA(x) = N perche’ A(x) e’ una distribuzione La legge di potenza e’ anche detta distribuzione heavy-tailed o a coda larga Social Networks

Andamento x A(x) 1  cresce 2 > 1 Social Networks

Invarianza di scala Una funzione f(x) esibisce invarianza di scala se f(ax) = bf(x), dove a e b sono costanti Per una distribuzione A(x), invarianza di scala significa che, per ogni x e per ogni costante a, # individui che esibiscono il valore ax del parametro e’ ~ # individui che esibiscono il valore x del parametro Proprieta’ fondamentale: le leggi di potenza sono le uniche soluzioni di f(ax) = bf(x) Social Networks

Esempio/dimensioni dei file Si osserva che il numero di file di dimensione 2x e’ all’incirca 1/4 del numero di file di dimensione x Ad esempio, # file di dimensione 2 KB ≈ (1/4) # file di dimensione 1 KB La distribuzione A(x) soddisfa dunque la seguente proprieta’: A(2x) = (1/4)A(x) e dunque e’ una legge di potenza Social Networks

Invarianza di scala/2 A(x) = # siti cui sono stati fatti x accessi A(x) segue una distribuzione del tipo: Dove X e’ di nuovo il valore max. osservato per x. Dunque: Social Networks

Invarianza di scala/3 A/x e’ la frazione di siti ai quali sono stati fatti x accessi durante il periodo di osservazione Social Networks

Supponiamo di sapere che A(2x) = (1/4)A(x). Determinare  Esempio Supponiamo di sapere che A(2x) = (1/4)A(x). Determinare  Social Networks

Esempio/2 Sappiamo che A(x) deve seguire una legge di potenza, quindi A(x) sara’ del tipo: N e’ il numero di individui Social Networks

Esempio/3 Questo significa che A(x)/A(2x) = 2 = 1/4 Cio’ implica  = 2 Social Networks

Rappresentazione in scala logaritmica Le leggi di potenza diventano lineari se rappresentate in scala logaritmica: Le leggi di potenza sono le uniche a godere di tale proprieta’ Nota: si osservi che A ed N sono costanti per una particolare popolazione osservata Social Networks

Esempio: distribuzione degli accessi a siti Web Si osservi che il parametro  e’ la tangente (< 0) della retta di interpolazione Social Networks

Legge di Zipf Si ha quando studiamo il problema seguente: qual e’ il # accessi all’i-esimo sito piu’ popolare? dove N e’ il numero di siti considerati e 0 <  <= 1 Si osservi che ∑iZ(i) = X, il numero complessivo di accessi a tutti i siti Social Networks

Andamento al variare di  Z(i)  cresce i Andamento secondo legge di potenza ma la distribuzione studiata e’ diversa Social Networks

Esempio: distribuzione degli accessi a siti Web L’i-esimo elemento dell’asse delle ascisse rappresenta l’i-esimo sito piu’ popolare Siti con uguale numero di accessi ordinati a piacere Social Networks

Relazione tra leggi di potenza e di Zipf Proprieta’: legge di potenza implica legge di Zipf e viceversa Social Networks

Relazione tra leggi di potenza e di Zipf Si puo’ dimostrare che se A(x) segue una legge di potenza con parametro  allora Z(i) segue una legge di Zipf con parametro  = 1/(-1) La legge di Zipf rappresentata in coordinate logaritmiche corrisponde a una retta con pendenza - Social Networks

Esempio/1 Si supponga di considerare N siti Web e si supponga che l’i-esimo sito piu’ popolare abbia ricevuto R(i) richieste, dove Troviamo un limite inferiore a Rj, il numero complessivo di accessi ai j siti piu’ popolari Social Networks

Esempio/2 Si approssima la somma con un integrale x1--1 ≥ (x-1)1- per x ≥ 1 Vero per x = 1 Derivata di f(x) = x1--1 - (x-1)1- e’ > 0 per x ≥ 1 Social Networks

Esempio/3 Social Networks

Esempio/4 Dunque: Ad esempio, per  = 0.9, Rj > 0.8X non appena j/N ≥ (0.8)10 ≈ 0.11 Cio’ significa che l’ 11% dei siti piu’ popolari riceve piu’ dell’ 80% degli accessi Social Networks

Somme e integrali Z(i) 1 2 3 j j+1 i La sommatoria corrisponde alla somma delle aree dei rettangoli Social Networks

Riferimenti L. Adamic. Zipf, Power-laws, and Pareto - a ranking tutorial http://www.hpl.hp.com/research/idl/papers/ranking/ranking.html M. E. Newman. Power laws, Pareto distribution and Zipf’s law http://arxiv.org/abs/cond-mat/0412004 Anche: M. Mitzenmacher. A Brief History of Generative Models for Power Law and Lognormal Distributions http://www.eecs.harvard.edu/~michaelm/NEWWORK/postscripts/history-revised.pdf Social Networks