Privacy e motori di ricerca

Slides:



Advertisements
Presentazioni simili
Un approccio wiki alle biblioteche digitali: il progetto Wikisource
Advertisements

1 Consorzio interuniversitario per le Applicazioni del Supercalcolo Per Università e Ricerca Stelline 2008 Sala Volta, venerdì 7 marzo 2008 Seminario:
LE TECNOLOGIE DELL’INFORMAZIONE PER I BENI CULTURALI E IL TURISMO Prof
Ricerca e consultazione come modi duso dellEmeroteca virtuale e specchio del comportamento dellutente del www (Sforzini) Cenfor-Elsevier 2008 Biblioteca.
Profilazione d’utente nei sistemi di e-commerce
LinuxDay 2002TeateLUG c/o Università di Chieti1 di 17 TeateLUG LinuxDay 2002 by TeateLUG in collaborazione con l'Università G.D'Annunzio Damiano Verzulli.
IlTrovatore S.p.a. IlTrovatore RemoteSearch IlTrovatore mette a disposizione di portali Internet, piccole e medie imprese, tutto il suo know-how nel settore.
I VIDEOGIOCHI Piano di marketing.
INTERNET Prof. Zini Maura.
AMBIENTE VIRTUALE DI APPRENDIMENTO.
Questo documento è distribuito sotto la licenza Gnu GPL 2 1 Marco A. Calamari - Progetto Winston Smith Dal Progetto Winston Smith.
Questo documento è distribuito sotto la Gnu Free Documentation Licence E-privacy 2003 riservatezza e diritti individuali in Rete Difesa dell'identita.
Privacy ed anonimato in Rete
Questo documento è distribuito sotto la licenza Gnu GPL 2 1 Nadina Foggetti - Studio Legale Orofino Università degli Studi di Bari.
Pubblicità online.
Mantenimento dello stato Laboratorio Progettazione Web AA 2009/2010 Chiara Renso ISTI- CNR -
La sicurezza nel mondo Social Network dei
ObiettiviContenutiMetodologiaMateriali e strumenti Favorire la conoscenza e la consapevolezza delle nuove modalità di networking e di relazione con i potenziali.
Sistema Gestione Progetti
Responsabile: Ing. Daniele Bocci CORSO INTEGRATO DI INFORMATICA Master in Management Infermieristico.
L'open source a scuola... di Paola Travostino.
La Ricerca in Rete Danco Singer novembre 2002 novembre 2002 Master in Editoria Multimediale La Ricerca in Rete: strategie di navigazione.
1 Vista dal punto di vista delle case editrici leditoria libraria ci appare agire non su uno, ma su due mercati, uno di acquisizione e uno di destinazione.
CONVEGNO OLTRE WEB 2.0 ITIS CASTELLI VIA CANTORE, 9 5 FEBBRAIO 2009 Virginia Alberti Laura Antichi.
Roma Giancarlo Galardi
Unalternativa a Microsoft Office OpenOffice Author Kristian Reale Rev by Kristian Reale Liberamente distribuibile secondo i termini della licenza.
Cercare informazioni sul Web. 5-2 Organizzazione dellinformazione tramite gerarchie Classificazione gerarchica Linformazione è raggruppata in un piccolo.
Lavoro svolto da Veronica Mancin
RISORSE WEB Internet Per un uso consapevole delle risorse della Rete
1 CSB di Economia Le nuove risorse per linformazione online settembre 2006 SFX cosa è e a cosa serve SFX è un software acquisito e implementato dallAteneo.
La ricerca in rete e la comunicazione/collabor azione Laboratorio Le fonti e la ricerca nel web.
Social network Internet. Eun sito web di reti sociali, ad accesso gratuito. È il secondo sito più visitato al mondo, preceduto solo da Google. Il.
Modulo 7 – reti informatiche u.d. 2 (syllabus – )
Ottobre 2006 – Pag. 1
Aspetti strategico – organizzativi - gestionali delle imprese che aderiscono ad una rete Dott. Vincenzo Presutto Dottore Commercialista e Revisore Legale.
Fabrizio Grossi. 2) Conservazione dei Log di connessione 3) Individuazione procedure e soggetti preposti per verifica navigazione singola postazione.
Modulo 7 – reti informatiche u.d. 1 (syllabus – )
Applicazioni di modelli matematici alla ricerca semantica
Rossetto Stefano Seminario di Commercio Elettronico
INFORMATICA MATTEO CRISTANI. INDICE CICLO DELLE LEZIONI LEZ. 1 INTRODUZIONE AL CORSO LEZ. 2 I CALCOLATORI ELETTRONICI LEZ. 3 ELEMENTI DI TEORIA DELL INFORMAZIONE.
Modulo 1 – Diritto dautore e aspetti giuridici u.d. 8 (syllabus – 1.8.2)
1 20 maggio 2005 MISURE DI SICUREZZA INFORMATICA DEL NUOVO CODICE DELLA PRIVACY (d.lgs. 30 giugno 2003, n. 196)
12 dicembre 2012 Milano, Museo Nazionale della Scienza e della Tecnologia Leonardo da Vinci Valentina Aprea Assessore allOccupazione e Politiche del Lavoro,
COMUNICAZIONE ONLINE, RETI E VIRTUALITA’
Sicurezza Informatica. Conoscere ed evitare! 2/19 I Virus e le truffe informatiche.
Obiettivi di Design Rappresentano, in un prodotto software, le basi del successivo sviluppo del prodotto, perché, su di esse, si fondano le scelte prese.
COMUNICAZIONE ONLINE, RETI E VIRTUALITA MATTEO CRISTANI.
Percorsi di conoscenza e di cittadinanza
Marketing nel Turismo Strumenti di fidelizzazione del cliente Alessandro Binello Time2marketing.
No spam network organizzazioni di rete: Mailing List e Newsletter.
Pippo.
1 Applicazione per la gestione dei progetti di “Laboratorio e Tecnologie Web” Ilaria Iannantuono.
a cura di Francesco Lattari
La Conservazione Sostitutiva e la Soluzione Una-Doc.
Creato da Riccardo Nuzzone
SISR-QUALITÀ UN MODELLO DI QUALITÀ PER I SITI WEB fonte prof Polillo.
MOTORI DI RICERCA. Un motore di ricerca è un sistema automatico che analizza un insieme di dati spesso da esso stesso raccolti e restituisce un indice.
L’ISTITUTO DI RICERCHE DI MERCATO ONLINE. 2 per DATI SOCIO-DEMO.
Università RomaTre Editoria digitale Il programma del corso A.A Dr. Andrea Muti.
Titolo della sezione Eventuale sottotitolo Formazione Volontari SCN 2011 Centro Linguistico di Ateneo - Mediateca Motori di ricerca non solo Google.
UNITA’ 04 Uso Sicuro del Web.
SEMINARIO WEB PROMOTION: I MOTORI DI RICERCA Letizia Catarini.
UNIVERSITA’ DEGLI STUDI DI PAVIA CORSO DI LAUREA IN COMUNICAZIONE INTERCULTURALE E MULTIMEDIALE Relatore: Ing. Marco Porta Correlatore: Prof. Giampaolo.
Strategia di uno sviluppo
Le basi di dati.
NEWS 2015 MyCompany Presentazione. MyCompany Supervisione di tutti gli Impianti registarti nel Cloud Creazione di Offerte personalizzate con il proprio.
Phishing Il phishing è un tipo di truffa effettuata su Internet attraverso la quale un malintenzionato cerca di ingannare la vittima convincendola a fornire.
Pierfranco Ravotto – IT’s possible! IT’s an opportunity!
L’IFS in Lombardia Ufficio Scolastico Regionale per la Lombardia WEB & COMMUNICATION IMPRESA FORMATIVA SIMULATA Centrale di Simulazione IS Carlo Dell’
Capitolo I Il futuro. Per Darnton l’obiettivo delle biblioteche, in particolare quelle di ricerca, è aprire il patrimonio bibliografico e renderlo accessibile.
Transcript della presentazione:

Privacy e motori di ricerca E-privacy 2006 Firenze, 20 maggio Privacy e motori di ricerca La minaccia fantasma Claudio Agosti - vecna@sikurezza.org - http://www.s0ftpj.org

Copyright 2006, Claudio Agosti – s0ftpj/sikurezza.org È garantito il permesso di copiare, distribuire e/o modificare questo documento seguendo i termini della GNU General Public License, Versione 2 od ogni versione successiva pubblicata dalla Free Software Foundation. Una copia della licenza è acclusa come nota a questa slide, ed è anche reperibile all’URL http://fly.cnuce.cnr.it/gnu/doc.it/gpl.it.html

Perché “preoccuparsi” dei motori di ricerca ? Da loro parte la maggioranza delle navigazioni Sono emersi i più efficienti, eliminando gli altri Diamo loro informazioni sensibilissime, più utilizzabili di quanto crediamo Centralizzano le informazioni

Inclusione indiscriminata nell’indice I dubbi (finora) noti Profilazione Dare le proprie ricerche, come molti altri, per molti anni, significa fornire di log di informazioni sensibilissime Informazione guidata Quanto conta veramente il ranking ? Inclusione indiscriminata nell’indice E se non volessi essere indicizzato ? La parzialità della rete indicizzata Un motore non è l’indice di internet, quali pro e quali contro ? Le possibilità di data mining sull’indice, in cosa consistono ?

Precisamente di chi parliamo ? Indipendentemente da chi siano i principali motori di ricerca, dallo stato in cui sono, dai servizi che offrono e dalla loro storia, il problema è strutturale Google, Yahoo, MSN/Passport, oggi, sono semplici “riferimenti”: non capi d’accusa, non gli unici potenziali problemi

La profilazione La profilazione degli utenti è la descrizione digitale in relazione ad un comportamento reale: Es: Il numero di SMS e di e-mail giornaliere Es: I tratti autostradali che effettuiamo e con quale cadenza I nostri interessi, espressi nelle nostre ricerche La profilazione delle nostre ricerche descrive, quasi, ogni nostro interesse

Per mantenere uno storico è necessario potersi ricondurre all’utente La profilazione, 2 Per mantenere uno storico è necessario potersi ricondurre all’utente Sistemi di tracciamento adeguati e permessi dal protocollo L’utente si fa riconoscere tramite login/password per accedere ad accattivanti servizi E’ più efficiente correlando comportamenti differenti Nonostante le licenze dicano tutto e nulla

Profilazione - La realtà Il cookie eterno Il cookie di google scade il 17/01/2038 L’interazione tra i servizi Gmail, ads, gruppi, search history L’offerta di servizi che motivano la conservazione e l’analisi dei dati Licenze che mirano a dire effettivamente cosa verrà fatto, senza che gli utenti abbiano conoscenza reale del significato

Profilazione - La realtà, 2 La storia delle nostre ricerche e la teoria dell’”impronta”

Profilazione - La realtà, 3 L’uso esplicito degli ads Il data mining applicato alle nostre preferenze diventa pubblicità guidata L’uso implicito degli ads Quando ne carichiamo semplicemente uno, che succede ? Una nuova forma di analisi Non più “cosa facciamo”, ma “cosa ci interessa”, “cosa ci interessava” e “cosa sappiamo” Sfruttamento dell’interattività

L’importanza commerciale ? Informazione guidata Quando la censura diventa implicita anzichè esplicita, è sempre censura ? L’importanza commerciale ? E se l’ordine dell’indice cessa d’essere proporzionale al contenuto, ma è proporzionale all’investimento ? Anche il malware ha come target le prime posizioni

Quanto è importante il ranking ? Informazione guidata, 2 Quanto è importante il ranking ?

Quando il ranking viene sovvertito ? Informazione guidata, 3 Quando il ranking viene sovvertito ? Attaccando il PageRank, robot e link circolari Pagando, ADS o “collegamenti sponsorizzati” Organizzandosi tramite un SEO Strategia di marketing Quando l’informazione perde imparzialità ? Quando il riferimento diventa unico Quando si prevede il funzionamento dei filtri

Indicizzazione di massa Acquisizione implicita di informazioni Archiviazione virtualmente infinita La prima generazione di blog/liste Archivi personali online dopo anni possono infastidire i soggetti indicizzati Rottura dei collegamenti di fiducia Non discriminazione dei contenuti Sollevamento di responsabilità da parte dei SE Prima denuncia su lucro pedopornografico ad un SE

Indicizzazione e servizi limitrofi Il lato “privato” del database Le possibilità di correlazione tra servizi, e-mail, dati Analisi automatiche sul contenuto delle e-mail Ma è davvero privato ? Le licenze alle quali sottoscriviamo come ci tutelano ? Lo stato in cui il nostro traffico è centralizzato, quale regolamentazione ha a riguardo ?

Indicizzazione, le prime problematiche Indicizzare materiale protetto da © Conservazione di materiale non esplicitamente consentito Fuga di informazioni Impossibilità di verifica dei contenuti Attacchi al sistema di ranking Abuso dell’indicizzazione per favorire attività illecite Abusi (Fake SE, acquisizione tramite referrer ?)

La parzialità della rete indicizzata Web: rete ad “invarianza di scala” Chi non vorrebbe essere indicizzato può esserlo Chi potrebbe essere indicizzato può non esserlo Velocità di crescita del web e velocità dei crawler Unidirezionalità dei link

Problema asimmetrico Natura del problema E’ necessario un sistema centralizzato, ma non ci si può affidare solo a quello Prima dei SE l’informazione era di responsabilità dell’informatore La conoscenza dei lettori guida le loro scelte e viceversa Le informazioni che dà la massa sono riconducibili ai singoli Affidarsi a poche entità significa, alla lunga, dare stabilità e potere alle entità in questione

Qualche idea… Possibili soluzioni ? Meta SE Ranking pesato in parte dagli utenti (Collaborative Filtering) Proxy di ricerca (http://www.scroogle.org/)

Grazie dell’attenzione Fine Grazie dell’attenzione