Università degli Studi G.DAnnunzio Chieti e Pescara Seminario MOTORI DI RICERCA aprile 2011 maurizio gatto.

Slides:



Advertisements
Presentazioni simili
TIC per ricerca e condivisione dell'informazione
Advertisements

L’algoritmo PageRank.
Corso di Fondamenti di Informatica
BIBLIOTECA DI SAN MARTINO IN RIO
INTERNET Prof. Zini Maura.
DBMS (DataBase Management System)
Informatica Modulo 4 – Ricerca di informazioni nel web.
RETI INFORMATICHE Una panoramica su Internet WS_FTP
INTERNET : ARPA sviluppa ARPANET (rete di computer per scopi militari)
P D Docente Progetto Microsoft® Docenti coinvolti nel progetto:
Per scambiare opinioni con altri docenti Iscrizione ad una e-community Organizzazione di segnalibri Syllabus 4.0. – sezione7.2. Navigare nel web.
Informatica giuridica Reti telematiche ed informazione giuridica Lucio Maggio - Ignazio Zangara Anno Accademico 2007/2008.
Reti telematiche ed informazione giuridica I Informatica giuridica Lucio Maggio - Ignazio Zangara Anno Accademico 2005/2006.
Informatica giuridica Reti telematiche e diritto Lucio Maggio Anno Accademico 2000/2001.
Reti di Comunicazione Reti Locali (LAN - Local Area Network) Reti Geografiche (WAN - Wide Area Network) Reti Metropolitane (MAN - Metropolitan Area.
Simona Isabella Corso Società, Cultura, comunicazione
A cura di Lida Barazzutti. Col passare degli anni si moltiplicarono i computer collegati tra loro; intere reti, che nel frattempo si erano sviluppate.
"In Internet non siamo in grado di selezionare, almeno a colpo docchio, fra una fonte credibile e una folle. Abbiamo bisogno di una.
Ricercare in Internet Lago nel pagliaio INTERNET Quasi ogni volta in cui hai sentito parlare di Internet o del World Wide Web hai probabilmente sentito.
Promozione presso le Camere di Commercio dei servizi ICT avanzati resi disponibili dalla banda larga Camera di Commercio di Parma Parma.
IL PROBLEMA DELLA RICERCA DI INFORMAZIONI su Internet e sul web
La Ricerca in Rete Danco Singer novembre 2002 novembre 2002 Master in Editoria Multimediale La Ricerca in Rete: strategie di navigazione.
Azione D1-F.S.E Conoscenza per una nuova didattica Docente Esperto: Simona Riolo Docente Tutor: Alfio Messina Lezione # I.C.S.
Metodi e tecniche per lE-Tutor nella scuola Modulo 1 – Tecnologie didattiche e comunicazione multimediale APG Attività pratica guidata 16/2/2008.
Architettura del World Wide Web
Crawling Saverio Caminiti.
Concetti di base IR spiegati con l'esempio di Google.
MetaLib Lucia Soranzo, Antonella Zane Servizi digitali e portali accademici – Biblioteca del Dipartimento di Filosofia – 10 aprile 2006.
World Wide Web, ipertesti e HTML Lezione 6
Cercare informazioni sul Web. 5-2 Organizzazione dellinformazione tramite gerarchie Classificazione gerarchica Linformazione è raggruppata in un piccolo.
Lavoro svolto da Veronica Mancin
RISORSE WEB Internet Per un uso consapevole delle risorse della Rete
4 Cosa è una rete? ã Punto di vista logico: sistema di dati ed utenti distribuito ã Punto di vista fisico: insieme di hardware, collegamenti, e protocolli.
Reti telematiche ed informazione giuridica Informatica giuridica Ignazio Zangara Anno Accademico 2004/2005.
1 CSB di Economia Le nuove risorse per linformazione online settembre 2006 SFX cosa è e a cosa serve SFX è un software acquisito e implementato dallAteneo.
1 RISORSE DISPONIBILI PER GLI UTENTI B.A.U. Orientamento bibliografico – II modulo.
La ricerca in rete e la comunicazione/collabor azione Laboratorio Le fonti e la ricerca nel web.
Corso di Informatica per Giurisprudenza Lezione 7
Obiettivi dellinterfaccia Web Una buona interfaccia web deve assolvere a diverse funzioni: far percepire i contenuti permettere di individuare.
Modulo 7 – reti informatiche u.d. 1 (syllabus – )
Cos’è Internet Una rete globale di reti basata sul protocollo TCP/IP.
Internet L’essenziale.
Test Reti Informatiche A cura di Gaetano Vergara Se clicchi sulla risposta GIUSTA passi alla domanda successiva Se clicchi sulla risposta ERRATA passi.
Multimedialità, ipertesti e Web
Internet Ricerche nel web Gli indici sistematici (directory)
ELEMENTI DI BASE PER INIZIARE A NAVIGARE Biblioteca di Cavriago
Note per il corso di Teorie e … multimediale lezione 1 Marco Lazzari Università di Bergamo Facoltà di Lettere e Filosofia A.A
Server Web in una rete Windows Sommario Meccanismi di accesso remoto Meccanismi di accesso remoto Introduzione ai Server Web Introduzione ai Server.
Motori di Ricerca presente e futuro prossimo
Gianpaolo Cecere Introduzione
Laboratorio Alfabetizzazione Informatica Facoltà di Lettere e Filosofia a.a. 2005/2006.
COMUNICAZIONE ONLINE, RETI E VIRTUALITA MATTEO CRISTANI.
ECDL Patente europea del computer
Università degli studi di Roma la Sapienza --- Laboratorio di Basi di Dati II - a.a. 2003/04 Presentato da: CAU Simone Matricola:
Web per gli storici Tirocinio del Corso di Laurea Magistrale in Scienze Storiche 29 maggio 2009.
Servizi Internet 21 novembre 2003 INFORMATICA GENERALE Scienze per Operatori dei Servizi Giuridici Anno Accademico
Laboratorio Alfabetizzazione Informatica Facoltà di Lettere e Filosofia a.a. 2005/2006 Gamba Daniela
Internet.
prof.ssa Giulia Quaglino
Realizzazione Sito Web
MOTORI DI RICERCA. Un motore di ricerca è un sistema automatico che analizza un insieme di dati spesso da esso stesso raccolti e restituisce un indice.
Internet e HTML Diffusione di informazioni mediante la rete Internet.
InternetInternet Sede: Salvo D’acquisto 2010/2011 Docente: Vito Monno.
SEMINARIO WEB PROMOTION: I MOTORI DI RICERCA Letizia Catarini.
Cercare In Internet. Cercare in Rete La scuola ha un ruolo preciso in relazione a quella che nei paesi anglosassoni viene denominata: Information Literacy.
VALUTARE LE RISORSE WEB SAPPIAMO CHE INTERNET E' UN IMMENSO SERBATOIO DI INFORMAZIONI, MA ANCHE CHE CONTIENE TUTTO E IL CONTRARIO DI TUTTO. NESSUNA RICERCA.
INTERNET E INTRANET Classe VA SIA. La Storia di INTERNET ’ – ARPANET 1969 – anno di nascita università Michigan - Wayne 1970 – – INTERNET.
1 Consigli ai Naviganti: Funzioni di Base Concetti base del web, utilizzo dei principali motori di ricerca, creazione di account di posta elettronica.
LA STORIA DI. CHE COS'E' UN MOTORE DI RICERCA? Un motore di ricerca (in inglese search engine) è un sistema automatico che su richiesta analizza un insieme.
Enea Topi 1 ^B AS. 2014/2015. LA STORIA DI INTERNET Internet non è mai stata una rete militare, ma i militari sono alla radice della tecnologia su cui.
Transcript della presentazione:

Università degli Studi G.DAnnunzio Chieti e Pescara Seminario MOTORI DI RICERCA aprile 2011 maurizio gatto

Internet ARPANET (1960 – 1970) INTERNET 1983 (NFS network) 1985 (commerciale) 1989 (WWW - Tim Barners-Lee)

Web – docuverse (T.H. Nelson, 1974, teorico ipertesto) Universo organizzato dei documenti – infosfera (L. Floridi, 2002, teorico filosofia dellinformazione) Spazio semantico (documenti, agenti, operazioni)

Web Hubs and Authorities (HITS algorithm) Kleinberg identifica due due tipi di pagine web: authority: pagine che rappresentano autorevoli sorgenti di informazione per la query hub: liste che contengono puntatori a pagine relative allargomento della query Good hubs point to good authorities and vice versa Google nel 1998 progetta PageRank (brevettato nel 2001 US PTO Patent )US PTO Patent

Web Hubs and Authorities (HITS algorithm) Kleinberg identifica due due tipi di pagine web: authority: pagine che rappresentano autorevoli sorgenti di informazione per la query hub: liste che contengono puntatori a pagine relative allargomento della query Good hubs point to good authorities and vice versa Google nel 1998 progetta PageRank (brevettato nel 2001 US PTO Patent )US PTO Patent

Web 2.0 – Riuso dei dati (e degli utenti) – Contributo del singolo utente (dati e servizi) – Architettura della partecipazione – Autorganizzazione dellazione dal basso Source: Internet World Search Web 3.0

Risorse digitali – Utilizzo delle risorse digitali ipertestualità, accesso simultaneo, delocalizzazione, ubiquità – Risorse digitali modificabili, replicabili, personalizzate, ambigue, obsolescenti, instabili, volatili documento digitale: qualsiasi oggetto fisico: testo, immagine o filmato, rappresentato tramite una grandezza fisica che assume valori binari ottenuti attraverso un processo di elaborazione elettronica

Motori di ricerca: perché – Consultare il web (docuverse) Difficoltà di reperimento a causa dellenorme numero di informazioni non strutturate – Navigare con i link Partire da un punto e cercare i percorsi giusti Utilizzare i motori di ricerca semplicità di utilizzo (intuitivo), con una query si ottengono risultati rilevanti (o suggerimenti di ulteriori ricerche a partire dai link suggeriti)

Motori di ricerca: funzioni recupero informazioni dal web indicizzazione delle informazioni distribuzione agli utenti delle informazioni tramite query sintattico semantico realizzare profitto

Motori di ricerca: evoluzione – Archie e Gopher ( ) Ricerca file in siti FTP – Lykos, Infoseek, AltaVista, Excite ( ) Ricerca file in siti WWW – Yahoo! (1994) Acquisisce nel 2002 Inktomi, Overture, Altavista – MSN (1995) Accordo con Overture nel 2006 Dal 2006 cambia nome: Windows Live Dal 2009 cambia nome: Bing – Google (1997- sito 1999) Numero ricerche giornaliere(!?): m; mln; mln; mld mld Cronologia completa

Motori di ricerca: Top Google Yahoo! BingBing (ex Live Search ex MSN)Live Search

Motori di ricerca: Italia Virgilio Libero Tiscali

Motori di ricerca: metamotori Attingono i risultati da altri motori di ricerca e ne elaborano i risultati

Motori di ricerca: DMOZ DMOZ (Open Directory Project) Una directory NON un motore di ricerca

Motori di ricerca: dati (US) – 2008 (feb) Google 59,2% Yahoo! 21,6% Live 9,6% Altri 9,5% (Ask, AOL) – 2009 (feb) Google 63,3% Yahoo! 20,6% Live/Bing 8,1% Altri 8,0% (Ask, AOL) – 2010 (feb) Google 65,5% Yahoo! 16,8% Bing 11,5% Altri 6,2% (Ask, AOL) – 2011 (feb) Google 64,9% Yahoo! 17,3% Bing 13,4% Altri 4,4% (Ask, AOL) Source: comscore.com ITALIA (2009) Google* 96,81% Bing 1,35% Yahoo! 1,22% Altri 1,12% Source: StatCounter – GlobalStats

Motori di ricerca: dati (2010)

Motori di ricerca: moduli

Motori di ricerca: gatherer Collezionare documenti nel web – Tipologia extensive crawl, focused crawl, incremental crawl – Problemi dimensioni del web quantità dei dati nel web loop e trappole costi (di banda e hardware) – Soluzione metodologie distribuite e fault-tolerant

Motori di ricerca: crawler

1. Robots.txt (Robotstxt.org)Robotstxt.org 2. Nel codice di una pagina HTML … Perché alcune pagine non appaiono nei risultati dei motori di ricerca? Funzionamento di un crawler

Motori di ricerca: indexing Analisi del contenuto testuale Analisi dei contenuti multimediali Informazioni sui links Informazioni sul sito Analisi dei documenti

Motori di ricerca: indexing ordina i documenti ricevuti dal crawler crea lindice (inverso) delle parole immagazzina le informazioni recuperate in un database (o in database distribuiti)

Motori di ricerca: retrieval riceve le richieste (query) dal modulo search recupera le informazioni nel/i database fornisce le risposte al modulo search

Motori di ricerca: search Riceve la richiesta dellutente (query) invia la query al modulo retrieval recupera le risposte dal modulo retrieval restituisce le risposte allutente in forma testuale e/o grafica aggiunge risultati pay

Motori di ricerca: search

Ricorda: puoi utilizzare per ricerche a corrispondenza esatta + includi - escludi site: cerca in un dominio filetype: cerca un formato documento

Motori di ricerca: search

Motori di ricerca: le relazioni

Motori di ricerca: le relazioni

Motori di ricerca: le relazioni

Motori di ricerca: le relazioni Se cerchiamo bonifica amianto su – Google – Virgilio – Libero – Tiscali Otteniamo gli stessi risultati (anche pay)

Motori di ricerca: specializzati Elenco motori di ricerca

Motori di ricerca: news Google News Alerts Non una mailing list ma un servizio di Google (2003). Scegli la parola chiave e la frequenza della ricezione di una contenente le ultime news (abstract e link) sull'argomento scelto (funziona anche per le news delle singole nazioni, ) Utilizzare i motori di ricerca

Motori di ricerca: news Google News Alerts

Università degli Studi G.DAnnunzio Chieti e Pescara Grazie per lattenzione maurizio gatto