Carlo Bianchini - Univ. Udine 1 Gli strumenti per la ricerca I portali I motori di ricerca Le directory.

Slides:



Advertisements
Presentazioni simili
Presentazione della tesi di laurea di Flavio Casadei Della Chiesa Newsletter: un framework per una redazione web.
Advertisements

Il gestore di posta elettronica per le aziende e per gli studi
I Portali La strategia dei portali è in parte simile a quella dell'editoria tradizionale: confezionare un'offerta di contenuti con cui attrarre un pubblico.
TIC per ricerca e condivisione dell'informazione
IlTrovatore S.p.a. IlTrovatore RemoteSearch IlTrovatore mette a disposizione di portali Internet, piccole e medie imprese, tutto il suo know-how nel settore.
Informatica Modulo 4 – Ricerca di informazioni nel web.
INTERNET : ARPA sviluppa ARPANET (rete di computer per scopi militari)
P D Docente Progetto Microsoft® Docenti coinvolti nel progetto:
ASSESSORATO REGIONALE DEL LAVORO, DELLA PREVIDENZA SOCIALE, DELLA FORMAZIONE PROFESSIONALE E DELLEMIGRAZIONE Assessore: On.le Dr. Francesco Scoma Unità
Le reti informatiche!! Le reti di telecomunicazioni hanno permesso una maggior diffusione delle informazioni che possono essere trasmesse e ricevute.
Reti Informatiche.
WWW Il problema Fabio Vitali. WWW Fabio Vitali2 Introduzione Oggi esaminiamo in breve: u Alcuni concetti sui portali u Una prima suddivisione del progetto.
I.R.R.S.A.E.LIGURIA La rete telematica nella didattica.
Ricercare in Internet Lago nel pagliaio INTERNET Quasi ogni volta in cui hai sentito parlare di Internet o del World Wide Web hai probabilmente sentito.
E-RAV Incontro con le Associazioni di Volontariato Arona, 06 Maggio 2007 Cinema San Carlo.
TESTO ARGOMENTATIVO PASSI SMONTAGGIO SCHEMA 2. RICONOSCIMENTO PARTI
Strumenti e strategie del web 1.0 Gino Roncaglia (Università della Tuscia)
1 UNIVERSITA DEGLI STUDI MILANO PRESENTAZIONE NUOVO CATALOGO IN LINEA SERVIZI AL LETTORE Alessandra Carta Biblioteca delle Facoltà di Giurisprudenza Lettere.
Promozione presso le Camere di Commercio dei servizi ICT avanzati resi disponibili dalla banda larga Camera di Commercio di Parma Parma.
LA RICERCA BIBLIOGRAFICA NEL SETTORE BIOMEDICO: i motori di ricerca e la gestione dellinformazione biomedica CENTRO DI BIOTECNOLOGIE SETTORE DOCUMENTAZIONE.
La Ricerca in Rete Danco Singer novembre 2002 novembre 2002 Master in Editoria Multimediale La Ricerca in Rete: strategie di navigazione.
Azione D1-F.S.E Conoscenza per una nuova didattica Docente Esperto: Simona Riolo Docente Tutor: Alfio Messina Lezione # I.C.S.
La ricerca dell'informazione nel Web: Indici e motori
Sistema di supporto E-Learning
Progetto EDUCAMBIENTE
CORSO DI RICERCA BIBLIOGRAFICA 4. giornata (20 marzo 2008) Web of Science Beilstein e Gmelin Crossfire.
Lautore e il ricercatore nellambiente digitale 2. edizione 12 aprile 2007 Introduzione al Portale AIRE A cura di Cristina Capodaglio (Biblioteca del Dipartimento.
Eredità culturale e nuove tecnologie: La digitalizzazione del libro antico tra accesso e conservazione Padova, febbraio 2000 La biblioteca digitale:
Cercare informazioni sul Web. 5-2 Organizzazione dellinformazione tramite gerarchie Classificazione gerarchica Linformazione è raggruppata in un piccolo.
Torino - 15 luglio 2003www.subforservice.biz Il portale della subfornitura industriale piemontese Conferenza Stampa Torino, 15 luglio 2003.
Lavoro svolto da Veronica Mancin
Motori di ricerca: Un motore di ricerca è un sistema automatico che analizza un insieme di dati spesso da lui stesso raccolti e restituisce un indice dei.
RISORSE WEB Internet Per un uso consapevole delle risorse della Rete
1 Conoscere i fabbisogni Il Sistema informativo dellIsfol A livello nazionale e locale lItalia vanta una eccezionale mole di informazioni, soprattutto.
1 CSB di Economia Le nuove risorse per linformazione online settembre 2006 SFX cosa è e a cosa serve SFX è un software acquisito e implementato dallAteneo.
1 RISORSE DISPONIBILI PER GLI UTENTI B.A.U. Orientamento bibliografico – II modulo.
Banche dati in rete dateneo Cosa faremo: Primo giorno Introduzione alle principali banche dati umanistiche Secondo giorno Esercitazioni.
La ricerca in rete e la comunicazione/collabor azione Laboratorio Le fonti e la ricerca nel web.
Modulo 7 – reti informatiche u.d. 3 (syllabus – )
Pro Recruiting La piattaforma per la selezione
Modulo 7 – reti informatiche u.d. 1 (syllabus – )
Roma, 15 Novembre 2007 Stefano Spaggiari Come sfruttare efficacemente il Web 2.0 e lo user generated content.
Internet Ricerche nel web Gli indici sistematici (directory)
(c) 2003, BHAK und BHAS Oberpullendorf 2 Che cosa è Internet? Rete elettronica collega moltissimi computer grande banca dati e archivio mezzo di comunicazione.
1 Consigli ai naviganti: Cerco e offro lavoro: guida ai siti che trattano del mondo del lavoro Biblioteca Comunale di Cavriago.
SISTEMA INOLTRO TELEMATICO ISTANZE DECRETO FLUSSI 2010
Fondamenti delle Reti di Computer Seconda parte Carasco 15/04/2010.
Creare pagine web Xhtlm. Struttura di una pagina.
Gianpaolo Cecere Introduzione
COMUNICAZIONE ONLINE, RETI E VIRTUALITA’
COMUNICAZIONE ONLINE, RETI E VIRTUALITA MATTEO CRISTANI.
Università degli studi di Roma la Sapienza --- Laboratorio di Basi di Dati II - a.a. 2003/04 Presentato da: CAU Simone Matricola:
Web per gli storici Tirocinio del Corso di Laurea Magistrale in Scienze Storiche 29 maggio 2009.
INTERNET FA BENE AL BUSINESS?. L'e-commerce in Italia 2010:
Artisanexpo Gruppo di Lavoro Sommario n SAL Progetto n Statistiche sito e contatti n Piano promozionale 2003 n Ipotesi servizio a regime n Flusso.
Sedi ed uffici Asiacom S.r.L. ha sede legale a Milano, P.le Marengo n° 8. Sede di Milano:Via M. Gioia, 55 Tel Sede di Livorno:C.so Amedeo,
prof.ssa Giulia Quaglino
1/ x Generalità Sportello urbanistico Anagrafe degli immobili Servizi in OUTSOURCING 1/ 24.
La Conservazione Sostitutiva e la Soluzione Una-Doc.
Creato da Riccardo Nuzzone
SISR-WISCOM WIS e “Comunicazione” InternoEsterno Partner Clienti Investitori Altre organizzazioni Pubblico generico …. Dipendenti Consulenti.
MOTORI DI RICERCA. Un motore di ricerca è un sistema automatico che analizza un insieme di dati spesso da esso stesso raccolti e restituisce un indice.
I portali Il termine “portale” indica un insieme di siti che hanno come obiettivo quello di essere un punto privilegiato di accesso al Web. La maggior.
InternetInternet Sede: Salvo D’acquisto 2010/2011 Docente: Vito Monno.
Titolo della sezione Eventuale sottotitolo Formazione Volontari SCN 2011 Centro Linguistico di Ateneo - Mediateca Motori di ricerca non solo Google.
SEMINARIO WEB PROMOTION: I MOTORI DI RICERCA Letizia Catarini.
Comunicazione Multimediale Letizia Catarini. La differenza tra un motore di ricerca e una directory La differenza tra un motore di ricerca e una directory.
Università degli Studi di Pavia Facoltà di Economia, Giurisprudenza, Ingegneria, Lettere e Filosofia, Scienze Politiche Corso di laurea in Comunicazione.
Cercare In Internet. Cercare in Rete La scuola ha un ruolo preciso in relazione a quella che nei paesi anglosassoni viene denominata: Information Literacy.
LA STORIA DI. CHE COS'E' UN MOTORE DI RICERCA? Un motore di ricerca (in inglese search engine) è un sistema automatico che su richiesta analizza un insieme.
Transcript della presentazione:

Carlo Bianchini - Univ. Udine 1 Gli strumenti per la ricerca I portali I motori di ricerca Le directory

Carlo Bianchini - Univ. Udine 2 I portali Definizione: Un portale è un prodotto editoriale in linea che svolge la funzione di punto privilegiato di accesso al Web per gli utenti e che fornisce loro risorse informative, servizi di comunicazione personale e strumenti con i quali localizzare e raggiungere i contenuti e i servizi in linea di cui hanno bisogno

Carlo Bianchini - Univ. Udine 3 Origine dei portali Le ragioni di nascita dei portali sono da individuare nei seguenti fattori: grande mobilità degli utenti di Internet grande popolarità dei motori di ricerca, dei provider di accesso, dei servizi editoriali o informativi, dei servizi di community (chat, forum) e dei siti aziendali pubblicità pagata in relazione al numero di utenti di un sito

Carlo Bianchini - Univ. Udine 4 Sviluppo dei portali Due tendenze di sviluppo: A) sempre maggiore integrazione di servizi di navigazione e offerta generale di contenuti B) posizionamento di dominanza in un settore di nicchia e offerta specializzata di contenuti Due tipologie di portali: A) Meta-portali (portali orizzontali o megaportali) B) Portali di secondo livello (portali verticali)

Carlo Bianchini - Univ. Udine 5 I megaportali Definizione: sono portali nel senso classico: punti di accesso alla rete che offrono strumenti di ricerca, contenuti e servizi ad ampio spettro tematico. Punti di ingresso alla rete e di ricerca di informazione (Virgilio, Kataweb, Arianna) Natura profit Necessità di alto numero di utenti Indagini di mercato sui profili degli utenti

Carlo Bianchini - Univ. Udine 6 I megaportali 2 Cercano di espandere la loro offerta informativa: a monte: proponendosi come Internet Providers, a costi minori o nulli a valle: con offerta di servizi –strumenti di ricerca (directory e motori di ricerca) –canali –offerta di contenuti proprietari (notizie giornalistiche o contenuti verticali) –intrattenimento –Informazioni di servizio (meteo, oroscopo, annunci, programmazione tv e cinema, consultazione banche dati o elenchi telefonici ecc.) –personalizzazioni, creazione di agende personalizzate, servizi di commercio elettronico proprietari

Carlo Bianchini - Univ. Udine 7 I portali di secondo livello (verticali) Definizione: siti che offrono contenuti, servizi e (non sempre) strumenti di ricerca dedicati a particolari domini tematici (sport, cinema, informatica, finanza ecc.) o rivolti a ben definiti gruppi sociali e comunità Corporate Portals: vasta gamma di informazioni di proprietà del gestore, dei suoi partner commerciali o di terzi (evoluzione delle Intranet aziendali)

Carlo Bianchini - Univ. Udine 8 I portali di secondo livello (verticali) 2 Portale locale: siti dedicati ai bisogni e alle necessità di una comunità di utenti spazialmente definita (tipicamente le reti civiche) Portale di comunità: dedicati a segmenti di utenza effettuata in base a caratteristiche demografiche (ad es. età o etnia) o occupazionali (ad es. Portale di interesse: siti fortemente specializzati, indirizzati indistintamente a chiunque abbia interesse per un argomento specifico (ad es.

Carlo Bianchini - Univ. Udine 9 I Portali italiani Siti italiani più visitati: 1. Italia On Line 2. Virgilio 3. Tiscalinet 4. Tin.it 5. KataWeb 6. Yahoo.it 7. Supereva 8. Jumpy Portali verticali: Alice, Il Sole 24 Ore, Sportal

Carlo Bianchini - Univ. Udine 10 Gli strumenti per la ricerca I motori di ricerca (o Search Engines) Modalità di ricerca –ricerca basata sulla potenza di calcolo –tecnica a controllo di stringhe –elevato numero di risposte Le Directory –Modalità di ricerca –analisi diretta dei siti –organizzazione classificata delle informazioni –numero di risposte selezionato

Carlo Bianchini - Univ. Udine 11 Motori di ricerca per parole Funzioni: 1) navigare (spiders o crawlers); 2) indicizzare Basati su robot (sistemi di indicizzazione automatica): Raccolta di archivi immensi Ricerca per parola Ordinamento in base alla rilevanza Problema: fare individuare ad una macchina omonimie, sinonimie ed equivalenze semantiche

Carlo Bianchini - Univ. Udine 12 Motori di ricerca per parole 2 Altavista ( o.it) –1100 milioni di pagine –25 milioni di utenti al mese (marzo 2003) –Individua la lingua dei documenti (unico) e traduce Google ( oppure –1,2 miliardo di pagine –PageRank (2 miliardi di variabili) Northern Light ( Nuovo motore per ricerche bibliografiche

Carlo Bianchini - Univ. Udine 13 Ordinamento in base alla rilevanza Frequenza = n. occorrenze dei termini utilizzati per la ricerca all'interno della singola pagina recuperata Densità = rapporto fra il n. occorrenze dei termini all'interno della pagina e il totale delle parole contenute nella pagina Rarità = rapporto inverso fra il numero di occorrenze dei termini utilizzati per la ricerca all'interno del database del motore e il totale delle parole contenute nel database stesso. Alcuni motori dispongono anche di una lista di stopwords che vengono ignorate Compresenza = presenza, nella pagina, di più d'uno dei termini richiesti o addirittura di tutti.

Carlo Bianchini - Univ. Udine 14 Ordinamento in base alla rilevanza 2 Prossimità = presenza, nella pagina, di più d'uno dei termini richiesti - o addirittura di tutti - nella medesima frase o comunque vicini fra loro Priorità = ordine in cui sono stati immessi i termini nel form di ricerca Posizione = presenza dei termini in particolari zone della pagina Aggiornamento = a parità di requisiti, alcuni motori privilegiano le pagine più recenti Popolarità = numero dei link "in entrata" provenienti da altre pagine contenute nel database del motore Tariffazione = è possibile, pagando, garantire una posizione di rilievo alle proprie pagine nella schermata di risposta

Carlo Bianchini - Univ. Udine 15 Metadati e Metatag Per il recupero dellinformazione si utilizzano: Metadata ("dati sui dati", ovvero informazioni, general-mente strutturate e scandite in campi, relative a documenti primari "a testo pieno" o full-text) Metatag (sono quei tag, o marcatori, del linguaggio HTML che possono venire inseriti, con funzione di metadata, nella parte nascosta HEAD del file a cui si riferiscono

Carlo Bianchini - Univ. Udine 16 Metadati e Metatag 2 AUTHOR: più chi stende la pagina HTML che chi scrive il contenuto COPYRIGHT: Dichiarazione espli- cita e sintetica sui diritti relativi al documento GENERATOR = Indica il software utilizzato per creare il file HTML ROBOT = Indica ai software di ricerca dei motori se e come tenere conto della pagina TITLE: E' il metatag più utilizzato e più "pesante" per i motori di ricerca DESCRIPTION = Breve descri- zione del contenuto della pagina KEYWORD = Ulteriori parole chiave ritenute particolarmente significative

Carlo Bianchini - Univ. Udine 17 Le Directory Siti a selezione manuale di risorse di qualità Giustapposizione di classe e soggetto Ricorso a strutture gerarchiche (spesso mal strutturate) Fattore umano (qualità e dimensioni) Validità limitata nel tempo Un esempio: Yahoo ( oppure.it)

Carlo Bianchini - Univ. Udine 18 I motori di ricerca di seconda generazione Google ( Si basa su macchine che effettuano la ricerca delle parole chiave allinterno delle pagine registrate dal motore come i motori di prima generazione Si differenzia nel modo di valutare i risultati ottenuti (ranking) grazie al nuovo algoritmo PageRank (TM)

Carlo Bianchini - Univ. Udine 19 I motori di ricerca di terza generazione Teoma ( Si basa su macchine che effettuano la ricerca delle parole chiave allinterno delle pagine registrate dal motore come i motori di prima generazione Si differenzia nel modo di valutare i risultati ottenuti (ranking) grazia ad una nuovo algoritmo più restrittivo (Subject-specific popularity) Si differenzia nel modo di presentare i risultati (document clustering)

Carlo Bianchini - Univ. Udine 20 Document clustering Classificazione dei documenti: i documenti vengono scandagliati nei contenuti e presentati suddivisi per argomento e per rilevanza. Il processo è suddiviso in tre fasi: –Data mining –Text mining –Web mining

Carlo Bianchini - Univ. Udine 21 Data, Text Web mining Data mining: processo di estrazione di conoscenza da banche dati di grandi dimensioni attraverso lapplicazione di algoritmi che individuano le associazioni tra informazioni Text mining: estrazione e mappatura di informazioni direttamente dai testi, per realizzare una mappa cartografica delle informazioni Web mining: applicazione simultanea dei precedenti per la ricerca di associazioni sul piano dei contenuti, della struttura e delluso delle informazioni

Carlo Bianchini - Univ. Udine 22 Altri motori di terza generazione Vivisimo ( ) WiseNut ( ) Clusty ( ) Turbo10 ( ) Kart00 ( )