La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

La ricerca di risorse in rete

Presentazioni simili


Presentazione sul tema: "La ricerca di risorse in rete"— Transcript della presentazione:

1 La ricerca di risorse in rete
La ricerca è rappresentata da quel complesso di attività volte ad accertare l'esistenza di un insieme di documenti a cui il ricercatore, in base agli interessi e agli obiettivi che si propone, intende accedere. In ambito scolastico si effettua per sapere quanto è disponibile sull'argomento di cui ci si occupa. Internet costituisce, senza dubbio, un immenso serbatoio di informazioni, ma occorre tener presente che non è il deposito universale della conoscenza in cui trovare risposta a qualsiasi domanda; in campo scolastico è molto facile produrre ricerche o lavori incompleti, perchè frutto di un'errata metodologia di ricerca, che denuncia limiti sia nella capacità di muoversi in modo consapevole nella rete, sia nella valutazione e selezione dell'informazione. Per prima cosa, bisogna comprendere che la rete mette a disposizione informazione di natura molto eterogenea, raggiungibile attraverso diversi canali, la quale si presenta in forma ordinata, ma strutturata in maniera fortemente soggettiva, ed in forma non ordinata, cioè libera e occasionale. Pertanto, prima di cercare informazione in rete, va tenuta presente questa fondamentale differenza, poi occorre interrogarsi sulla natura di ciò che si cerca e avere la capacità di capire dove e con quali strumenti essa può essere reperita. Questo breve courseware si propone di far conoscere gli elementi di base per utilizzare Internet al meglio delle sue possibilità e si rivolge soprattutto ai docenti che intendono introdurre le risorse web nella pratica didattica curricolare, guidandoli nella ricerca, nell'analisi e nella valutazione dei prodotti in rete con una più consapevole scelta di strumenti e attraverso l'uso di strategie mirate. Il corso è strutturato in due moduli: Il paradigma di browsing, dedicato alle metodologie di ricerca dell'informazione non ordinata; Il paradigma di querying, dedicato alla ricerca dell'informazione preordinata. Al termine dei moduli il lettore sarà in grado di comprendere i parametri e le caratteristiche che gli permettono di valutare gli strumenti didattici offerti da Internet e di familiarizzare con la terminologia correntemente utilizzata in tale ambito.

2 La ricerca di risorse in rete
La ricerca è rappresentata da quel complesso di attività volte ad accertare l'esistenza di un insieme di documenti a cui il ricercatore, in base agli interessi e agli obiettivi che si propone, intende accedere. In ambito scolastico si effettua per sapere quanto è disponibile sull'argomento di cui ci si occupa. Internet costituisce, senza dubbio, un immenso serbatoio di informazioni, ma occorre tener presente che non è il deposito universale della conoscenza in cui trovare risposta a qualsiasi domanda; in campo scolastico è molto facile produrre ricerche o lavori incompleti, perchè frutto di un'errata metodologia di ricerca, che denuncia limiti sia nella capacità di muoversi in modo consapevole nella rete, sia nella valutazione e selezione dell'informazione. Per prima cosa, bisogna comprendere che la rete mette a disposizione informazione di natura molto eterogenea, raggiungibile attraverso diversi canali, la quale si presenta in forma ordinata, ma strutturata in maniera fortemente soggettiva, ed in forma non ordinata, cioè libera e occasionale. Pertanto, prima di cercare informazione in rete, va tenuta presente questa fondamentale differenza, poi occorre interrogarsi sulla natura di ciò che si cerca e avere la capacità di capire dove e con quali strumenti essa può essere reperita. Questo breve courseware si propone di far conoscere gli elementi di base per utilizzare Internet al meglio delle sue possibilità e si rivolge soprattutto ai docenti che intendono introdurre le risorse web nella pratica didattica curricolare, guidandoli nella ricerca, nell'analisi e nella valutazione dei prodotti in rete con una più consapevole scelta di strumenti e attraverso l'uso di strategie mirate. Il corso è strutturato in due moduli: Il paradigma di browsing, dedicato alle metodologie di ricerca dell'informazione non ordinata; Il paradigma di querying, dedicato alla ricerca dell'informazione preordinata. Al termine dei moduli il lettore sarà in grado di comprendere i parametri e le caratteristiche che gli permettono di valutare gli strumenti didattici offerti da Internet e di familiarizzare con la terminologia correntemente utilizzata in tale ambito.

3 Il paradigma di querying
In Internet si discute di information overload, eccesso di informazione, in cui gli utenti spesso si perdono, passando da una risorsa all’altra e muoversi in un ambiente talvolta difficile, soprattutto per gli utenti individuali che si affidano agli strumenti per raggiungere una risorsa loro occorrente. Così, per assolvere al bisogno conoscitivo dei vari utenti e per agevolare il compito di ricerca della tipologia dell'informazione desiderata,la rete mette a disposizione strumenti idonei; il maggior problema è la certezza degli utenti di "cosa" cercare e "dove" cercarla: non è possibile pensare di cercare in un unico posto e di adoperare un unico strumento di ricerca. Partendo, quindi, dalla consapevolezza che in rete l'informazione può essere sparsa e destrutturata ed il suo ritrovamento casuale, e che esiste anche un'informazione fortemente strutturata, più affidabile e sicura e di più facile reperibilità, ma non sempre pertinente alla ricerca, l'utente deve sapersi muovere soprattutto nella scelta degli strumenti che gli consentiranno di raggiungere il suo scopo, avendo sempre presente che nessuno di essi raggiunge l'esaustività completa del bisogno. La Coalition for Networked Information (Calvani, Rotta,1999), istituzione americana che si occupa dell'uso educativo di internet, analizzando le metodologie adottate dagli utenti nelle ricerche delle informazioni, distingue due casi di studio: un processo di discovery, un processo di retrieval. La prima consiste nell'identificare una risorsa tra le tante disponibili, la seconda nel renderla effettivamente utilizzabile. La prima implica, quindi, la capacità di distinguere tra informazioni utili e superflue, la possibilità di trovare ciò che si cerca e tutto ciò che riguarda l'argomento in questione, o tutto ciò che è reso disponibile sull'argomento. La seconda implica processi di verifica contenutistica e metodologica e presuppone la capacità di selezionare, all'interno delle informazioni richiamate, ciò che è effettivamente utile. Pertanto, fa parte dei processi che vengono definiti discovery riuscire a mettere insieme un elenco ragionato di url di siti su un determinato argomento, il cui risultato più semplice è un elenco di indirizzi utili non ragionati, tra i tanti che potrebbero essere forniti dai database o dai motori di ricerca; fa parte della pratica che viene definita retrieval navigare all'interno dei siti individuati per selezionare e scaricare testi o parti di essi. Soprattutto i meccanismi di discovery vengono attentamente studiati: non è difficile mettere insieme informazioni, quanto saperle collocare in modo che ciascuna di esse possa essere utilizzata con profitto nella successiva fase di retrieval. Discovery e retrieval sono meccanismi di un complesso processo che vede implicati il problema dei metodi e delle tecniche di ricerca e, nello stesso tempo, le implicazioni delle tecnologie di rete nei procesi conoscitivi.

4 Network information retrieval
I motori di ricerca Tecniche di querying Qualità dell'informazione La ricerca bibliografica Network information retrieval Il World Wide Web è la risorsa Internet probabilmente più nota e i suoi ritmi di espansione sono esponenziali. Le pagine informative immesse in rete riguardano gli argomenti più disparati e provengono da fornitori di informazione di natura assai diversa; ad esse si aggiungono le numerosissime "home page" personali che ogni utente Internet può realizzare. Chi svolge una ricerca in rete si trova, dunque, davanti a un duplice problema: reperire l'informazione cercata e valutare la sua correttezza, completezza e imparzialità. Quanto al primo problema, quello di trovare le pagine esistenti che si occupano di un determinato argomento, una buona partenza, se non è conosciuto l'indirizzo (URL) del sito dove trovare le informazioni, è in genere rappresentata dagli strumenti di ricerca disponibili in rete; i motori di ricerca per termini permettono di ricercare parole o combinazioni di parole in un archivio di documenti digitali. Se si cerca una singola parola, basta scriverla; se, invece, le parole sono più di una è necessario rispettare una serie di regole per inserirle nel modo giusto; la logica generale è sempre la stessa, ma la sintassi in cui esprimerla può essere leggermente diversa da motore a motore), il tasto per avviare la ricerca stessa e, in molti motori di ricerca, il menù per la scelta del linguaggio. Un indice sistematico permette, invece, di selezionare in maniera sempre più precisa l'argomento desiderato partendo da un argomento generale. Esistono molti strumenti di questo tipo in Internet, che presentano un elenco navigabile di categorie molto ampie,cioè del primo livello di una struttura gerarchica ad albero, in cui l'utente può addentrarsi seguendo i link. In questo caso basta conoscere l'indirizzo del sito che riporta l'indice principale, scegliere l'argomento che interessa ed entrare nell'albero fino a quando si trova quello che si cerca o non si trova nulla: una ricerca che in uno non dà alcun risultato, in un altro può sommergere di documenti. Il secondo compito dipende in parte dall'esperienza; una volta trovata una pagina reputata interessante, è importante risalire alla pagina principale del sito che la ospita, o attraverso gli appositi collegamenti, o riducendo progressivamente l'indirizzo nella barra delle URL, salendo di livello in livello nella struttura gerarchica del sito. In questo modo si possono reperire informazioni su chi ha immesso in rete quella particolare pagina, in quale contesto e a quale scopo.

5 I motori di ricerca Tipologia Funzionamento Struttura codice HTML
Ricerca per Keywords Ricerca per directory Metamotori Metacrawler Dogpile Funzionamento Interfaccia Ricerca semplice Spider e crawling Keywords Stringhe Struttura codice HTML Codici di marcatura Metatag Web usability Web semantico XML Il Dublin core I motori di ricerca Un motore di ricerca è un sito all’interno del quale sono catalogate milioni di pagine Internet in tutte le lingue e di tutto il mondo; il motore può ricercare nomi, parole e frasi presenti nelle pagine catalogate. Ad esempio, se si chiede al motore di ricerca di cercare una certa parola, esso mostrerà un elenco di tutte le pagine Internet memorizzate in enorme archivio elettronico, all’interno delle quali la parola è presente. Nella pagina principale di ogni motore di ricerca c’è un riquadro nel quale scrivere la parola cercata e poi cliccare sull’immagine di un tasto con la scritta< cerca, trova> o <find o search>. Un riquadro di ricerca collegato ai motori è oggi spesso presente anche in altri siti. Occorre pertanto sapere che: ogni motore ha le sue regole di ricerca; può essere utile decidere di imparare ad usare bene un unico motore, in modo da sfruttarne le potenzialità; quanti più motori si utilizzano tanti più risultati si hanno; ogni motore ha una pagina di help o di aiuto nella quale queste regole sono indicate. i motori cercano solo all’interno del World Wide Web, cioè all’interno delle "pagine Internet": se da un sito è possibile scaricare, ad esempio, un testo ricco di informazioni scritto al computer, queste non sono analizzate dal motori; i motori coprono poco più diun quarto delle pagine Internet esistenti.

6 Tipologia Motori Metamotori Ricerca per Keywords Ricerca per directory
Google Altavista Ricerca per directory Yahoo! Metamotori Metacrawler Dogpile Tipologia I motori di ricerca si suddividono in due categorie: directory e indici. Le directory vanno bene per individuare le informazioni generali; esse raggruppano i siti Web in categorie simili, per cui i risultati della ricerca saranno costituiti da un elenco di siti attinenti al termine di ricerca. Ma se si cercano informazioni più specifiche, occorrono gli indici Web, ossia i motori di ricerca, perché ricercano tutti i contenuti di un sito Web, utilizzando programmi software denominati spider o robot che perlustrano Internet, ed analizzano milioni di pagine Web e messaggi inseriti nei newsgroup ed indicizzano tutte le parole. Gli indici trovano le singole pagine di un sito Web che corrispondono alla ricerca, anche se il sito non è pertinente con ciò che si sta cercando. In questo modo, si possono trovare spesso informazioni inattese e magari preziose, ma anche molte informazioni irrilevanti. I risultati della ricerca solitamente vengono classificati per ordine di importanza – il numero di volte che il termine appare in un documento, o la percentuale di corrispondenza (matching) del documento con il concetto inserito. Un parametro che incide nella qualità di un motore di ricerca è la capacità di visualizzare per primi i siti più “significativi”, quelli cioè che dovrebbero risultare di maggiore interesse per l’utente. E’ una caratteristica rilevante se si pensa che la buona parte delle ricerche si conclude visitando solo i siti indicati nella prima pagina dei risultati. Spesso l’obiettivo di una ricerca è un ben definito sito di cui non si conosce l’indirizzo ed in questo caso è ancora più importante che venga visualizzato nelle primissime posizioni. La rete costituisce una struttura di distribuzione interconnessa di conoscenza che consente di sviluppare criteri di analisi su base matematica. La tecnologia denominata PageRank si basa su un algoritmo molto articolato che considera un numero estremamente elevato di parametri per individuare i siti corrispondenti con le richieste dell’utente. Uno di questi parametri cerca di rilevare l’autorevolezza di un sito sulla base del numero di link presenti negli altri siti che puntano ad esso, puntando così ai criteri di valutazione propri della struttura reticolare della rete, ma finché mancherà una struttura semantica al web non sarà facile valutarne i contenuti. Attualmente, comunque, la correttezza e il valore dei contenuti di un sito si può valutare soprattutto attraverso l’autorevolezza del suo autore, del suo editore e, in definitiva, come avviene con le forme più tradizionali di pubblicazione, dal confronto e dall’analisi comparata delle diverse fonti di conoscenza (Calvo, Roncaglia, 2004).

7 Motori Ricerca per Keywords Ricerca per directory Google Altavista
Ricerca semplice Ricerca avanzata La Google Toolbar Altavista Ricerca per directory Yahoo! Motori I motori di ricerca, strutture tecnologiche sorrette da avanzati dispositivi hardware e da software sempre più sofisticati, si avvalgono di programmi detti crawlers che percorrono incessantemente la rete alla ricerca di siti da catalogare. Solitamente questi programmi sono richiamati dai web master, che compilano specifiche richieste ai motori di ricerca affinché le proprie pagine siano inserite nei loro indici per aumentarne la visibilità e le consultazioni. I crawlers, però, possono esplorare il Web anche in modo autonomo e per questo vengono detti agenti software. Individuati i siti da catalogare, inviano i riferimenti a calcolatori che li archiviano negli URL server, potenti computer che hanno unità di memorizzazione estremamente capaci, dove vengono registrati i riferimenti delle pagine come il titolo ed il testo. Viene poi eseguita una procedura di indicizzazione dei dati catalogati in modo da rendere estremamente rapida la costruzione di elenchi delle risorse cercate. Il processo di ricerca avviene sui dati catalogati nei motori di ricerca e non consultando in tempo reale tutti i siti web di Internet. Tuttavia, l’indice potrebbe riportare riferimenti a pagine che nel frattempo sono state cancellate o modificate e che non sono quindi più raggiungibili (dead link), per evitare questo inconveniente gli agenti percorrono sempre più velocemente la rete e molti siti vengono visitati anche quotidianamente, creando complessivamente una gran mole di traffico. Comunque, i principali problemi del recupero delle informazioni in Internet derivano dalla natura eterogenea del Web, che non si presta ad una semplice catalogazione dei suoi contenuti. Le pagine sono create sulla base delle più disparate esigenze e il codice HTML non consente, se non in misura molto limitata, di fornire indicazioni sui loro contenuti. Una pagina web non è suddivisa in campi codificati che contengono oggetti definiti, non possiede, cioè, una struttura come i tradizionali archivi informatici (data base). Quando si consulta un insieme di dati strutturati, sappiamo che le informazioni contenute appartengono a determinate categorie; le metodologie di recupero delle informazioni (information retrieval) sviluppate dalla teoria delle basi di dati si fondano sulla struttura predefinita degli archivi informatici dove ogni informazione è contenuta in uno specifico campo. Sono, invece, molto più complicate le tecniche di ricerca su dati non strutturati, dove una parola può assumere molteplici significati in relazione al conteso in cui è inserita. Mancando una codifica e una strutturazione dei dati, i risultati delle ricerche sono molto meno significativi o inquinati da informazioni non pertinenti. Per affrontare questo problema sono stati via via introdotti nelle successive versioni dell’HTML, i cosiddetti metatag, cioè indicatori che non determinano l’aspetto grafico, ma che consentono di definire altri dati e informazioni relativi alle pagine, in sostanza dei metadati, cioè dati sui dati. Anche il tag <title> … </title>, con il quale si può definire un testo che compare nella barra del titolo, pur non essendo strettamente un metatag, è uno dei parametri più indicativi del suo contenuto e più utilizzato dai motori di ricerca. Affrontare una ricerca in rete significa, dunque, partire dalla scelta del motore di ricerca: la rete ne propone molti e anche se alcuni sono sicuramente più efficienti di altri, nessuno garantisce un’analisi completa. Inoltre, visto che i siti catalogati possono essere diversi da motore e motore, anche i risultati spesso lo sono, almeno parzialmente; ciò porta a consigliare di ripetere la ricerca con più motori, soprattutto quando non si è soddisfatti dei risultati, anche in considerazione del fatto che le modalità di interrogazione sono molto simili e comunque semplici e intuitive. Quando si esegue una ricerca solitamente si è interessati ad una sola accezione del termine cercato; purtroppo, mancando strumenti di analisi semantica del Web, non è possibile specificare un significato e l’unica possibilità risiede nel definirne un contesto di riferimento associandolo ad altri termini. Come si vede non esiste una strada semplice che conduca inequivocabilmente ai risultati più significativi e la strategia di procedere per tentativi ed errori si rivela spesso la più efficace.

8 Ricerca per Keywords Google Altavista Ricerca semplice
Ricerca avanzata La Google Toolbar Altavista Ricerca per Keywords I motori di ricerca per termini rappresentano la seconda grande categoria di strumenti di ricerca su web. In questi casi la ricerca avviene indicando una parola, o una combinazione di parole associata al tipo di informazione da reperire e abbastanza specifica da non produrre una quantità eccessiva di risultati non pertinenti. Tale procedimento è utile solo se abbiamo un'idea sufficientemente chiara di quello che si cerca e se l'ambito della ricerca può essere associato in maniera ragionevolmente immediata a un termine o a un piccolo insieme di termini. Comunque, i principali problemi del recupero delle informazioni in Internet derivano dalla natura eterogenea del Web, che non si presta ad una semplice catalogazione dei suoi contenuti. Le pagine sono create sulla base delle più disparate esigenze e il codice HTML non consente, se non in misura molto limitata, di fornire indicazioni sui loro contenuti. Una pagina web non è suddivisa in campi codificati che contengono oggetti definiti, non possiede, cioè, una struttura come i tradizionali archivi informatici (data base). Quando si consulta un insieme di dati strutturati, sappiamo che le informazioni contenute appartengono a determinate categorie; le metodologie di recupero delle informazioni (information retrieval) sviluppate dalla teoria delle basi di dati si fondano sulla struttura predefinita degli archivi informatici dove ogni informazione è contenuta in uno specifico campo. Sono, invece, molto più complicate le tecniche di ricerca su dati non strutturati, dove una parola può assumere molteplici significati in relazione al conteso in cui è inserita. Mancando una codifica e una strutturazione dei dati, i risultati delle ricerche sono molto meno significativi o inquinati da informazioni non pertinenti.

9 Google Ricerca semplice Ricerca avanzata La Google Toolbar Google
Fondato nel settembre 1998 da Larry Page e Sergey Brin, Google è diventato in pochissimi anni il motore di ricerca su Web, tanto da far nascere il neologismo to google, che indica appunto l'attività di svolgere una ricerca in rete utilizzando l'omonimo servizio. A fine agosto 2003 Google ha dichiarato di indicizzare oltre tre miliardi e trecento milioni di pagine Web, o meglio, di documenti accessibili su Web: Google, infatti, indicizza, oltre alle pagine HTML, anche diversi altri tipi di documenti, a condizione che essi siano disponibili all'interno di un sito Web aperto al pubblico; fra gli altri, file PDF, documenti Word, presentazioni PowerPoint e risponde a oltre duecento milioni di richieste al giorno. Il singolare nome del sito è un gioco di parole basato sulla parola 'googol', inventata da Milton Sitotta, nipote del matematico Edward Kasner, per riferirsi al numero rappresentato da un '1' seguito da cento '0': simbolo dunque dell'enorme quantità di informazione che il motore di ricerca si propone di dominare (Calvo, Roncaglia, 2004). In base ad una ricerca del marzo 2001 è il motore con l'archivio più completo, che consta di 1.3 miliardi di pagine web, contro una stima di 5 miliardi di pagine web e 550 miliardi di documenti che sembra compongano l'intera Rete. Il sito è in grado di interpretare le impostazioni del browser relative alle lingue preferite, presentandosi automaticamente con l'interfaccia nella lingua preferita dall'utente. La traduzione riguarda solo l'interfaccia, mentre il database sul quale viene svolta la ricerca è comunque lo stesso. L'interfaccia inglese offre alcune funzioni non presenti nelle interfacce in altre lingue, ad esempio la ricerca su notizie; anche se al primo accesso il sito si presenta in italiano, l'interfaccia inglese è sempre raggiungibile attraverso il link 'Google in English'. < > Attraverso il meccanismo di ranking, ordinamento per importanza dei risultati, Google cerca di limitare (per quanto possibile) la fatica di selezionare, all'interno dei risultati, quelli più rilevanti, mostrandoli direttamente per primi. Per determinare l'importanza di una pagina, gli algoritmi di Google utilizzano un insieme piuttosto complesso di fattori: se i termini ricercati sono nel titolo di una pagina, o nelle sue aree attive, o se compaiono molto spesso, o se molti degli utenti che hanno svolto la stessa ricerca hanno selezionato quella pagina nell'elenco dei risultati, o se molti altri siti hanno link verso di essa. La posizione 'elevata' di una pagina all'interno dei risultati aumenta la visibilità del sito di cui la pagina stessa fa parte e gli stessi risultati, pur essendo assai numerosi, ordinati in maniera affidabile, cercano di dare all'utente una risposta utile e immediatamente utilizzabile.

10 Ricerca semplice La ricerca attraverso Google è possibile in due modalità: la ricerca semplice e quella avanzata. Nella modalità di ricerca semplice, 'Web' conferma che la ricerca si svolgerà sulla base dati costituita dalle pagine Web, mentre 'Directory' porta all'indice sistematico che Google mutua da Open Directory. I termini da cercare vanno inseriti in un semplicissimo modulo composto da un unico campo. Se inseriamo più di un termine la ricerca avviene in 'AND' e restituisce le pagine in cui compaiono tutti i termini inseriti. Il pulsante 'Mi sento fortunato' è una peculiarità di Google: se si preme al posto del pulsante 'Cerca con Google', anziché arrivare a una lista di pagine Web che soddisfano i nostri criteri di ricerca salteremo direttamente alla prima di tali pagine. La presenza di questa opzione vuole richiamare quello che è stato fin dalla nascita uno dei vanti principali di Google: l'algoritmo di ordinamento dei risultati, che, in continua evoluzione e sempre più sofisticato ed efficace, ha la funzione di elencare per prime le pagine più rilevanti per la ricerca. Google restituisce i suoi risultati dieci alla volta: Il titolo di ognuna delle pagine di corrispondenze è in blu ed è cliccabile e sotto di esso compare un breve estratto della pagina per capire in che contesto sono usati i termini cercati e, se la pagina è compresa nell'indice sistematico di Google, anche la relativa descrizione e categoria. L'integrazione fra motore di ricerca e indice sistematico costituisce una novità del 2003 ed è lineare e di immediata interpretazione. Troviamo in verde l'indirizzo completo della pagina, una stima del suo 'peso' in Kbyte e il comodissimo link alla 'copia cache' della pagina stessa: nell'indicizzare un sito, infatti, Google conserva sui propri server una copia locale di tutte le pagine trovate. La copia locale può mancare di diverse caratteristiche della pagina originaria (immagini, ecc.) e alcuni link possono non funzionare, ma in molti casi essa consente di arrivare all'informazione che cerchiamo anche quando il sito in questione per qualche motivo non sia raggiungibile, o la pagina sia stata cancellata o modificata. In alcuni casi può essere utile anche il link 'pagine simili', che sfrutta un algoritmo di 'filtraggio collaborativo' (basato sull'analisi delle abitudini di navigazione degli utenti) elaborato per collegare fra loro siti di argomento analogo. Ricerca semplice La ricerca attraverso Google è possibile in due modalità: la ricerca semplice e quella avanzata. Nella modalità di ricerca semplice, 'Web' conferma che la ricerca si svolgerà sulla base dati costituita dalle pagine Web, mentre 'Directory' porta all'indice sistematico che Google mutua da Open Directory. I termini da cercare vanno inseriti in un semplicissimo modulo composto da un unico campo. Se inseriamo più di un termine la ricerca avviene in 'AND' e restituisce le pagine in cui compaiono tutti i termini inseriti. Il pulsante 'Mi sento fortunato' è una peculiarità di Google: se si preme al posto del pulsante 'Cerca con Google', anziché arrivare a una lista di pagine Web che soddisfano i nostri criteri di ricerca salteremo direttamente alla prima di tali pagine. La presenza di questa opzione vuole richiamare quello che è stato fin dalla nascita uno dei vanti principali di Google: l'algoritmo di ordinamento dei risultati, che, in continua evoluzione e sempre più sofisticato ed efficace, ha la funzione di elencare per prime le pagine più rilevanti per la ricerca. Google restituisce i suoi risultati dieci alla volta: Il titolo di ognuna delle pagine di corrispondenze è in blu ed è cliccabile e sotto di esso compare un breve estratto della pagina per capire in che contesto sono usati i termini cercati e, se la pagina è compresa nell'indice sistematico di Google, anche la relativa descrizione e categoria. L'integrazione fra motore di ricerca e indice sistematico costituisce una novità del 2003 ed è lineare e di immediata interpretazione. Troviamo in verde l'indirizzo completo della pagina, una stima del suo 'peso' in Kbyte e il comodissimo link alla 'copia cache' della pagina stessa: nell'indicizzare un sito, infatti, Google conserva sui propri server una copia locale di tutte le pagine trovate. La copia locale può mancare di diverse caratteristiche della pagina originaria (immagini, ecc.) e alcuni link possono non funzionare, ma in molti casi essa consente di arrivare all'informazione che cerchiamo anche quando il sito in questione per qualche motivo non sia raggiungibile, o la pagina sia stata cancellata o modificata. In alcuni casi può essere utile anche il link 'pagine simili', che sfrutta un algoritmo di 'filtraggio collaborativo' (basato sull'analisi delle abitudini di navigazione degli utenti) elaborato per collegare fra loro siti di argomento analogo.

11 Ricerca avanzata Gli utenti più abili preferiranno spesso alla pagina della ricerca di base quella della ricerca avanzata: attraverso qualche campo in più e comodi menu a tendina, tale pagina consente un controllo raffinato delle opzioni di ricerca e l'impostazione di ricerche anche assai complesse. Nei campi attivi, a scelta dell'utente, occorre solo digitare il termine o i termini della ricerca; il software è predisposto per attivare le procedure di ricerca booleana. Per operare con maggiore precisione, è consigliabile leggere attentamente le opzioni della maschera. Ricerca avanzata Gli utenti più abili preferiranno spesso alla pagina della ricerca di base quella della ricerca avanzata: attraverso qualche campo in più e comodi menu a tendina, tale pagina consente un controllo raffinato delle opzioni di ricerca e l'impostazione di ricerche anche assai complesse. Nei campi attivi, a scelta dell'utente, occorre solo digitare il termine o i termini della ricerca; il software è predisposto per attivare le procedure di ricerca booleana. Per operare con maggiore precisione, è consigliabile leggere attentamente le opzioni della maschera.

12 La Google Toolbar Nell'analisi delle funzionalità di Google una menzione particolare merita infine la Google toolbar, plug-in disponibile per Internet Explorer (versione 5 o successiva). < Una volta installata, la toolbar compare come barra aggiuntiva nella porzione superiore della finestra di Explorer. Le funzionalità offerte sono in effetti assai utili: oltre alla disponibilità in ogni momento di una casella di ricerca su Google (con la possibilità di ricercare non solo pagine web ma anche immagini, notizie, quotazioni di borsa, la Open Directory, i newsgroup e un dizionario inglese), la Google toolbar permette di visualizzare, attraverso una piccola barra verde, il Page Rank, un indice di attendibilità della pagina comunque interessante, di tradurla ( comunque traduzioni poco attendibili),di svolgere ricerche all'interno della pagina o del sito , di ricercare automaticamente pagine simili, e infine (assai utile nel caso di pagine un po' lunghe e complesse) di evidenziare automaticamente all'interno della pagina le parole cercate. Le funzioni non gradite, tuttavia, possono essere facilmente disattivate dal menu 'Opzioni' della toolbar. La Google Toolbar Nell'analisi delle funzionalità di Google una menzione particolare merita infine la Google toolbar, plug-in disponibile per Internet Explorer (versione 5 o successiva). < Una volta installata, la toolbar compare come barra aggiuntiva nella porzione superiore della finestra di Explorer. Le funzionalità offerte sono in effetti assai utili: oltre alla disponibilità in ogni momento di una casella di ricerca su Google (con la possibilità di ricercare non solo pagine web ma anche immagini, notizie, quotazioni di borsa, la Open Directory, i newsgroup e un dizionario inglese), la Google toolbar permette di visualizzare, attraverso una piccola barra verde, il Page Rank, un indice di attendibilità della pagina comunque interessante, di tradurla ( comunque traduzioni poco attendibili),di svolgere ricerche all'interno della pagina o del sito , di ricercare automaticamente pagine simili, e infine (assai utile nel caso di pagine un po' lunghe e complesse) di evidenziare automaticamente all'interno della pagina le parole cercate. Le funzioni non gradite, tuttavia, possono essere facilmente disattivate dal menu 'Opzioni' della toolbar.

13 Altavista Altavista è il risultato di un progetto di ricerca iniziato nell'estate del 1995 nei laboratori di Palo Alto della Digital, azienda storica del mondo dell'informatica, e prima dell'avvento di Google, dal 1997 al 1999, è stato leader tra i motori di ricerca. Anche se attualmente ha perduto diverse posizioni, non per la qualità della sua struttura, ma per vicende connesse al mercato, continua comunque ad essere tra i più grandi con un indice analitico di oltre 550 milioni di pagine web (marzo 2001). Possiede una funzionalità di ricerca multilingue che si avvale del software di traduzione Babel Fish, prodotto dalla stessa azienda; il servizio, che è stato il primo di questo genere in rete, può tradurre parole, espressioni e siti interi. Tuttavia, le traduzioni automatiche lasciano ancora molto a desiderare. < > I risultati includono il titotlo della pagina, una descrizione,la data e le opzioni per visualizzare altre pagine dello stesso sito o per tradurre le informazioni. La versione italiana non utilizza l'intero database della versione americana che resta, quindi, preferibile, anche perchè tanti siti italiani sono registrati come ".com". I risultati sono classificati in base alla pertinenza all'interrogazione. Anche Altavista presenta una Toolbar. Altavista Altavista è il risultato di un progetto di ricerca iniziato nell'estate del 1995 nei laboratori di Palo Alto della Digital, azienda storica del mondo dell'informatica, e prima dell'avvento di Google, dal 1997 al 1999, è stato leader tra i motori di ricerca. Anche se attualmente ha perduto diverse posizioni, non per la qualità della sua struttura, ma per vicende connesse al mercato, continua comunque ad essere tra i più grandi con un indice analitico di oltre 550 milioni di pagine web (marzo 2001). Possiede una funzionalità di ricerca multilingue che si avvale del software di traduzione Babel Fish, prodotto dalla stessa azienda; il servizio, che è stato il primo di questo genere in rete, può tradurre parole, espressioni e siti interi. Tuttavia, le traduzioni automatiche lasciano ancora molto a desiderare. < > I risultati includono il titotlo della pagina, una descrizione,la data e le opzioni per visualizzare altre pagine dello stesso sito o per tradurre le informazioni. La versione italiana non utilizza l'intero database della versione americana che resta, quindi, preferibile, anche perchè tanti siti italiani sono registrati come ".com". I risultati sono classificati in base alla pertinenza all'interrogazione. Anche Altavista presenta una Toolbar.

14 Ricerca per directory Yahoo! Ricerca per directory
Contrariamente ai motori di ricerca, gli indici sistematici (directory) sono creati e gestiti da persone umane. Chi crea un sito deve segnalarlo e un gruppo di redattori provvede ad inserirlo nella categoria appropriata. L'utente ha a disposizione un'interfaccia costituita da un lungo elenco di argomenti cliccabili (le categorie) fra cui può navigare. La caratteristica più evidente degli indici sistematici è che le pagine sono valutate e catalogate da redattori e non scaricate in un elenco da un programma. Questo comporta da un lato dei vantaggi, ma il fatto che Internet stia crescendo in maniera vertiginosa pone molti problemi ai redattori subissati da un numero esorbitante di richieste. Infatti deve essere il gestore del sito (il webmaster) a segnalare il proprio sito attraverso un modulo che viene spedito alla redazione; la recensione è un lavoro lungo e molte richieste spesso non vengono neanche prese in considerazione. Per l'utilizzatore degli indici, un elemento fondamentale è la scelta delle suddivisioni interne delle varie discipline. La natura ipertestuale del Web permette di superare il problema di scelta delle categorie: infatti spesso una sottocategoria verrà classificata sotto più categorie e a tal proposito non sarà neanche necessario duplicare l'informazione, sarà sufficiente duplicare i link. Dal punto di vista dell'utente, ciò comporta che, salvo andarla a cercare sotto categorie palesemente errate, trovare una certa informazione sarà decisamente semplice: se ben compilato, l'indice sembrerà "adattarsi" alle scelte di categorizzazione dell'utente.

15 Yahoo! Yahoo!, acronimo di "Yet Another Hierarchical Officious Oracle, anche se somiglia molto ad un'espressione di giubilo, è nato nell'aprile 1994, quando due studenti di ingegneria elettronica dell'Università di Stanford, David Filo e Jerry Yang, crearono pagine riassuntive con link ai siti Internet di loro interesse. Nel corso del 1994 Yahoo! si trasformò in un vero e proprio database, ricco di migliaia di pagine indicizzate. All'inizio del 1995 Mark Andreessen, cofondatore della Netscape, percepì l'interesse dello strumento creato da Filo e Yang e si offrì di contribuire alla trasformazione della iniziativa in una impresa commerciale. Adesso è una impresa privata, quotata in borsa, finanziata fra l'altro attraverso le inserzioni pubblicitarie accolte a rotazione nelle sue pagine (Calvo, Roncaglia,2004). L'indice vero e proprio inizia sotto la linea di separazione; le voci in grassetto sono le categorie principali, quelle in carattere più piccolo sono alcune fra le loro sottocategorie. Yahoo! permette inoltre una ricerca per parole chiave che si rivela spesso il sistema più rapido per individuare la categoria cercata; infatti, a differenza di quanto avviene nel caso dei motori di ricerca per termini, questa ricerca non riguarda il testo integrale delle pagine web, ma solo il database interno di Yahoo!. Questa funzione permette di individuare, più che le singole risorse informative, le specifiche categorie. Se però il termine ricercato con questa modalità non compare all'interno delle voci del database di Yahoo!, esso viene "inviato" ad un vero motore di ricerca per termini. La sua funzione di indice sistematico di risorse è stata progressivamente affiancata da una miriade di funzionalità aggiuntive: uno dei maggiori servizi per la gestione via web di indirizzi gratuiti (Yahoo! Mail) una delle maggiori raccolte di pagine personali (Yahoo! GeoCities), la gestione di comunità web (Yahoo! Groups) il servizio di instant messaging (Yahoo! Messenger), collegato a una delle chat più vaste, articolate e frequentate della rete (Yahoo! Chat). Yahoo! permette, inoltre, una ricerca per parole chiave che - a patto di saperne interpretare i risultati - si rivela spesso il sistema più rapido per individuare la categoria cercata. Yahoo! Yahoo!, acronimo di "Yet Another Hierarchical Officious Oracle, anche se somiglia molto ad un'espressione di giubilo, è nato nell'aprile 1994, quando due studenti di ingegneria elettronica dell'Università di Stanford, David Filo e Jerry Yang, crearono pagine riassuntive con link ai siti Internet di loro interesse. Nel corso del 1994 Yahoo! si trasformò in un vero e proprio database, ricco di migliaia di pagine indicizzate. All'inizio del 1995 Mark Andreessen, cofondatore della Netscape, percepì l'interesse dello strumento creato da Filo e Yang e si offrì di contribuire alla trasformazione della iniziativa in una impresa commerciale. Adesso è una impresa privata, quotata in borsa, finanziata fra l'altro attraverso le inserzioni pubblicitarie accolte a rotazione nelle sue pagine (Calvo, Roncaglia,2004). L'indice vero e proprio inizia sotto la linea di separazione; le voci in grassetto sono le categorie principali, quelle in carattere più piccolo sono alcune fra le loro sottocategorie. Yahoo! permette inoltre una ricerca per parole chiave che si rivela spesso il sistema più rapido per individuare la categoria cercata; infatti, a differenza di quanto avviene nel caso dei motori di ricerca per termini, questa ricerca non riguarda il testo integrale delle pagine web, ma solo il database interno di Yahoo!. Questa funzione permette di individuare, più che le singole risorse informative, le specifiche categorie. Se però il termine ricercato con questa modalità non compare all'interno delle voci del database di Yahoo!, esso viene "inviato" ad un vero motore di ricerca per termini. La sua funzione di indice sistematico di risorse è stata progressivamente affiancata da una miriade di funzionalità aggiuntive: uno dei maggiori servizi per la gestione via web di indirizzi gratuiti (Yahoo! Mail) una delle maggiori raccolte di pagine personali (Yahoo! GeoCities), la gestione di comunità web (Yahoo! Groups) il servizio di instant messaging (Yahoo! Messenger), collegato a una delle chat più vaste, articolate e frequentate della rete (Yahoo! Chat). Yahoo! permette, inoltre, una ricerca per parole chiave che - a patto di saperne interpretare i risultati - si rivela spesso il sistema più rapido per individuare la categoria cercata.

16 Metamotori Metacrawler Dogpile Metamotori
Per cercare le informazioni è disponibile una soluzione alternativa ai motori di ricerca: i metamotori, motore che interroga sequenzialmente vari motori di ricerca ed indici. Il principio di base è semplice: si inseriscono le parole chiave corrispondenti alla ricerca ed il metamotore invia la richiesta ai vari motori cui è connesso. L'operazione è consigliata per ricerche complesse e consente di avere un elenco di potenti strumenti a portata di mano. I metamotori usano la potenza di molti motori di ricerca senza richiedere l'intervento dell'utente; la differenza tra i metamotori consiste nella scelta del motore di ricerca e della valutazione dei risultati che vengono visualizzati. Le metaricerche consistono, quindi, nell'inviare in maniera sequenziale o contemporaneamente, a più motori il termine o i termini digitati. Questa procedura è analoga a quella di consultazione di più motori da parte dell'utente; in termini di risultati non cambia di molto, mentre il suo valore aggiunto consiste nel recupero di tempo e nella comodità di visualizzare i risultati in un'unica pagina.

17 Metacrawler Metacrawler è un importante strumento di metaricerca della rete Lycos, che presenta i risultati in base alla pertinenza, al sito o alla provenienza. Esso estrae i risultati da un gran numero di motori, quindi li raccoglie e li presenta in un lungo elenco di corrispondenze, disposte in base alle preferenze derivanti dall'ordine dei termini da cercare immessi dall'utente. Inoltre, indica la provenienza dei risultati e fornisce una breve descrizione del sito di ciascun fornitore di ricerca che ha restituito una corrispondenza. È disponibile anche un collegamento ad altri fornitori di ricerche. La funzione View Related indica altre possibili corrispondenze e consente di restringere la ricerca a vari tipi di formati. MiniCrawler è una piccola finestra di desktop; MetaSpy mostra le interrogazioni di altri utenti. Metacrawler Metacrawler è un importante strumento di metaricerca della rete Lycos, che presenta i risultati in base alla pertinenza, al sito o alla provenienza. Esso estrae i risultati da un gran numero di motori, quindi li raccoglie e li presenta in un lungo elenco di corrispondenze, disposte in base alle preferenze derivanti dall'ordine dei termini da cercare immessi dall'utente. Inoltre, indica la provenienza dei risultati e fornisce una breve descrizione del sito di ciascun fornitore di ricerca che ha restituito una corrispondenza. È disponibile anche un collegamento ad altri fornitori di ricerche. La funzione View Related indica altre possibili corrispondenze e consente di restringere la ricerca a vari tipi di formati. MiniCrawler è una piccola finestra di desktop; MetaSpy mostra le interrogazioni di altri utenti.

18 Dogpile Dogpile è un motore di metaricerca molto diffuso; può accedere a numerose fonti di informazione, tra cui listini di Borsa, pagine gialle, previsioni del tempo. Esso presenta i risultati raggruppati in base ai singoli fornitori di ricerche; anzichè interrogare simultaneamente tutti i fornitori di ricerche, Dogpile presenta l'interrogazione a una selezione di fornitori per volta. La funzione di ricerca avanzata consente di determinare l'ordine in cui queste fonti vengono interrogate e di rimuovere dall'elenco delle metaricerche fonti non pertinenti. Scegliendo il pulsante di opzione appropiato sotto la casella di ricerca, può essere specificata un'area precisa; dopo la lettura delle corrispondenze trovate, è possibile impartire al metamotore il comando di interrogare altri fornitori di ricerche, cliccando su Next Set of Search Engines in fondo alla pagina. Dogpile Dogpile è un motore di metaricerca molto diffuso; può accedere a numerose fonti di informazione, tra cui listini di Borsa, pagine gialle, previsioni del tempo. Esso presenta i risultati raggruppati in base ai singoli fornitori di ricerche; anzichè interrogare simultaneamente tutti i fornitori di ricerche, Dogpile presenta l'interrogazione a una selezione di fornitori per volta. La funzione di ricerca avanzata consente di determinare l'ordine in cui queste fonti vengono interrogate e di rimuovere dall'elenco delle metaricerche fonti non pertinenti. Scegliendo il pulsante di opzione appropiato sotto la casella di ricerca, può essere specificata un'area precisa; dopo la lettura delle corrispondenze trovate, è possibile impartire al metamotore il comando di interrogare altri fornitori di ricerche, cliccando su Next Set of Search Engines in fondo alla pagina.

19 Funzionamento Interfaccia Spider e crawling Ricerca semplice Keywords
Ricerca avanzata Spider e crawling Keywords Stringhe Funzionamento L'utente si orienta nel web grazie a due cose: la sua esperienza di navigazione e la capacità di evocazione che possono avere parole o espressioni chiave. L'esperienza è un aspetto molto importante di cui tutti ci serviamo, impariamo che determinati contenuti si possono reperire sotto determinati portali, che l'aspetto di un sito può dirci qualche cosa sul genere (formale o informale) delle informazioni; tuttavia, è una cosa che viene spontaneamente da sé, ma non è molto legata ad aspetti tecnici, al codice e alle applicazioni che costituiscono un sito. L'altro aspetto, quello delle parole chiave, è più legato al codice. La capacità espressiva di un collegamento automatico dipende dalla applicazione che lo gestisce. Cercando in un motore di ricerca, un utente inserisce una parola o un'espressione atta ad individuare nel modo più efficace possibile il contenuto cercato; oppure, scegliendo tra le voci di una barra di navigazione, dovrà stabilire quale espressione si adatti meglio, come titolo generico, ad individuare l'oggetto della ricerca. Nel primo caso l'efficacia dell'operazione dipende dagli algoritmi che il motore di ricerca utilizza per estrarre contenuti. Nel secondo caso l'efficacia dipende da chi ha pensato i contenuti del sito e se quei contenuti si prestano ad essere indicizzati secondo una gerarchia ad albero. In entrambe le situazioni l'utente si affida ad una espressione unica che ha un rapporto molto generico col contenuto effettivamente ricercato. Nel caso del motore di ricerca qualsiasi query (la parola o l'insieme logico delle parole introdotte per la ricerca) attivata è sempre soggetta al rischio dell' ambiguità. Nel caso di una barra di navigazione, la genericità è data dal tipico meccanismo dell'indice, che sotto un unico titolo deve raccogliere un gruppo spesso vario di contenuti. Quindi, se ne può dedurre che Internet è un insieme di testi collegati tra loro, ma spesso questi collegamenti sono deboli, perchè troppo generici. I collegamenti legati al funzionamento di un codice di programmazione sono piuttosto solidi: infatti, un link localizza una risorsa attraverso un URL univoco. Sono vaghi, invece, quelli legati alla capacità di descrivere il significato di un collegamento. I motori , strumenti orientati ad ottenere risultati non ragionati, sperimentano tecniche di matching (corrispondenze) per attribuire una percentuale di affidabilità a ciascuna delle risorse che confluiscono nel database, rispetto alle presunte intenzioni della ricerca originaria; tale meccanismo, però, non risolve i problemi di pertinenza e non aiuta a capire se l'informazione che denota una percentuale di matching più alta rispetto alla query è utile o meno allo scopo della ricerca.

20 Interfaccia Ricerca semplice Ricerca avanzata Ricerca di immagini
L'interfaccia è lo stumento del software di dialogo con l'utente, più è semplice, immediata, intuitiva, maggiormente raggiunge il suo scopo. Un' interfaccia articolata può essere accattivante, ma non sempre utile, soprattutto se non tiene conto che in rete navigano utenti di vario tipo, età, competenza. Talvolta, i numerosi elementi presenti, molti dei quali animati, attraggono forzatamente l’attenzione e finiscono con il disturbare chi sia interessato alla sola ricerca. E’ un effetto chiaramente voluto, ma che alle volte viene realizzato anche con l’intento di ingannare gli utenti, visualizzando immagini che sembrano messaggi di avvertimento del computer e che inducono gli utenti a selezionare pulsanti che svolgono invece tutt’altra attività, magari collegandoli a siti del tutto estranei ai loro interessi. Inoltre, il caricamento di pagine così complesse è molto più lento, cosa che contribuisce a scoraggiare gli utenti e a ridurre il numero dei contatti. La maschera della ricerca semplice presenta un campo in bianco, di adeguate dimensioni, che serve per digitare i termini per la ricerca, (se si cerca una singola parola basta scriverla, se, invece, le parole sono più di una è necessario rispettare una serie di regole per inserirle nel modo giusto; la logica generale è sempre la stessa, ma la sintassi in cui esprimerla può essere leggermente diversa da motore a motore), il tasto per avviare la ricerca stessa e, in molti motori di ricerca, il menù per la scelta del linguaggio.

21 Ricerca semplice Ricerca avanzata Ricerca di immagini Ricerca semplice
Nonostante alcune somiglianze, i motori differiscono nel modo in cui raccolgono, gestiscono e forniscono l'informazione. se si desidera eseguire solo una ricerca semplice, l'interrogazione può essere immessa nella casella di ricerca standard, dando comunque, risultati precisi. La prima regola è basata sul buon senso: se una ricerca non è riusita, occorre riprovare, trovando l'errore e correggendolo. Ci si può avvalere di una prima ricerca per raccogliere informazioni sufficienti a costruire una seconda ricerca, analizzando ciò che si deve escludere. Evitare termini vaghi I termini generici o comuni producono molto "rumore": occorre uysare parole mirate e specifiche. Corrispondenze non pertinenti Le occorrenze trovate sono numericamente elevate, ma nessuna pagina è pertinente. La ricerca va ristretta e circoscritta. Termini correlati Solitamente una prima ricerca approssimativa può essere utile per fornire una nuova visione per un secondo tentativo. Si potrebbe ricorre a sinonimi come termini da cercare, oppure all'aggiunta di nuovi termini a quello iniziale.

22 Ricerca avanzata Ricerca di immagini Ricerca avanzata
Le ricerche semplici possono risultare adeguate per le interrogazioni semplici; è comunque possibile aumentare le probabilità di trovare ciò che si cerca nel web eseguendo ricerche più mirate e specifiche. La maggior parte dei servizi offerti dalla rete consente di effettuarle, ma forniscono queste funzionalità in modo diverso. Capire come eseguire sofisticate ricerche di informazioni on-line, permetterà di avere molte più possibilità di trovare ciò che si vuole. La maggior parte dei motori di ricerca consente di definire i criteri di ricerca in modi molto specifici, ma non funzionano tutti nello stesso modo. Riconoscimento delle lettere maiuscole. Per impostazione predefinita i motori applicano l'interrogazione sia ai caratteri minuscoli che maiuscoli. Se una parola chiave ricercata è maiuscola, un motore di ricerca che riconosce i caratteri maiuscoli, segnalerà soltanto documenti contenenti la parola maiuscola, restringendo il numero dei risultati ottenuti ed eliminando i documenti che riguardano altri contenuti Tuttavia, se le parole vengono lasciate in minuscolo,si può consentire al motore di ricerca di segnalare risultati di documenti contenenti le parole chiave nell’una o nell’altra forma. Ricerca per frase Quando si utilizzano termini di ricerca contenenti più di una parola in un ordine specifico, se vengono delimitati da virgolette doppie ("-"), il motore di ricerca indicherà solamente i documenti contenenti tutte le parole come espressione unica e nell’ordine specificato. Troncamento Volendo ricercare informazioni su termini che si presume possano avere risultati limitati, oppure, semplicemente per ampliare la ricerca per avere maggiori risultati, si può utilizzare una parte della radice della parola ed abbreviarla con l’asterisco (*). Il motore di ricerca segnalerebbe link a documenti contenenti la parola con tutte le sue possibili derivazioni. L'asterisco Molti motori consentono di utilizzare l'asterisco (*) come carattere jolly in una ricerca. Questo è utile se il termine cercato prevede varianti ortografiche. Ad esempio: ni*el*= nickel e nichelio Verranno altresì restituite le corrispondenze per la forma plurale, anche se la maggior parte dei motori la prevede automaticamente. Ricerca di titoli Il titolo di una pagina web è determina dalle parole comprese tra i tag <TITLE> </TITLE> nel codice; esse appaioni sulla barra del titolo, nella parte superiore della finestra del browser. Per cercare pagine web in base al titolo, con i motori che dispongono di tale opzione, la sintassi è la seguente: title: termine cercato Ricerca di collegamenti Una ricerca di collegamenti trova tutte le pagine web contenenti link alla pagina specificata. La sintassi della ricerca è: link: paginaWeb.com Quasi tutti i motori offrono una seconda maschera di ricerca avanzata, dove è possibile specificare vari parametri per affinare l’analisi della rete e rendere più selettivi i risultati.

23 Ricerca di immagini L'informazione presente su internet non è solo testuale; componente essenziale dei file sono i contenuti multimediali. La maggior parte dei principali motori di ricerca ha la capacità di svolgere ricerche specifiche anche sulle immagini e per accedere a questa funzione basta clikkare sull'apposito link presente nella pagina principale. Successivamente, i termini di ricerca inseriti vanno riferiti per cercare nomi, descrizioni o testo di contorno relativi alle immagini richieste. Le immagini vengono catalogate attraverso questi valori testuali che, se scelti con cura, facilitano il loro recupero. Ai fini della ricerca è importante, quindi, che chi realizza pagine web, oltre ad attribuire titoli appropriati alle pagine, scelga accuratamente anche il testo descrittivo delle immagini. Ricerca di immagini L'informazione presente su internet non è solo testuale; componente essenziale dei file sono i contenuti multimediali. La maggior parte dei principali motori di ricerca ha la capacità di svolgere ricerche specifiche anche sulle immagini e per accedere a questa funzione basta clikkare sull'apposito link presente nella pagina principale. Successivamente, i termini di ricerca inseriti vanno riferiti per cercare nomi, descrizioni o testo di contorno relativi alle immagini richieste. Le immagini vengono catalogate attraverso questi valori testuali che, se scelti con cura, facilitano il loro recupero. Ai fini della ricerca è importante, quindi, che chi realizza pagine web, oltre ad attribuire titoli appropriati alle pagine, scelga accuratamente anche il testo descrittivo delle immagini.

24 Spider e crawling Keywords Stringhe Spider e crawling
Un motore di ricerca è costituito da molti componenti; una funzione speciale è attribuita agli "spider" o "crawler", incaricati di connettere il motore con il server web, visitare siti, leggere pagine e seguire collegamenti su queste pagine all'interno del sito. Tutto ciò che lo spider (ragno) trova, verrà utilizzato per compilare l'indice; le tecniche più avanzate vengono utilizzate per progettare gli indici dei siti e delle pagine web. L'indice viene aggiornato regolarmente, aggiungendo, eliminando o modificando le relative voci; il motore analizza una richiesta facendo riferimento all'indice e in base a questo prepara i risultati, che all'utente vengono presentati in ordine di importanza. Tenendo presente la difficoltà di tale operazione, nessun motor può affermare di essere esauriente, offrire il meglio o essere imfallibile nei risultati trasmessi. Ciò che viene richiesto è velocità e attendibilità delle informazioni; la prestazione varia da sistema a sistema e dipende dalla natura della ricerca da effettuare; ciascun sistema possiede punti forti e deboli. In generale, ciascun motore offre: ricerche semplici per mezzo di parole chiave. ricerche avanzate utilizzando gli operatori booleani e comandi specifici. ricerche per argomento e categorie di siti. Il grado di importanza dei risultati inviati viene stabilito adottando il metodo posizione/frequenza dei link che gli spider trovano nel documento o sito.

25 Keywords Per Keywords si intendono le singole parole o le frasi composte da 2-4 termini, definite in base al contenuto del documento da ricercare ed efficaci in termini di risultati e accessi qualificati. Da parte del browser, sono parole, espressioni o codici caratteristici memorizzati in un campo chiave ed impiegati per condurre operazioni di ordinamento o ricerca sui record di un data base. Molto spesso, il risultato di una ricerca è affidata proprio alla pertinenza e alla capacità evocativa delle parole inserite: più identificano l'oggetto cercato, più alta è la probabilità di reperire proprio ciò che si cerca. Keywords Per Keywords si intendono le singole parole o le frasi composte da 2-4 termini, definite in base al contenuto del documento da ricercare ed efficaci in termini di risultati e accessi qualificati. Da parte del browser, sono parole, espressioni o codici caratteristici memorizzati in un campo chiave ed impiegati per condurre operazioni di ordinamento o ricerca sui record di un data base. Molto spesso, il risultato di una ricerca è affidata proprio alla pertinenza e alla capacità evocativa delle parole inserite: più identificano l'oggetto cercato, più alta è la probabilità di reperire proprio ciò che si cerca.

26 Stringhe La ricerca per frase, o, più propriamente, la ricerca su stringa di caratteri, è ancor più restrittiva e selettiva della ricerca in AND: anziché offrirci tutte le pagine in cui compaiono i termini cercati, restituisce tutte le pagine in cui i termini cercati compaiono uno di seguito all'altro, nello specifico ordine indicato. In generale, la ricerca per frase è assai comoda quando si ha a che fare con nomi e cognomi (attenzione però, soprattutto nel caso dei nomi anglosassoni, alle eventuali iniziali intermedie). La si può svolgere anche attraverso la pagina della ricerca di base, avendo l'accortezza di includere fra apici doppi ("...") la stringa di caratteri sulla quale si conduce la ricerca. Stringhe La ricerca per frase, o, più propriamente, la ricerca su stringa di caratteri, è ancor più restrittiva e selettiva della ricerca in AND: anziché offrirci tutte le pagine in cui compaiono i termini cercati, restituisce tutte le pagine in cui i termini cercati compaiono uno di seguito all'altro, nello specifico ordine indicato. In generale, la ricerca per frase è assai comoda quando si ha a che fare con nomi e cognomi (attenzione però, soprattutto nel caso dei nomi anglosassoni, alle eventuali iniziali intermedie). La si può svolgere anche attraverso la pagina della ricerca di base, avendo l'accortezza di includere fra apici doppi ("...") la stringa di caratteri sulla quale si conduce la ricerca.

27 Struttura codice HTML Codici di marcatura Web semantico Metatag
Web usability Netiquette Web semantico XML Il Dublin core Struttura codice HTML Il Web costituisce la parte multimediale e mondialmente nota di Internet ed è una raccolta di pagine o documenti multimediali collegati tra loro dalla rete, redatti con l'utilizzo di uno specifico linguaggio, quale l'HTML (acronimo di HyperText Markup Language, arrivato attualmente alla versione 4.01), riconosciuto da calcolatori di costruttori diversi (Es. Microsoft, Apple, Sun ...), che permette di creare pagine che contengono testo, suono, immagini fisse e animate e collegamenti ad altre pagine. L’HTML, come sappiamo, non è un vero linguaggio di programmazione ma solo di marcatura; tuttavia, le sue strutture dati, essendo derivate dall’SGML (Standard Generalized Markup Language), sono molto simili a quelle del paradigma ad oggetti. In pratica, ogni nodo di HTML descrive un reale oggetto di programmazione con un tipo che è il nome del tag, delle proprietà dell’oggetto che corrispondono alle proprietà dell’html e dei metodi che sono il funzionamento dello stesso. La struttura di un documento HTML viene definita attraverso i tag, istruzioni poste tra parentesi angolari ("<", ">"), che costituiscono le parole chiave del linguaggio. Le istruzioni vengono, quindi, interpretate dal browser che provvede successivamente alla visualizzazione del risultato. Le istruzioni HTML racchiudono le specifiche del documento tra due tag, uno iniziale, <comando> e uno finale </comando>; la fine dell'istruzione è indicata pertanto dal carattere "/" prima della parola chiave. Prima di procedere alla compilazione delle singole pagine HTML è utile predisporre uno schema dell'applicazione che si intende realizzare, che, in genere, è costituita da più pagine contenenti testo, immagini, grafica, suoni. Il punto di avvio dell'applicazione, l' Home page, sarà quindi la prima pagina da visualizzare per l'utente; dall'home page, utilizzando i vari link definiti con l' HTML, si possono visitare le altre pagine. Le caratteristiche della pagina HTML possono essere così schematizzate: Una pagina HTML è un ipertesto multimediale. Un ipertesto è un testo contenente link cioè collegamenti ad altri testi. Testo è tutto quanto può essere inglobato in un documento: è il testo nell'accezione comune, ma anche un immagine, un suono, un movie.....da qui la definizione di multimediale. Un link è un collegamento logico ad un altro testo. Una pagina html contiene, quindi, testo puro e parole chiave che costituiscono richiami ad altro testo (link), immagini pure ed immagini che rappresentano anch'esse dei link, oppure immagini cliccabili, che rimandano cioè a testi differenti a seconda delle coordinate del punto in cui vengono selezionate.

28 Codici di marcatura Metatag Web usability Netiquette
Le due sezioni principali di un documento HTML sono HEAD e BODY. Un documento HTML di tipo testo,quindi, inizia con un tag <HTML> e termina con il corrispondente </HTML>, che identifica agli occhi del browser il documento con tale codice. Nidificati nel tag precedente sono presenti due costrutti definiti dai tag <HEAD> </HEAD> e <BODY> </BODY> che contengono a loro volta gli altri tag possibili. <HTML> <HEAD> </HEAD> <BODY> </BODY> </HTML> I documenti scritti in HTML 4.0 includono, nella parte superiore el documento, anche informazioni relative alla versione del linguaggio: <!DOCTYPE HTML PUBLIC " - //W3C//DTD HTML 4.0//EN" "http://www.w3.org/TR/REC - html40/loose.dtd"> La versione rigorosa di HTML 4.0 (strict) è conforme a tutte le regole fissate dal W3C (World Wide Web Consortium), organismo di controllo dei documenti web, che offre sistemi di convalida del codice e dei fogli di stile (CSS) all'indirizzo < > Il software di scrittura può essere un editor di file Ascii (ad es il Notepad di Windows) oppure un programma di gestione testi che consenta di salvare i documenti in formato testo (ad es Word). Meglio ancora è utilizzare un editor HTML apposito che consenta l'inserimento dei tag nel testo in modo agevolato (ad esempio HTML Assistant o HotDog).. Le specifiche di testa (comprese nel tag HEAD), contengono informazioni riguardanti il contenuto del corpo della pagina. Il tag Title nidificato nel tag HEAD, comprende, ad esempio, il titolo del documento così come verrà visualizzato nella barra del titolo della finestra del browser. <TITLE> tag di intestazione</TITLE>

29 Metatag Nei documenti HTML o XML vengono inseriti dei marcatori definiti Metatag che consentono al creatore della pagina web di includere informazioni quali il nome dell'autore, le parole chiave che identificano il contenuto e dettagli descrittivi ( ad esempio oggetti non di testo sulla pagina). Le informazioni contrassegnate con i metatag non appaiono sulla pagina web quando l'utente la visualizza con il browser, ma possono essere visualizzate nel codice sorgente. I metatag sono inclusi nell'intestazione di un documento e sono spesso usati per assistere i motori di ricerca nell'indicizzazione della pagina. Nel codice del documento HTML va inserito il tag <META>, seguito dall'attributo "name" e dal valore "description" accanto all'altro attributo "content" che precede una chiara descrizione della pagina da indicizzare. La descrizione può contenere un massimo di 120 caratteri. La maggior parte dei motori di ricerca possiede un proprio regolamento per garantire agli utenti il miglior servizio di indicizzazione ed i più utilizzati esplicitano in guide apposite. <HEAD> <META name="description" content=" Metodologie e tecniche dell'e-learning.La ricerca di risorse in rete."> Utilizzando i tag META per inserire parole chiave nelle pagine, si aiuteranno i motori di ricerca ad indicizzare i siti; esistono diverse regole per tale procedura, ma tutte si basano sul buon senso: Evitare di ripere le parole chiave in una situazione inappropriata Visitare regolarmente i siti web dei principali motori per conoscere con precisione i metodi usati per l'inserimento di nuovi URL nell'indice. <HEAD><META> name= "keywords" content= tecniche, metodologia, e-learning, ricerca, risorse"> Con il tag “meta” si possono specificare l’autore di una pagina, il programma con cui è stata realizzata, la data di creazione, la validità temporale e altri parametri che non vengono visualizzati a video, ma possono essere utilizzati per scopi diversi. La sintassi HTML per indicare l’autore di una pagina è la seguente: <meta name=“author” content=“Nome Cognome”> Alcuni metatag sono molto utili per la catalogazione dei siti e vengono utilizzati dai motori per l’indicizzazione. Fondamentale in questo senso è il tag che consente di definire le “parole chiave” di una pagina. Riportiamo di seguito il codice HTML che permette di specificarne tre parole chiave: <meta name="Keywords" content="scuola,educazione,apprendimento"> Metatag Nei documenti HTML o XML vengono inseriti dei marcatori definiti Metatag che consentono al creatore della pagina web di includere informazioni quali il nome dell'autore, le parole chiave che identificano il contenuto e dettagli descrittivi ( ad esempio oggetti non di testo sulla pagina). Le informazioni contrassegnate con i metatag non appaiono sulla pagina web quando l'utente la visualizza con il browser, ma possono essere visualizzate nel codice sorgente. I metatag sono inclusi nell'intestazione di un documento e sono spesso usati per assistere i motori di ricerca nell'indicizzazione della pagina. Nel codice del documento HTML va inserito il tag <META>, seguito dall'attributo "name" e dal valore "description" accanto all'altro attributo "content" che precede una chiara descrizione della pagina da indicizzare. La descrizione può contenere un massimo di 120 caratteri. La maggior parte dei motori di ricerca possiede un proprio regolamento per garantire agli utenti il miglior servizio di indicizzazione ed i più utilizzati esplicitano in guide apposite. <HEAD> <META name="description" content=" Metodologie e tecniche dell'e-learning.La ricerca di risorse in rete."> Utilizzando i tag META per inserire parole chiave nelle pagine, si aiuteranno i motori di ricerca ad indicizzare i siti; esistono diverse regole per tale procedura, ma tutte si basano sul buon senso: Evitare di ripere le parole chiave in una situazione inappropriata Visitare regolarmente i siti web dei principali motori per conoscere con precisione i metodi usati per l'inserimento di nuovi URL nell'indice. <HEAD><META> name= "keywords" content= tecniche, metodologia, e-learning, ricerca, risorse"> Con il tag “meta” si possono specificare l’autore di una pagina, il programma con cui è stata realizzata, la data di creazione, la validità temporale e altri parametri che non vengono visualizzati a video, ma possono essere utilizzati per scopi diversi. La sintassi HTML per indicare l’autore di una pagina è la seguente: <meta name=“author” content=“Nome Cognome”> Alcuni metatag sono molto utili per la catalogazione dei siti e vengono utilizzati dai motori per l’indicizzazione. Fondamentale in questo senso è il tag che consente di definire le “parole chiave” di una pagina. Riportiamo di seguito il codice HTML che permette di specificarne tre parole chiave: <meta name="Keywords" content="scuola,educazione,apprendimento">

30 Web usability Netiquette Web usability
Nel 1999 da un’idea del W3C nasce il WAI (Web Accessibility Iniziative) che si occupa di produrre raccomandazioni e documenti tecnici per l’accessibilità in internet. Vengono pubblicate le linee guida del WCAG 1.0* (Web Content Accessibility Guidelines) formato da 14 principi generali per la progettazione dell’accessibilità Web con i seguenti obiettivi: assicurare una trasformazione gradevole delle pagine web; rendere i contenuti comprensibili e navigabili. Ognuna delle 14 raccomandazioni si articola attraverso una serie di punti di controllo che rappresentano delle situazioni concrete utili come esempio per lo sviluppo di pagine web. Non tutti i checkpoint hanno la stessa importanza ma si distinguono in tre livelli di priorità: Priorità 1 : lo sviluppatore di contenuti web deve conformarsi al presente punto di controllo. Non soddisfarlo implica che alcuni utenti non saranno in grado di accedere ai contenuti delle pagine web. Priorità 2 : lo sviluppatore di contenuti web dovrebbe conformarsi a questo punto di controllo. Contrariamente alcuni utenti troveranno difficile accedere ai contenuti. Priorità 3 : lo sviluppatore di contenuti web può soddisfare o no questo punto di controllo. Conformarsi ai requisiti richiesti dalla priorità 3 migliora, ma non determina, l’accessibilità ai contenuti web. LINEA GUIDA 1. Fornire alternative equivalenti al contenuto audio e visivo. LINEA GUIDA 2. Non fare affidamento unicamente sul colore LINEA GUIDA 3. Usare marcatori e fogli di stile e farlo in modo appropriato LINEA GUIDA 4. Chiarire l’uso di linguaggi naturali LINEA GUIDA 5. Creare tabelle che si trasformino in maniera elegante LINEA GUIDA 6. Assicurarsi che le pagine che danno spazio a nuove tecnologie si trasformino in maniera elegante LINEA GUIDA 7. Assicurarsi che l’utente possa tenere sotto controllo i cambiamenti di contenuto nel corso del tempo LINEA GUIDA 8. Assicurare l’accessibilità diretta delle interfacce utente incorporate LINEA GUIDA 9. Progettare per garantire l’indipendenza da dispositivo LINEA GUIDA 10. Usare soluzioni provvisorie LINEA GUIDA 11. Usare le tecnologie e le raccomandazioni del W3C LINEA GUIDA 12. Fornire informazione per la contestualizzazione e l’orientamento. LINEA GUIDA 13. Fornire chiari meccanismi di navigazione LINEA GUIDA 14. Assicurarsi che i documenti siano chiari e semplici.

31 Netiquette La facilita' con la quale oggi e' possibile collegarsi ad Internet ha comportato, accanto al dato positivo della accessibilita' ai piu' svariati tipi di informazioni da parte di un sempre maggior numero di persone, un effetto negativo. I nuovi utenti, infatti, spesso non vengono addestrati opportunamente ad un uso corretto delle risorse di rete. La facilita' con la quale oggi e' possibile collegarsi ad Internet ha comportato, accanto al dato positivo della accessibilita' ai piu' svariati tipi di informazioni da parte un sempre maggior numero di persone, un effetto negativo. I nuovi utenti infatti spesso non vengono addestrati opportunamente ad un uso corretto delle risorse di rete. Il trasferimento di file FTP (File Transfer Protocol) in ambito Internet avviene spesso con la cosiddetta modalita' anonima. Cio' significa che quando ci si collega ad una banca dati che funge da Server FTP, alla richiesta di immissione della login si deve digitare la parola anonymous o, in alternativa, ftp e alla richiesta di immissione della password si deve digitare il proprio indirizzo completo di posta elettronica ( address). Non esistono regole e norme specifiche per la preparazione dei documenti www, esistono comunque alcune avvertenze: le pagine devono essere prodotte in linguaggio HTML di cui esistono varie specifiche; è bene che l'estensore del documento indichi secondo quale specifica e' stato preparato il testo e su quale browser e' stato testato. la maggior parte degli utilizzatori si connette alla rete via modem e la trasmissione e' piuttosto lenta; e' opportuno che le singole pagine siano rapidamente caricabili, intuitive, di facile e piacevole consultazione, con un buon bilanciamento tra parte grafica e scritta. è bene che le pagine non siano troppo lunghe; si puo' spezzare un documento in piu' capitoli, creando all'inizio un indice dal quale si possono raggiungere le varie sezioni del documento stesso. è importante pianificare l'organizzazione dei documenti che si vogliono creare per non costringere gli utenti ad una laboriosa ricerca delle parti di specifico interesse. la creazione di un sito web basa la sua riuscita sulla Home Page, che rappresenta la propria presentazione al mondo esterno: e' necessario che essa sia sintetica ma informativa. un documento HTML dovrebbe: Possedere un titolo informativo sulla sua natura. Essere lungo da 1 a 4 pagine di formato A4. Contenere dei collegamenti con il documento precedente, con quello seguente, con l'indice generale e con la home page. Contenere delle indicazioni riguardanti l'autore del documento stesso e sul come contattarlo, la data dell'ultimo aggiornamento della pagina, eventuali copyright. Un'ottima fonte che spiega come preparare un documento HTML si trova collegandosi a Netiquette La facilita' con la quale oggi e' possibile collegarsi ad Internet ha comportato, accanto al dato positivo della accessibilita' ai piu' svariati tipi di informazioni da parte di un sempre maggior numero di persone, un effetto negativo. I nuovi utenti, infatti, spesso non vengono addestrati opportunamente ad un uso corretto delle risorse di rete. La facilita' con la quale oggi e' possibile collegarsi ad Internet ha comportato, accanto al dato positivo della accessibilita' ai piu' svariati tipi di informazioni da parte un sempre maggior numero di persone, un effetto negativo. I nuovi utenti infatti spesso non vengono addestrati opportunamente ad un uso corretto delle risorse di rete. Il trasferimento di file FTP (File Transfer Protocol) in ambito Internet avviene spesso con la cosiddetta modalita' anonima. Cio' significa che quando ci si collega ad una banca dati che funge da Server FTP, alla richiesta di immissione della login si deve digitare la parola anonymous o, in alternativa, ftp e alla richiesta di immissione della password si deve digitare il proprio indirizzo completo di posta elettronica ( address). Non esistono regole e norme specifiche per la preparazione dei documenti www, esistono comunque alcune avvertenze: le pagine devono essere prodotte in linguaggio HTML di cui esistono varie specifiche; è bene che l'estensore del documento indichi secondo quale specifica e' stato preparato il testo e su quale browser e' stato testato. la maggior parte degli utilizzatori si connette alla rete via modem e la trasmissione e' piuttosto lenta; e' opportuno che le singole pagine siano rapidamente caricabili, intuitive, di facile e piacevole consultazione, con un buon bilanciamento tra parte grafica e scritta. è bene che le pagine non siano troppo lunghe; si puo' spezzare un documento in piu' capitoli, creando all'inizio un indice dal quale si possono raggiungere le varie sezioni del documento stesso. è importante pianificare l'organizzazione dei documenti che si vogliono creare per non costringere gli utenti ad una laboriosa ricerca delle parti di specifico interesse. la creazione di un sito web basa la sua riuscita sulla Home Page, che rappresenta la propria presentazione al mondo esterno: e' necessario che essa sia sintetica ma informativa. un documento HTML dovrebbe: Possedere un titolo informativo sulla sua natura. Essere lungo da 1 a 4 pagine di formato A4. Contenere dei collegamenti con il documento precedente, con quello seguente, con l'indice generale e con la home page. Contenere delle indicazioni riguardanti l'autore del documento stesso e sul come contattarlo, la data dell'ultimo aggiornamento della pagina, eventuali copyright. Un'ottima fonte che spiega come preparare un documento HTML si trova collegandosi a

32 Web semantico XML Il Dublin core Web semantico
Oltre a portare in un determinato luogo, un collegamento dovrebbe descrivere il luogo verso cui porta: la parola giusta per parlare di questa funzione è capacità semantica. Con il termine semantico si intende un meccanismo che sa predire la sua azione. Il termine 'Semantic Web' (http://www.semanticweb.org)è stato proposto per la prima volta nel 2001 da Tim Berners-Lee. Da allora il termine è stato associato all'idea di un web nel quale agiscano agenti intelligenti: applicazioni in grado di comprendere il significato dei testi presenti sulla rete e perciò in grado di guidare l'utente direttamente verso l'informazione ricercata, oppure di sostituirsi a lui nello svolgimento di alcune operazioni. L'idea del web semantico nasce estendendo l'idea di utilizzare schemi per descrivere domini di informazione. Un dominio deve essere descritto da un particolare schema. Dei metadati devono mappare i dati rispetto a classi o concetti di questo schema di dominio. In questo modo si potrà disporre di strutture in grado di descrivere e automatizzare i collegamenti esistenti fra i dati. Le componenti che dovranno contribuire alla costruzione del Web Semantico sono numerose, ma le principali sono: URI RDF ontologie formali e relativi linguaggi motori inferenziali deduttivi ed euristici. In un archivio bibliografico on line si può facilmente organizzare un data base nel quale inserire in tre tabelle diverse autori, articoli e libri; l'utente può cercare tra gli autori o solo quelli che hanno pubblicato articoli, oppure solo quelli che hanno pubblicato libri. In questo modo l'utente non cerca informazioni utilizzando come chiave un unico concetto (autore) e nemmeno due concetti affiancati (autore + libro), cadendo così nelle imprecisioni del motore di ricerca. L'utente può formulare una precisa relazione esistente tra un autore e il tipo della sua pubblicazione, perchè chi ha inserito informazione nel sito ha stabilito una struttura per organizzarla: da una parte ha inserito gli autori, da una parte le loro opere, dividendole in due categorie, i libri e gli articoli (Mititieri, Ridi, 1999). Il Web Semantico dovrebbe comportarsi allo stesso modo e, quindi, comporsi di tre livelli fondamentali: al livello più basso ci sono i dati, i metadati riportano tali dati ai concetti di uno schema, nello schema si inseriscono le relazioni fra i concetti, che diventano, così, classi di dati. Le classi sono utilizzate per definire dei metadati che descrivano dei testi: l'utilizzo delle ontologie permette di recuperare documenti esprimendo query complesse. Si parte da concetti semplici, ma si può raffinare la ricerca esprimendo vere e proprie proposizioni composte da un soggetto un predicato ed un oggetto. Un'indagine sugli accessi semantici negli Opac italiani

33 XML Un problema aperto per la ricerca in Internet risiede nella capacità di catalogazione. I motori di ricerca non riescono a reggere il ritmo di crescita del Web e, per quanto indicizzino un numero sempre maggiore di pagine, in rete i siti aumentano con velocità superiore. Attualmente si stima che i motori di ricerca riescano a catalogarne non più del %, situazione aggravata dal fatto che in rete sono sempre più presenti documenti che utilizzano formati diversi dall’HTML, come PDF o RTF che non tutti i motori riescono a catalogare. Spesso, anche le pagine HTML non sono stabilmente memorizzate nei server, ma vengono create dinamicamente sulla base delle specifiche richieste degli utenti, prelevando i dati da archivi che rimangono al di fuori della portata dei crawlers. A fronte di tali questioni, però, aumenta sempre più anche l’impegno per creare strumenti che consentano di sfruttare al meglio le enormi risorse della rete, come ad esempio l’XML, l’Extensible Markup Language, forma ridotta del SGML (Standard Generalized Markup Language), che fornisce una base semantica al Web. Xml (Extensible Markup Language) è un linguaggio di marcatura, definito dal W3C nell'ottobre del 1998,che permette a sua volta di costruire altri linguaggi funzionali a specifiche esigenze. L'XML consente ai progettisti e agli sviluppatori web di creare tag personalizzati, che offrono una maggiore flessibilità nell'organizzazione e presentazione di informazioni rispetto al sistema di codifica dell'HTML. Anche Xml può essere utilizzato su Internet, è di utilizzo relativamente semplice, supporta più applicazioni, e risponde a requisiti di chiarezza e comprensibilità. In particolare, Xml gode della proprietà dell'estensibilità: essa gli permette di adattarsi a piattaforme di utilizzazione diverse, dai pc ai telefonini. Xml consentirà, fra le altre cose, di descrivere semanticamente i siti web, permettendo ai motori di ricerca una identificazione "intelligente" delle risorse presenti in Internet ("Semantic web"). Si tratta di un linguaggio, quindi, che permette di definire nuovi tag che possano specificare il contenuto delle pagine, in modo che un utente può creare nuovi oggetti, inserirli nelle pagine e attribuire loro significato attraverso i tag. E’ indubbio, però, che i contributi allo sviluppo della rete non potranno venire solo dalle discipline tecnologiche, anzi, le conoscenze degli studiosi che si occupano di catalogazione, conservazione e recupero del patrimonio letterario possono rappresentare un aiuto fondamentale. L'XML è definito come standard di linguaggio pubblicato dal W3C;anche per il Web Semantico sono stati imposti subito degli standard, il più famoso dei quali è certamente RDFs, un linguaggio in sintassi XML per definire e esprimere concetti. XML Un problema aperto per la ricerca in Internet risiede nella capacità di catalogazione. I motori di ricerca non riescono a reggere il ritmo di crescita del Web e, per quanto indicizzino un numero sempre maggiore di pagine, in rete i siti aumentano con velocità superiore. Attualmente si stima che i motori di ricerca riescano a catalogarne non più del %, situazione aggravata dal fatto che in rete sono sempre più presenti documenti che utilizzano formati diversi dall’HTML, come PDF o RTF che non tutti i motori riescono a catalogare. Spesso, anche le pagine HTML non sono stabilmente memorizzate nei server, ma vengono create dinamicamente sulla base delle specifiche richieste degli utenti, prelevando i dati da archivi che rimangono al di fuori della portata dei crawlers. A fronte di tali questioni, però, aumenta sempre più anche l’impegno per creare strumenti che consentano di sfruttare al meglio le enormi risorse della rete, come ad esempio l’XML, l’Extensible Markup Language, forma ridotta del SGML (Standard Generalized Markup Language), che fornisce una base semantica al Web. Xml (Extensible Markup Language) è un linguaggio di marcatura, definito dal W3C nell'ottobre del 1998,che permette a sua volta di costruire altri linguaggi funzionali a specifiche esigenze. L'XML consente ai progettisti e agli sviluppatori web di creare tag personalizzati, che offrono una maggiore flessibilità nell'organizzazione e presentazione di informazioni rispetto al sistema di codifica dell'HTML. Anche Xml può essere utilizzato su Internet, è di utilizzo relativamente semplice, supporta più applicazioni, e risponde a requisiti di chiarezza e comprensibilità. In particolare, Xml gode della proprietà dell'estensibilità: essa gli permette di adattarsi a piattaforme di utilizzazione diverse, dai pc ai telefonini. Xml consentirà, fra le altre cose, di descrivere semanticamente i siti web, permettendo ai motori di ricerca una identificazione "intelligente" delle risorse presenti in Internet ("Semantic web"). Si tratta di un linguaggio, quindi, che permette di definire nuovi tag che possano specificare il contenuto delle pagine, in modo che un utente può creare nuovi oggetti, inserirli nelle pagine e attribuire loro significato attraverso i tag. E’ indubbio, però, che i contributi allo sviluppo della rete non potranno venire solo dalle discipline tecnologiche, anzi, le conoscenze degli studiosi che si occupano di catalogazione, conservazione e recupero del patrimonio letterario possono rappresentare un aiuto fondamentale. L'XML è definito come standard di linguaggio pubblicato dal W3C;anche per il Web Semantico sono stati imposti subito degli standard, il più famoso dei quali è certamente RDFs, un linguaggio in sintassi XML per definire e esprimere concetti.

34 Il Dublin core Un progetto di grandi aspettative è il Dublin Core Metadata, nato nel 1995 durante un convegno promosso dall'OCLC (On line Computer Library Center), grande organizzazione no-profit che si occupa di catalogazione e dell'allestimento e commercializzazione di archivi elettronici, con sede a Dublin, nell'Ohio. L'obiettivo del progetto è la definizione di uno standard che permetta la descrizione delle risorse in rete da parte degli stessi autori, in modo da garantire una autocatalogazione del documento e stabilire le premesse per realizzare indicizzazioni successive. Lo standard del Dublin Core individua 15 categorie (core) descrittive di base, di tipo bibliografico,adattabili a varie categorie di documenti. La traduzione italiana completa è sul sito AIB, < >. Ogni categoria può essere inclusa nel file HTML della risorsa catalogata nella parte dell' <head>, invisibile ai browser, ma utilizzata dai principali motori di ricerca, con il tag <Meta>, già compreso nello standard HTML. Il Dublin core Un progetto di grandi aspettative è il Dublin Core Metadata, nato nel 1995 durante un convegno promosso dall'OCLC (On line Computer Library Center), grande organizzazione no-profit che si occupa di catalogazione e dell'allestimento e commercializzazione di archivi elettronici, con sede a Dublin, nell'Ohio. L'obiettivo del progetto è la definizione di uno standard che permetta la descrizione delle risorse in rete da parte degli stessi autori, in modo da garantire una autocatalogazione del documento e stabilire le premesse per realizzare indicizzazioni successive. Lo standard del Dublin Core individua 15 categorie (core) descrittive di base, di tipo bibliografico,adattabili a varie categorie di documenti. La traduzione italiana completa è sul sito AIB, < >. Ogni categoria può essere inclusa nel file HTML della risorsa catalogata nella parte dell' <head>, invisibile ai browser, ma utilizzata dai principali motori di ricerca, con il tag <Meta>, già compreso nello standard HTML.

35 Tecniche di querying Operatori booleani Segni diacritici
Segni matematici Metodo SEWCOM Metadati Tecniche di querying L’esplorazione di database, cioè la ricerca di notizie, informazioni e documentazione su un argomento che si desidera approfondire, è l’aspetto di cui più comunemente si parla, ma non è l’unica funzione dell’internet. Sulla rete non si trovano solo "dati", ma informazioni di ogni genere e su ogni argomento, commenti, opinioni. La ricerca può avvenire in tre modi. 1. - Possiamo già conoscere l’indirizzo; 2. - Possiamo usare i link, cioè le connessioni che molti siti offrono ad altri di argomento analogo (o che, per qualsiasi motivo, il gestore del sito o l’autore di un testo considera interessanti). Il link ci permette di passare direttamente al nuovo sito quasi senza accorgercene: la nuova connessione si presenta come se fosse una pagina di quella dove eravamo. 3. - Possiamo usare uno dei molti repertori o motori di ricerca (search engine), cioè servizi che permettono una ricerca per argomento e ci forniscono gli indirizzi (e i link) ai "siti" dove quell’argomento è trattato. Oltre a cercare dati e informazioni, è possibile anche prelevare programmi. C’è una grande abbondanza di software disponibile, che in parte è freeware, cioè totalmente gratuita, in parte è shareware, cioè può essere usata per un "periodo di prova" dopo il quale chi ne è proprietario richiede un pagamento. Tuttavia, per poter eseguire una ricerca mirata. occorre sapere che, indipendentemente dal motore di ricerca utilizzato, vale sicuramente la pena conoscerne nei dettagli il funzionamento. Innanzitutto è sempre opportuno leggere i suggerimenti per la ricerca nei rispettivi siti e sapere come il motore in questione gestisce le ricerche comprendenti più di una parola. La maggior parte dei motori di ricerca, ma non tutti, riportano risultati comprendenti una qualsiasi delle parole. Data la vastità delle informazioni on-line, è preferibile sempre limitare l’ambito delle ricerche e servirsi di tecniche specifiche e più efficaci.

36 Operatori booleani Gli operatori booleani, che rappresentano forse la funzione più utile nella definizione dei criteri di ricerca, possono garantire un notevole controllo sulla logica del motore di ricerca. Il matematico inglese, George Boole, ha sviluppato l’algebra della logica, che è diventata la base delle ricerche dei database di computer. La logica booleana utilizza parole denominate operatori per stabilire se una affermazione è vera o falsa. Gli operatori più comuni sono AND, OR e NOT, (oppure, AND, NOT in alcuni motori), che possono essere enormemente utili quando si eseguono ricerche on-line. Essi, insieme al NEAR e all'uso delle parentesi sono, per molti aspetti analoghi agli operatori matematici, nel modo di modellare l’esecuzione di un’equazione complessa. Ecco ciò che gli operatori booleani possono fare: -AND Per cercate un documento che dovrebbe contenere tutte le parole chiave volute, si può utilizzare la parola in lettere maiuscole AND fra le parole chiave. Il motore di ricerca indicherà solo documenti che hanno entrambe le parole. Accertarsi, comunque, di mettere in maiuscolo la parola AND, altrimenti il motore di ricerca la tratterà come una parola chiave, non come un operatore. - OR Per allargare la ricerca e trovare documenti contenenti una di due parole chiave, occorre utilizzare l’operatore OR fra le parole. Esso è molto utile quando si ricercano i termini che hanno sinonimi che potrebbero essere utilizzati nello stesso senso in un documento. - NEAR Questo operatore è una forma più specifica dell’operatore AND. Garantisce che il documento contenga entrambi i termini e che siano posizionati vicini l’uno all’altro. In molti documenti lunghi, utilizzare solo l’operatore AND potrebbe non fornire informazioni utili, poiché le due parole chiave potrebbero essere situate in parti molto diverse del documento e potrebbero non essere connesse fra loro. - NOT o AND NOT Utilizzando le parole in maiuscolo AND NOT davanti a un termine di ricerca, si eliminano i documenti contenenti tale termine. - Parentesi Gli operatori AND, NEAR, OR e AND NOT sono efficaci già di per sé, ma se utilizzati assieme alle parentesi, offrono un controllo notevole sulla logica della ricerca eseguita dal motore. Le parentesi sono utilizzate nella logica booleana in maniera analoga a come vengono utilizzate in un’equazione matematica, limitando e ordinando le relazioni tra le variabili. Operatori booleani Gli operatori booleani, che rappresentano forse la funzione più utile nella definizione dei criteri di ricerca, possono garantire un notevole controllo sulla logica del motore di ricerca. Il matematico inglese, George Boole, ha sviluppato l’algebra della logica, che è diventata la base delle ricerche dei database di computer. La logica booleana utilizza parole denominate operatori per stabilire se una affermazione è vera o falsa. Gli operatori più comuni sono AND, OR e NOT, (oppure, AND, NOT in alcuni motori), che possono essere enormemente utili quando si eseguono ricerche on-line. Essi, insieme al NEAR e all'uso delle parentesi sono, per molti aspetti analoghi agli operatori matematici, nel modo di modellare l’esecuzione di un’equazione complessa. Ecco ciò che gli operatori booleani possono fare: -AND Per cercate un documento che dovrebbe contenere tutte le parole chiave volute, si può utilizzare la parola in lettere maiuscole AND fra le parole chiave. Il motore di ricerca indicherà solo documenti che hanno entrambe le parole. Accertarsi, comunque, di mettere in maiuscolo la parola AND, altrimenti il motore di ricerca la tratterà come una parola chiave, non come un operatore. - OR Per allargare la ricerca e trovare documenti contenenti una di due parole chiave, occorre utilizzare l’operatore OR fra le parole. Esso è molto utile quando si ricercano i termini che hanno sinonimi che potrebbero essere utilizzati nello stesso senso in un documento. - NEAR Questo operatore è una forma più specifica dell’operatore AND. Garantisce che il documento contenga entrambi i termini e che siano posizionati vicini l’uno all’altro. In molti documenti lunghi, utilizzare solo l’operatore AND potrebbe non fornire informazioni utili, poiché le due parole chiave potrebbero essere situate in parti molto diverse del documento e potrebbero non essere connesse fra loro. - NOT o AND NOT Utilizzando le parole in maiuscolo AND NOT davanti a un termine di ricerca, si eliminano i documenti contenenti tale termine. - Parentesi Gli operatori AND, NEAR, OR e AND NOT sono efficaci già di per sé, ma se utilizzati assieme alle parentesi, offrono un controllo notevole sulla logica della ricerca eseguita dal motore. Le parentesi sono utilizzate nella logica booleana in maniera analoga a come vengono utilizzate in un’equazione matematica, limitando e ordinando le relazioni tra le variabili. Esse vengono utilizzate prevalentemente per racchiudere due possibili parole chiave separate da un operatore OR e quindi collegare le parole chiave possibili fra parentesi con altri criteri utilizzando AND, ma vi sono momenti in cui può rivelarsi utile una disposizione contraria. Si può affinare ulteriormente la ricerca, anche utilizzando doppie parentesi, ricordando,però, che nell’espressione di Boole ad ogni parentesi di sinistra deve corrispondere una parentesi a destra, altrimenti il motore di ricerca non riconoscerà le istruzioni. Molti motori di ricerca offrono la possibilità di limitare le ricerche per date di creazione delle pagine Web. Si tratta di uno strumento molto utile per chi eseguirà ricerche continue su un argomento specifico, consentendogli di limitare i risultati alle pagine create dalla loro ultima ricerca. È utile anche quando si esegue una ricerca tematica di avvenimenti attuali. Alcuni motori sono in grado di limitare le ricerche ad aree specifiche, le più comuni delle quali sono: titolo e URL. Ancora, alcuni motori di ricerca permettono di limitare le ricerche a "solo nel Web" o solo i "newsgroup"; inoltre, la maggioranza dei sistemi utilizza attualmente l’AND come operatore logico di default, mentre solo una minoranza di sistemi utilizza attualmente l’OR come operatore logico di default. Intersezione (And o +) per rintracciare i record che soddisfano tutti i criteri richiesti. <Promessi And Sposi> = tutti i record che contengono sia la parola Promessi, sia la parola Sposi. Unione (OR) per rintracciare i recordi che soddisfano almeno uno dei criteri richiesti. <Promessi OR Sposi>= tutti i record che contengono la parola Promessi, tutti i record che contengono la parola Sposi, tutti i record che le contengono entrambe. Complemento (NOT oppure AND NOT): per rintracciare i record che soddisfano un determinato criterio escludendo quelli che però ne soddisfano un altro. <Promessi NOT Sposi>= tutti i record che contengono la parola Promessi tranne quelli che contengono anche la parola Sposi. Esclusione (XOR o NOR): per rintracciare i record che soddisfano esclusivamente uno solo dei criteri richiesti. <Promessi XOR Sposi>= tutti i record che contengono la sola parola Promessi, tutti i record che contengono la sola parolaSposi, ma non quelli che le contengono entrambe. [*didascalie ed immagini da: Metitieri, Ridi, Biblioteche in rete, Bari,Laterza,2002*] vedi anche: Esistono anche numerosi altri operatori, non sempre presenti in tutti i sistemi, utilizzabili per effettuare ricerche più sofisticate: SAME si aggiunge la condizione che entrambi i termini debbano trovarsi all'interno del medesimo campo ADJ o WITH si rintracciano tutte le occorrenze all'interno del medesimo campo della frase solo nell'ordine richiesto

37 Operatori booleani Esse vengono utilizzate prevalentemente per racchiudere due possibili parole chiave separate da un operatore OR e quindi collegare le parole chiave possibili fra parentesi con altri criteri utilizzando AND, ma vi sono momenti in cui può rivelarsi utile una disposizione contraria. Si può affinare ulteriormente la ricerca, anche utilizzando doppie parentesi, ricordando,però, che nell’espressione di Boole ad ogni parentesi di sinistra deve corrispondere una parentesi a destra, altrimenti il motore di ricerca non riconoscerà le istruzioni. Molti motori di ricerca offrono la possibilità di limitare le ricerche per date di creazione delle pagine Web. Si tratta di uno strumento molto utile per chi eseguirà ricerche continue su un argomento specifico, consentendogli di limitare i risultati alle pagine create dalla loro ultima ricerca. È utile anche quando si esegue una ricerca tematica di avvenimenti attuali. Alcuni motori sono in grado di limitare le ricerche ad aree specifiche, le più comuni delle quali sono: titolo e URL. Ancora, alcuni motori di ricerca permettono di limitare le ricerche a "solo nel Web" o solo i "newsgroup"; inoltre, la maggioranza dei sistemi utilizza attualmente l’AND come operatore logico di default, mentre solo una minoranza di sistemi utilizza attualmente l’OR come operatore logico di default. Intersezione (And o +) per rintracciare i record che soddisfano tutti i criteri richiesti. <Promessi And Sposi> = tutti i record che contengono sia la parola Promessi, sia la parola Sposi. Unione (OR) per rintracciare i recordi che soddisfano almeno uno dei criteri richiesti. <Promessi OR Sposi>= tutti i record che contengono la parola Promessi, tutti i record che contengono la parola Sposi, tutti i record che le contengono entrambe. Complemento (NOT oppure AND NOT): per rintracciare i record che soddisfano un determinato criterio escludendo quelli che però ne soddisfano un altro. <Promessi NOT Sposi>= tutti i record che contengono la parola Promessi tranne quelli che contengono anche la parola Sposi. Esclusione (XOR o NOR): per rintracciare i record che soddisfano esclusivamente uno solo dei criteri richiesti. <Promessi XOR Sposi>= tutti i record che contengono la sola parola Promessi, tutti i record che contengono la sola parolaSposi, ma non quelli che le contengono entrambe. [*didascalie ed immagini da: Metitieri, Ridi, Biblioteche in rete, Bari,Laterza,2002*] vedi anche: Esistono anche numerosi altri operatori, non sempre presenti in tutti i sistemi, utilizzabili per effettuare ricerche più sofisticate: SAME si aggiunge la condizione che entrambi i termini debbano trovarsi all'interno del medesimo campo ADJ o WITH si rintracciano tutte le occorrenze all'interno del medesimo campo della frase solo nell'ordine richiesto

38 Segni diacritici Internet, come del resto buona parte dell’informatica, è nata in lingua inglese, senza accenti e senza caratteri diacritici. La grande maggioranza dei testi presenti in rete contiene unicamente dei caratteri del set Ascii «ristretto». L’Ascii (American standard code for information interchange), che si basa su 8 bit, può rappresentare 256 caratteri diversi, ma solo la codifica dei primi 128, quelli che costituiscono l’Ascii ristretto (Us-Ascii, chiamato anche Plain vanilla Ascii) è realmente universale; i codici utilizzati per gli altri caratteri, che costituiscono l’Ascii esteso, possono variare da sistema a sistema e la loro trasmissione può comportare alcuni problemi. Oltre ai numeri, alle lettere maiuscole e minuscole (senza alcun accento), ai simboli di punteggiatura, allo spazio e ad alcuni codici di controllo, l’Ascii ristretto comprende solo i seguenti caratteri di uso comune: ! “ # $ % & ‘ ( ) * + - / \ < > = [ ] ^ _ { } ~ Questo scenario è in rapida evoluzione grazie alla progressiva diffusione di protocolli più ricchi e completi; per il momento, tuttavia, molti motori e Opac non trattano correttamente gli accenti. (Metitieri, Ridi, 1999) Stabilire una regola universale da seguire in tutte le ricerche su qualsiasi sistema non è possibile, ma nel dubbio è meglio provare a eliminare gli accenti e sostituire le lettere accentate con i corrispondenti caratteri non accentati. Tra questi i più comuni sono i caratteri definiti jolly: il troncamento con * , per per sostituire un numero indeterminato di caratteri a destra o a sinistra della parola il mascheramento con ? , per sostituire un numero determinato di caratteri all'interno di una parola Segni diacritici Internet, come del resto buona parte dell’informatica, è nata in lingua inglese, senza accenti e senza caratteri diacritici. La grande maggioranza dei testi presenti in rete contiene unicamente dei caratteri del set Ascii «ristretto». L’Ascii (American standard code for information interchange), che si basa su 8 bit, può rappresentare 256 caratteri diversi, ma solo la codifica dei primi 128, quelli che costituiscono l’Ascii ristretto (Us-Ascii, chiamato anche Plain vanilla Ascii) è realmente universale; i codici utilizzati per gli altri caratteri, che costituiscono l’Ascii esteso, possono variare da sistema a sistema e la loro trasmissione può comportare alcuni problemi. Oltre ai numeri, alle lettere maiuscole e minuscole (senza alcun accento), ai simboli di punteggiatura, allo spazio e ad alcuni codici di controllo, l’Ascii ristretto comprende solo i seguenti caratteri di uso comune: ! “ # $ % & ‘ ( ) * + - / \ < > = [ ] ^ _ { } ~ Questo scenario è in rapida evoluzione grazie alla progressiva diffusione di protocolli più ricchi e completi; per il momento, tuttavia, molti motori e Opac non trattano correttamente gli accenti. (Metitieri, Ridi, 1999) Stabilire una regola universale da seguire in tutte le ricerche su qualsiasi sistema non è possibile, ma nel dubbio è meglio provare a eliminare gli accenti e sostituire le lettere accentate con i corrispondenti caratteri non accentati. Tra questi i più comuni sono i caratteri definiti jolly: il troncamento con * , per per sostituire un numero indeterminato di caratteri a destra o a sinistra della parola il mascheramento con ? , per sostituire un numero determinato di caratteri all'interno di una parola

39 Segni matematici Alcuni motori di ricerca offrono una variante degli operatori booleani AND e NOT. Un simbolo + davanti a una parola (senza spazi in mezzo) esigerà che la parola sia presente nei documenti. Un simbolo – davanti a una parola chiave assicurerà che la parola non sia presente nei documenti indicati. Va notato che tutte le parole che devono essere contenute nel documento devono essere precedute da un simbolo +, persino la prima parola. - I documenti devono includere "Tutti i termini" (equivalente ad utilizzare l’operatore AND fra tutti i termini). - I documenti devono includere "Ogni termine" (equivalente ad utilizzare l’operatore OR fra tutti i termini Segni matematici Alcuni motori di ricerca offrono una variante degli operatori booleani AND e NOT. Un simbolo + davanti a una parola (senza spazi in mezzo) esigerà che la parola sia presente nei documenti. Un simbolo – davanti a una parola chiave assicurerà che la parola non sia presente nei documenti indicati. Va notato che tutte le parole che devono essere contenute nel documento devono essere precedute da un simbolo +, persino la prima parola. - I documenti devono includere "Tutti i termini" (equivalente ad utilizzare l’operatore AND fra tutti i termini). - I documenti devono includere "Ogni termine" (equivalente ad utilizzare l’operatore OR fra tutti i termini

40 Metodo SEWCOM L'eccesso di documenti da cui si viene sommersi utilizzando i motori di ricerca Recenti ricerche sulla metacognizione hanno accertato che le dinamiche attivate nei percorsi di apprendimento possono essere stimolate da processi organizzati delle fasi mentali e da rappresentazioni visive e concrete del sapere. Pertanto, per dare significato a quanto viene appreso, uno degli strumenti più versatili ed efficaci risulta l'uso delle mappe concettuali. La costruzione di mappe consente di schematizzare significati e collegamenti logici fra concetti, mettendo in luce le idee-base che si pongono a fondamento dello svolgimento di compiti di conoscenza. La metacognizione interviene anche nella creazione di forme linguistiche, finalizzate a padroneggiare ed esternare, in modo sempre più consapevole, le proprie intenzioni comunicative. Anche l'abilità di organizzare i concetti, che viene ad essere fortemente stimolata dalla creazione di mappe concettuali, è una capacità eminentemente metacognitiva, atta a transfer di apprendimenti. Il metodo SEWCOM (Search the Web with Concept Maps) è un metodo metacognitivo, che suggerisce di organizzare i concetti in strutture visive, con le quali pianificare un'attività di ricerca, traducendo in Keywords le idee emerse dalla riflessione, anche attraverso un efficace brainstorming, sull'oggetto informativo. Esso agevola, quindi, non solo la possibilità di contrastare così l'information overload, l'eccesso di informazione, ma anche di ristrutturare la nuova conoscenza acquisita, rendendola duttile e di immediata fruizione. I due processi: il lessico e le strategie La ricerca dell'informazione coinvolge due processi strettamente legati tra loro: 1. apprendere riguardo il lessico del dominio semantico in questione e 2. apprendere le migliori strategie per localizzare l'informazione stessa Il metodo SEWCOM cerca di integrare appunto entrambi i processi ed utilizza l'approccio metacognitivo-visuale delle mappe concettuali. Il metodo può essere usato sia in modo collaborativo che individuale e nasce da osservazioni e sperimentazioni preliminari effettuate sia con adulti che con ragazzi delle ultime classi della scuola superiore. Ci vuole un metodo metacognitivo per cercare, valutare ed integrare la conoscenza nel Web: SEWCOM I quattro passi del metodo [*Immagini e testo da: C. Petrucco, Ricercare in rete, Lecce, PensaMultimedia,2003] Metodo SEWCOM L'eccesso di documenti da cui si viene sommersi utilizzando i motori di ricerca Recenti ricerche sulla metacognizione hanno accertato che le dinamiche attivate nei percorsi di apprendimento possono essere stimolate da processi organizzati delle fasi mentali e da rappresentazioni visive e concrete del sapere. Pertanto, per dare significato a quanto viene appreso, uno degli strumenti più versatili ed efficaci risulta l'uso delle mappe concettuali. La costruzione di mappe consente di schematizzare significati e collegamenti logici fra concetti, mettendo in luce le idee-base che si pongono a fondamento dello svolgimento di compiti di conoscenza. La metacognizione interviene anche nella creazione di forme linguistiche, finalizzate a padroneggiare ed esternare, in modo sempre più consapevole, le proprie intenzioni comunicative. Anche l'abilità di organizzare i concetti, che viene ad essere fortemente stimolata dalla creazione di mappe concettuali, è una capacità eminentemente metacognitiva, atta a transfer di apprendimenti. Il metodo SEWCOM (Search the Web with Concept Maps) è un metodo metacognitivo, che suggerisce di organizzare i concetti in strutture visive, con le quali pianificare un'attività di ricerca, traducendo in Keywords le idee emerse dalla riflessione, anche attraverso un efficace brainstorming, sull'oggetto informativo. Esso agevola, quindi, non solo la possibilità di contrastare così l'information overload, l'eccesso di informazione, ma anche di ristrutturare la nuova conoscenza acquisita, rendendola duttile e di immediata fruizione. I due processi: il lessico e le strategie La ricerca dell'informazione coinvolge due processi strettamente legati tra loro: 1. apprendere riguardo il lessico del dominio semantico in questione e 2. apprendere le migliori strategie per localizzare l'informazione stessa Il metodo SEWCOM cerca di integrare appunto entrambi i processi ed utilizza l'approccio metacognitivo-visuale delle mappe concettuali. Il metodo può essere usato sia in modo collaborativo che individuale e nasce da osservazioni e sperimentazioni preliminari effettuate sia con adulti che con ragazzi delle ultime classi della scuola superiore. Ci vuole un metodo metacognitivo per cercare, valutare ed integrare la conoscenza nel Web: SEWCOM I quattro passi del metodo [*Immagini e testo da: C. Petrucco, Ricercare in rete, Lecce, PensaMultimedia,2003]

41 Metadati Tutte le informazioni inserite dentro i tag <Meta> delle pagine HTML sono metadati, ovvero dati sui dati, informazioni strutturate e scandite in campi, relative a documenti a testo pieno (full text), che ne permettono organizzazione e recupero più efficaci. La procedura per estrarre i metadati da un documento è, forse un po' lunga, ma semplice e soddisfacente in termini di risultati: l’autore produce i dati; l’indicizzatore ne estrae i metadati e li organizza; l'utente interroga i metadati e individua quello che risponde alle sue esigenze informative. Nell’ambito dei documenti disponibili in rete l’importanza dei metadati è stata in principio trascurata; invece essi, che per tipologia informativa possono essere paragonati alle schede di una biblioteca, sono ancora più indispensabili nel web, dove non si può "navigare a vista" per l'enorme numero di documenti presenti. Molti progetti relativi ai metadati sono attualmente in corso, condotti da persone provenienti per lo più da ambienti informatici, che ricercano il metodo per associare i data ai relativi metadati, con relativa attenzione al controllo terminologico delle stringhe da utilizzare. La presenza di appropriati metadati nelle pagine web potrebbe contribuire a ridurre l’information overload. Metadati Tutte le informazioni inserite dentro i tag <Meta> delle pagine HTML sono metadati, ovvero dati sui dati, informazioni strutturate e scandite in campi, relative a documenti a testo pieno (full text), che ne permettono organizzazione e recupero più efficaci. La procedura per estrarre i metadati da un documento è, forse un po' lunga, ma semplice e soddisfacente in termini di risultati: l’autore produce i dati; l’indicizzatore ne estrae i metadati e li organizza; l'utente interroga i metadati e individua quello che risponde alle sue esigenze informative. Nell’ambito dei documenti disponibili in rete l’importanza dei metadati è stata in principio trascurata; invece essi, che per tipologia informativa possono essere paragonati alle schede di una biblioteca, sono ancora più indispensabili nel web, dove non si può "navigare a vista" per l'enorme numero di documenti presenti. Molti progetti relativi ai metadati sono attualmente in corso, condotti da persone provenienti per lo più da ambienti informatici, che ricercano il metodo per associare i data ai relativi metadati, con relativa attenzione al controllo terminologico delle stringhe da utilizzare. La presenza di appropriati metadati nelle pagine web potrebbe contribuire a ridurre l’information overload.

42 Qualità dell'informazione
Uno dei principali problemi legati alla ricerca è come valutare la qualità delle informazioni. Che un documento sia on-line non costituisce una garanzia, nè implica che contenga informazioni valide. Le informazioni on-line richiedono un’analisi scrupolosa e un'attenta valutazione.L'editoria cartacea possiede una lunga tradizione di criteri giornalistici legati al codice deontologico professionale, che il materiale stampato è tenuto ad osservare; sebbene molti scrittori ed editori si attengano a questi criteri anche nel pubblicare sul Web, molti altri non lo fanno,altri ancora non hanno alcun codice da rispettare.Internet abbonda di ogni tipo di informazioni,per cui occorre controllare con spiritocritico e saper individuare le informazioni corrette, anche se l'offerta è motivata da ottime intenzioni. La prima domanda che bisogna porsi riguarda l’autore: se è conosciuto, di quale reputazione gode, se si tratta di un esperto, se è contattabile. Poiché alcuni articoli sul Web potrebbero non riferirsi allo scrittore, il criterio successivo da valutare è l’editore del sito Web: se si tratta di un’organizzazione; se ha una presenza nel mondo reale. Molte pubblicazioni, tuttavia, esistono solo in via elettronica;in tal caso, occorre scoprire qualcosa sull’editore. Raramente le informazioni sono completamente neutrali; di solito esiste un punto di vista. Poiché è talmente facile pubblicare su Internet, le opinioni abbondano, per cui occorre considerate sempre la fonte dell’informazione. Se l’autore cita altre fonti di informazioni nell’articolo, bisogna valutare se queste fonti sono affidabili e verificabili. Infine, i documenti on-line devono contenere la data di quando sono stati scritti o del loro aggiornamento più recente. È importante conoscere la tempestività delle informazioni, perché informazioni più recenti, più pertinenti possono esistere altrove. Queste considerazioni possono aiutare a stabilire l’affidabilità del documento in questione. Qualità dell'informazione Uno dei principali problemi legati alla ricerca è come valutare la qualità delle informazioni. Che un documento sia on-line non costituisce una garanzia, nè implica che contenga informazioni valide. Le informazioni on-line richiedono un’analisi scrupolosa e un'attenta valutazione.L'editoria cartacea possiede una lunga tradizione di criteri giornalistici legati al codice deontologico professionale, che il materiale stampato è tenuto ad osservare; sebbene molti scrittori ed editori si attengano a questi criteri anche nel pubblicare sul Web, molti altri non lo fanno,altri ancora non hanno alcun codice da rispettare.Internet abbonda di ogni tipo di informazioni,per cui occorre controllare con spiritocritico e saper individuare le informazioni corrette, anche se l'offerta è motivata da ottime intenzioni. La prima domanda che bisogna porsi riguarda l’autore: se è conosciuto, di quale reputazione gode, se si tratta di un esperto, se è contattabile. Poiché alcuni articoli sul Web potrebbero non riferirsi allo scrittore, il criterio successivo da valutare è l’editore del sito Web: se si tratta di un’organizzazione; se ha una presenza nel mondo reale. Molte pubblicazioni, tuttavia, esistono solo in via elettronica;in tal caso, occorre scoprire qualcosa sull’editore. Raramente le informazioni sono completamente neutrali; di solito esiste un punto di vista. Poiché è talmente facile pubblicare su Internet, le opinioni abbondano, per cui occorre considerate sempre la fonte dell’informazione. Se l’autore cita altre fonti di informazioni nell’articolo, bisogna valutare se queste fonti sono affidabili e verificabili. Infine, i documenti on-line devono contenere la data di quando sono stati scritti o del loro aggiornamento più recente. È importante conoscere la tempestività delle informazioni, perché informazioni più recenti, più pertinenti possono esistere altrove. Queste considerazioni possono aiutare a stabilire l’affidabilità del documento in questione.

43 La ricerca bibliografica
Opac OPAC SBN Metaopac MetaOpac Azalai Digital Libraries Librerie WAIS La ricerca bibliografica Per poter utilizzare con successo cataloghi, bibliografie e banche dati elettroniche, è indispensabile conoscere l' information retrieval, l'insieme di tecniche utilizzate per il recupero mirato dell’informazione elettronica. La distinzione fondamentale alla base dell’information retrieval è quella fra la ricerca di una o più parole all’interno dell’intero testo (full text) di un documento, da quelle del successivo recupero di quell'informazione, e la ricerca delle medesime parole all’interno di testi più brevi e normalizzati (l’abstract, le intestazioni per autore, titolo, soggetto, ecc.) creati dall’autore stesso o da tecnici specializzati proprio per facilitare l’individuazione successiva del documento stesso. Un altro dei concetti fondamentali dell’information retrieval, per restituire senza sforzo tutti e soltanto i documenti cercati, è quello del rapporto inverso fra richiamo e precisione. Il richiamo misura la capacità di recuperare tutti i documenti pertinenti (ovvero considerati rilevanti rispetto all’obiettivo della ricerca) presenti nell’archivio interrogato, mentre la precisione misura la capacità di recuperare soltanto i documenti pertinenti. Tra richiamo, precisione e documenti trovati vale il seguente schema: richiamo = documenti pertinenti recuperati nella ricerca documenti pertinenti esistenti nella banca dati interrogata precisione = documenti pertinenti recuperati nella ricerca documenti (pertinenti o no) recuperati nella ricerca (Metitieri, Ridi,2002) Pertanto, aumentando il richiamo, diminuisce la precisione, per cui una stategia di ricerca che soddisfi al massimo tutte e due le situazioni è quasi impossibile. Occorre, quindi, essere perfettamente consci degli strumenti disponibili e operare scelte consapevoli nel preciso contesto. In genere, nella ricerca di risorse in rete, si privilegia maggiormente il richiamo, cioè l'alto numero delle riccorrenze, piuttosto che l'aspetto qualitativo delle risorse, garantito dalla precisione. accontentandosi del "rumore". Le ricerche che si svolgono sui cataloghi delle biblioteche, invece, sono finalizzate a reperire l'oggetto della ricerca in modo mirato,con poche ricorrenze, ma particolare precisione. Internet offre una notevole quantità di servizi di tipo bibliotecario all'utenza generica ed altri specifici per i professionisti del settore. La tipologia è suddivisa in diverse classi: servizi di informazione generica al pubblico virtual reference desk consultazione on line di cataloghi informatici di singole biblioteche cataloghi collettivi distribuzione selettiva di documenti (document delivery) servizi di supporto per i professionisti del settore bibliotecario servizi di biblioteca digitale.

44 Opac OPAC SBN Opac Gli OPAC, acronimo di On line Public Access Catalog, rappresentano una delle risorse informative più preziose della rete. Sono il prodotto di una lunga fase di innovazione tecnologica delle biblioteche, iniziata intorno agli anni '60. Lo sviluppo delle tecnologie telematiche e la diffusione in ambito accademico di internet hanno consentito prima l'automazione dei sistemi catalografici, poi la loro diffusione in rete, in modo da consentire agli utenti di consultare on line i cataloghi delle collezioni. Un OPAC è costituito essenzialmente da un database e da un'interfaccia di accesso ai dati in esso archiviati. Il database è composto da una serie di schede (record), organizzate per aree prefissate (campi) conteneti la descrizione dei documenti che fanno parte della collezione di una o più biblioteche. La struttura di un record catalografico è sta oggetto di un importante processo di standardizzazione e uniformazione dei sistemi a livello internazionale, sotto il controllo dell'IFLA (Intenational Federation of Library Associations), comunità internazionale di bibliotecari, che a partire dalla metà degli anni '70, ha prodotto una serie di standard, il più importante dei quali è il formato dei record catalografici UNIMARC (Universal Machine Readable Catalogue) per l'input/output dei dati, ormai adottato da quasi tutti i sistemi OPAC in rete. L'UNIMARC ricalca, a sua volta, la struttura logica della scheda bibliografica standard, definita nell'ISBD (International Standard Bibliographic Description) che prescrive le informazioni che vanno fornite per descrivere un documento.

45 OPAC SBN Tra tutti gli OPAC il più importante è SBN, il Servizio Bibliotecario Nazionale, che produce il catalogo collettivo delle biblioteche italiane. Il servizio è suddiviso in più banche dati catalografiche, divise per tipologia di documenti, che vengono incrementate continuamente. OPAC SBN Tra tutti gli OPAC il più importante è SBN, il Servizio Bibliotecario Nazionale, che produce il catalogo collettivo delle biblioteche italiane. Il servizio è suddiviso in più banche dati catalografiche, divise per tipologia di documenti, che vengono incrementate continuamente.

46 Metaopac MetaOpac Azalai Metaopac
I MetaOpac, cataloghi collettivi virtuali, sono costituiti da un software che, appoggiandosi ad una bancadati apposita, interroga contemporaneamente vari Opac, indipendenti fra loro e consultabili anche separatamente. I risultati della ricerca possono essere presentati in ordine di intestazione scheda, spesso divisi per Opac di origine. Questa soluzione, ispirata dai modelli dei metamotori, sta avendo notevole fortuna, perchè se ne intravede l'utilità, anche se compaiono talvolta delle difformità, dovute ai cataloghi originari a vari livelli (regole di catalogazione, formati registrazione ed esportazione dati, numero di campi previsti), rispetto all'interrogazione dei singoli Opac.

47 MetaOpac Azalai Il MAI permette di interrogare simultaneamente oltre 150 cataloghi in linea di biblioteche e sistemi di biblioteche italiani. La ricerca immessa viene inviata a tutti i cataloghi, e ritrasmette una dopo l'altra tutte le risposte positive. Tutti i cataloghi italiani accessibili in rete, sia pure in forme ufficiose, vengono comunque inclusi nel repertorio degli Opac italiani, a partire dal quale possono essere consultati singolarmente. Si considerano un unico catalogo tutte le interfacce che ricercano in uno stesso insieme di biblioteche, identificato dal nome dell'istituzione di cui fanno parte, o dal nome del catalogo stesso quando si tratti di diversi enti eterogenei (es. "Catalogo italiano dei periodici"). Ciascun catalogo può essere articolato in una o più sezioni dedicate a specifiche parti del patrimonio (es. Monografie, Periodici, Fondo Antico, ecc.). La maschera di ricerca selettiva permette di selezionare un insieme di cataloghi sui quali effettuare poi una ricerca. MetaOpac Azalai Il MAI permette di interrogare simultaneamente oltre 150 cataloghi in linea di biblioteche e sistemi di biblioteche italiani. La ricerca immessa viene inviata a tutti i cataloghi, e ritrasmette una dopo l'altra tutte le risposte positive. Tutti i cataloghi italiani accessibili in rete, sia pure in forme ufficiose, vengono comunque inclusi nel repertorio degli Opac italiani, a partire dal quale possono essere consultati singolarmente. Si considerano un unico catalogo tutte le interfacce che ricercano in uno stesso insieme di biblioteche, identificato dal nome dell'istituzione di cui fanno parte, o dal nome del catalogo stesso quando si tratti di diversi enti eterogenei (es. "Catalogo italiano dei periodici"). Ciascun catalogo può essere articolato in una o più sezioni dedicate a specifiche parti del patrimonio (es. Monografie, Periodici, Fondo Antico, ecc.). La maschera di ricerca selettiva permette di selezionare un insieme di cataloghi sui quali effettuare poi una ricerca.

48 Digital Libraries Librerie WAIS Digital Libraries
sabato 20 novembre 2004Una delle più interessanti ed utili risorse disponibili sulla rete è rappresentata dalle Digital Libraries, o, più correttamente, "banche dati testuali"; esse raccolgono in un archivio, consultabile via Internet, testi digitalizzati, elettronici, utilizzabili con l’ausilio di un programma d’elaborazione testi (Word, Write, Wordpad, Wordstar ecc.) o con un browser (Internet Explorer, Netscape ecc.). Nelle biblioteche virtuali i testi sono consultabili direttamente in rete e si possono "scaricare" (trasferire) permanentemente sul proprio hard disk o su altro supporto di memorizzazione (floppy, CDROM ecc.). I testi sono spesso presentati in due formati: TXT e RTF; il primo è leggibile praticamente da tutti gli elaboratori di testi, anche da quelli "vecchi", ed è utilizzabile perfino da programmi per non vedenti; il secondo è leggibile da moltissimi programmi, mantenendo caratteristiche quali la presenza di grassetto e di caratteri particolari, l’impaginazione e così via. Realizzati in questi formati, non sono sempre leggibili direttamente stando collegati alla rete, ma spesso devono essere "scaricati" sul proprio computer; per velocizzare questa operazione, i file sono quasi sempre compressi e bisogna decomprimerli. A volte i file sono realizzati anche in formato HTML, quello delle pagine Internet, e sono quindi leggibili anche direttamente "in rete". Negli ultimi tempi si stanno diffondendo altri formati, come il PDF, da usarsi con il programma Acrobat reader, e altri utilizzabili dai computer palmari. I file TXT sono meno "belli", ma hanno il vantaggio di essere utilizzabili praticamente da tutti i computer e di occupare poco spazio in termini di memoria; quelli HTML assomigliano a pagine Web, sono spesso esteticamente accattivanti, ma possono essere letti solo utilizzando un browser e sono in genere più "pesanti"; i file in formato RTF, forse il più funzionale, possono contenere immagini, permettono di usare caratteri e formati diversi pur essendo compatibili con quasi tutti i word processor in circolazione e hanno dimensioni ridotte rispetto, ad esempio, ai file realizzati con Microsoft Word. Questa risorsa non deve essere confusa con le librerie virtuali, come Amazon, Zivago, Internetbookshop, nelle quali si può solo acquistare libri in formato cartaceo; nelle biblioteche virtuali, in genere, i testi, solo digitali, sono disponibili gratuitamente. Altra cosa sono, inoltre, i cataloghi delle biblioteche, che offrono esclusivamente la possibilità di sapere dove trovare un certo volume.

49 Librerie WAIS Una Libreria Wais ( Wide Area Information Server) è un database completo di documenti on line su uno specifico argomento; per esempio, l'insieme dei testi letterari e storici di dominio pubblico del Progetto Gutenberg, disponibili su Internet. Poichè le librerie WAIS gratuite attualmente accessibili sono aggiornate e gestite da volontari, la qualità della copertura degli argomenti non è omogenea. Il WAIS, che utilizza lo standard Z39.50 per elaborare interrogazioni in linguaggio naturale, è un sistema di recupero e ricerca di documenti ed informazioni che utilizza le parole chiave, basato su UNIX, che può essere utilizzato per le oltre quattrocento librerie esistenti; la ricerca di corrispondenze delle parole chiave fornite viene eseguita su file indicizzati a cui corrispondono parole chiave immesse dall'utente. er utilizzare un server Wais, gli utenti hanno bisogno di un client WAIS. WAIS può, inoltre, essere utilizzato come motore di ricerca su un singolo sito web. Librerie WAIS Una Libreria Wais ( Wide Area Information Server) è un database completo di documenti on line su uno specifico argomento; per esempio, l'insieme dei testi letterari e storici di dominio pubblico del Progetto Gutenberg, disponibili su Internet. Poichè le librerie WAIS gratuite attualmente accessibili sono aggiornate e gestite da volontari, la qualità della copertura degli argomenti non è omogenea. Il WAIS, che utilizza lo standard Z39.50 per elaborare interrogazioni in linguaggio naturale, è un sistema di recupero e ricerca di documenti ed informazioni che utilizza le parole chiave, basato su UNIX, che può essere utilizzato per le oltre quattrocento librerie esistenti; la ricerca di corrispondenze delle parole chiave fornite viene eseguita su file indicizzati a cui corrispondono parole chiave immesse dall'utente. er utilizzare un server Wais, gli utenti hanno bisogno di un client WAIS. WAIS può, inoltre, essere utilizzato come motore di ricerca su un singolo sito web.

50 Applicazioni peer to peer
Query flooding Scaricare e-book Applicazioni peer to peer La struttura di una rete informatica che comprende hardware, livelli funzionali, interfacce e protocolli per la comunicazione ed il trasferimento delle informazioni viene definita architettura della rete. In una rete di comunicazioni a strati viene definito Peer un dispositivo che funziona sullo stesso livello di protocollo; ogni computer, o peer, viene considerato alla "pari" in termini di responsabilità e ognuno funziona da server per gli altri computer della rete. A differenza dell'architettura client-server,non è necessario disporre di un file server dedicato, anche se le prestazioni della rete sono spesso inferiori, soprattutto in caso di sovraccarico. Un' architettura Peer to Peer, detta anche rete paritetica, consente l'interazione tra dispositivi che operano allo stesso livello di comunicazione in una rete basata su un'architettura stratificata. Tale rete ha la caratteristica di evolvere dinamicamente con una certa frequanza quindi è spesso difficile poter stabilire una topologia di rete ottima o al più ottimale in termini di collegamenti e costi. D'altra parte non è possibile affidarsi a qualche server centrale, in quanto nessuno dei pari garantisce di restare sempre acceso e connesso alla rete. Per cercare un certo contenuto attraverso tali applicazioni, un pari della rete sovrapposta inoltrerà la sua richiesta a tutti i nodi ad esso collegati, i quali a loro volta replicheranno le richieste verso tutti quelli a loro adiacenti e così via, creando così un'inondazione di richieste (query flooding): se un pari raggiunto da queste richieste ha il contenuto cercato, manda un messaggio al pari che ha originato la richiesta, offrendo il contenuto. Le applicazioni P2P sono usate per scarica i file Mp3 e gli e-book.

51 Query flooding Scaricare e-book Query flooding
In generale il termine di query flooding si utilizza per caratterizzare una qualsiasi azione che comporti una inondazione di richieste, qualsiasi siano gli "attori" tra cui avviene la comunicazione e la richiesta (client\server - peer). In particolare, tale termine identificherà l'operazione di richiesta di un qualche pacchetto intrapresa tra calcolatori che prendono parte ad una applicazione P2P. Il termine "flooding" specifica una particolare tecnica di instradamento dei pacchetti all'interno di una rete di calcolatori: vengono inviate le richieste dal richiedente a tutti i nodi ad esso collegati nella rete, quest'ultimi propagheranno a loro volta le richieste finchè questa non viene soddisfatta da un nodo raggiunto dall' "inondazione". Tuttavia, se da una parte presenta una notevole semplicità di funzionamento, pecca inevitabilmente in termini di efficienza, specie nel caso in cui l'inondazione delle richieste raggiunge livelli molto elevati in quanto le informazioni trasmesse sono spesso ridondanti, a causa della possibilità di avere pacchetti ripetuti e dell'inevitabile fattore di crescita da cui esso dipende.

52 Scaricare e-book L'e-book è il formato elettronico che consente ai libri e ad altri testi di grandi dimensioni di poter essere scaricati da un sito web e visualizzati digitalmente. Per la loro visualizzazione e lettura, questi testi richiedono un reader, cioè un piccolo software specifico; quelli che attualmente si stanno contendendo il mercato sono due: Acrobat ebook reader che sfrutta il Pdf, formato proprietario di Adobe. La società, per migliorare il proprio reader, ha acquisito dal 2000 Glassbook,uno dei primi produtto di e-book. I suoi vantaggi sono la capacità di gestire le immagini e la possibilità di stampare i testi. Il prodotto per la lettura è distribuito gratuitamente sul sito < ;Microsoft reader con un suo formato proprietario, il Lit. Questa soluzione è compatibile con l'unico formato non proprietario esistente, l' Oeb. Anche questo software si scarica gratuitamente dal sito< > Open ebook (Oeb) è lo standard non proprietario e sue informazioni si trovano sul sito < > Per trovare in internet degli e-book da scaricare, un buon motore di ricerca è < con un archivio di titoli. Altri motori interessanti sono < e < che tuttavia trovano testi di vario tipo. Scaricare e-book L'e-book è il formato elettronico che consente ai libri e ad altri testi di grandi dimensioni di poter essere scaricati da un sito web e visualizzati digitalmente. Per la loro visualizzazione e lettura, questi testi richiedono un reader, cioè un piccolo software specifico; quelli che attualmente si stanno contendendo il mercato sono due: Acrobat ebook reader che sfrutta il Pdf, formato proprietario di Adobe. La società, per migliorare il proprio reader, ha acquisito dal 2000 Glassbook,uno dei primi produtto di e-book. I suoi vantaggi sono la capacità di gestire le immagini e la possibilità di stampare i testi. Il prodotto per la lettura è distribuito gratuitamente sul sito < ;Microsoft reader con un suo formato proprietario, il Lit. Questa soluzione è compatibile con l'unico formato non proprietario esistente, l' Oeb. Anche questo software si scarica gratuitamente dal sito< > Open ebook (Oeb) è lo standard non proprietario e sue informazioni si trovano sul sito < > Per trovare in internet degli e-book da scaricare, un buon motore di ricerca è < con un archivio di titoli. Altri motori interessanti sono < e < che tuttavia trovano testi di vario tipo.


Scaricare ppt "La ricerca di risorse in rete"

Presentazioni simili


Annunci Google