Titolo della sezione Eventuale sottotitolo Formazione Volontari SCN 2011 Centro Linguistico di Ateneo - Mediateca Motori di ricerca non solo Google
Formazione Volontari SCN 2011 Centro Linguistico di Ateneo - Mediateca
che cos’è un motore di ricerca il termine ricerca (search) in informatica significa esaminare il contenuto di un pc, di un disco, di un file o di una rete di computer per trovare informazioni volute il termine motore sta ad indicare qualcosa che fornisce la forza per un movimento, un sistema, una azione... un motore di ricerca è qualcosa in base a termini che noi inseriamo (motore di ricerca per parola) restituisce una serie di informazioni / documenti un motore di ricerca su Internet è un software che raccoglie informazioni, le organizza in database e in base alle parole inserite restituisce elenchi di pagine web in un certo ordine Centro Linguistico di Ateneo – Mediateca Scrivere in rete
tipi di motori di ricerca motori di ricerca generali, basati su indici automatici, senza intervento umano (es. Google) motori di ricerca generali basati su indici controllati dall’uomo, come una web directory (es. Dmoz) motori di ricerca specialistici, basati su indici in parte creati in modo automatico e in parte creati dall’uomo (es. Scirus) motori di ricerca basati su indici semantici (es. Hakia) Centro Linguistico di Ateneo – Mediateca Scrivere in rete
motori di ricerca (automatici) gli spiders girano 24 ore su 24 per la rete cercando contenuti: come un ragno su una ragnatela seguono i link da un sito a un altro, entrano nei siti e raccolgono informazioni da, di e su singole pagine statiche le pagine vengono indicizzate e classificate in archivi dagli indexer in base alle parole rilevate e ai metadati delle singole pagine gli archivi vengono interrogati e viene fornita una lista di siti organizzata in base a determinati criteri (page ranking) per dare le risposte più adeguate Centro Linguistico di Ateneo – Mediateca Scrivere in rete
web directory archivi di siti creato dall’uomo vengono indicizzati siti, non pagine si usano classificazioni controllate, generalmente in forma gerarchica ricerca per parola (non nei siti...) e navigazione tra le varie classi grande attendibilità e qualità però invecchiano spesso e i tempi di controllo sono piuttosto lunghi Centro Linguistico di Ateneo – Mediateca Scrivere in rete
il web invisibile (opaco, nascosto...) quello che Google e gli altri non vedono perché: non sono pagine statiche, vengono create in base a singole richieste (le singole richieste però possono avere dei link) non sono presenti nei link di nessun altro sito o pagina si tratta di reti interne o comunque riservate si tratta di documenti troppo profondi gli spider trovano degli sbarramenti tipo: siti controllati (password, captcha,...) siti con opzioni per la navigazione siti con blocchi dichiarati ecc. Centro Linguistico di Ateneo – Mediateca Scrivere in rete
il web invisibile (opaco, nascosto...) è quello che i motori di ricerca non vedono Centro Linguistico di Ateneo – Mediateca Scrivere in rete
cos’è un motore di ricerca specialistico cerca singole pagine e documenti di aree o settori specifici funziona come un motore di ricerca automatico i siti dove cercare sono scelti dall’uomo qualità e attendibilità sono garantite in proporzione alle presenza o meno di controlli sui siti spesso sono commerciali o hanno fini commerciali spesso indicizzano parte del web invisibile spesso hanno classificazioni / indicizzazioni Centro Linguistico di Ateneo – Mediateca Scrivere in rete
motori di ricerca semantici generalizzano le parole di ricerca e le contestualizzano permettono di inquadrare la parola nell’ambito che ci interessa cercano di dare risposte “logiche” e organizzare i risultati ricerca della qualità contro la quantità differenti sistemi per selezionare i siti: core sites, page vector, ecc. spesso interagiscono con strumenti di social web / folksonomies Centro Linguistico di Ateneo – Mediateca Scrivere in rete
motori di ricerca semantici Hakia basato su una tecnologia “core” su diversi segmenti (web, news, blog, siti affidabili, video, ecc.I Teoma - prova ad aggiungere ai normali risultati di un motore di ricerca i siti più popolari tra gli esperti e in base alle domande già poste Wolfram Alpha - non un motore di ricerca vero e proprio ma un repository (sempre aggiornato) che utilizza algoritmi basati sul linguaggio naturale Credo – Conceptual REorganization of Documents, basato sul motore di ricerca di Yahoo organizza le risposte per aree tematiche Centro Linguistico di Ateneo – Mediateca Scrivere in rete
motori “specialistici” per tutti i gusti filtrano le domande in base a criteri predefiniti (tipo risorsa, settoriali, di utilizzo, di area geografica, ecc. ecc.) più che motori portali o metamotori che usano i motori veri e propri liste: motori su misura ...risorse linguistiche ;-)...risorse linguistiche ;-) Centro Linguistico di Ateneo – Mediateca Scrivere in rete