Se non sai, sappi dove (e come) cercare!

Slides:



Advertisements
Presentazioni simili
Training On Line - CONP. 2 Richiesta Da Menu: Conferimenti ad inizio anno termico > Agosto > Pluriennali > Nuova Richiesta Si accede alla pagina di Richiesta.
Advertisements

Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Caduta non guidata di un corpo rettangolare in un serbatoio Velocità e rotazione.
1 Tutto su liceoclassicojesi.it 1° Incontro sulla gestione di liceoclassicojesi.it.
CALENDARIO FORMAZIONE LISEM 2004/2005 Labirinto, test sul potenziale imprenditoriale 01/10/2004 (ven) h – Tecniche creative e pensiero propositivo.
1 MeDeC - Centro Demoscopico Metropolitano Provincia di Bologna - per Valutazione su alcuni servizi erogati nel.
TAV.1 Foto n.1 Foto n.2 SCALINATA DI ACCESSO ALL’EREMO DI SANTA CATERINA DEL SASSO DALLA CORTE DELLE CASCINE DEL QUIQUIO Foto n.3 Foto n.4.
IlTrovatore S.p.a. IlTrovatore RemoteSearch IlTrovatore mette a disposizione di portali Internet, piccole e medie imprese, tutto il suo know-how nel settore.
1 Pregnana Milanese Assessorato alle Risorse Economiche Bilancio Preventivo P R O P O S T A.
DBMS (DataBase Management System)
Informatica Modulo 4 – Ricerca di informazioni nel web.
Francesco Cristofoli Microsoft Italia
LA PIATTAFORMA FAD FORTECHANCE
P D Docente Progetto Microsoft® Docenti coinvolti nel progetto:
Corsi per il personale Bicocca-Insubria
Frontespizio Economia Monetaria Anno Accademico
"In Internet non siamo in grado di selezionare, almeno a colpo docchio, fra una fonte credibile e una folle. Abbiamo bisogno di una.
Ricercare in Internet Lago nel pagliaio INTERNET Quasi ogni volta in cui hai sentito parlare di Internet o del World Wide Web hai probabilmente sentito.
EDITORIA ON-LINE INDAGINE FRA I SOCI ANES settembre - dicembre 2006 A cura della Segreteria ANES.
Programmazione 1 9CFU – TANTE ore
ELEZIONI REGIONALI 2010 PRIMI RISULTATI E SCENARI 14 aprile 2010.
1 Il servizio di prestito e fornitura documenti ILL-SBN una visione di insieme caratteristiche della procedura illustrazione delle funzionalità
Canale A. Prof.Ciapetti AA2003/04
Ufficio Studi UNIONCAMERE TOSCANA 1 Presentazione di Riccardo Perugi Ufficio Studi UNIONCAMERE TOSCANA Firenze, 19 dicembre 2000.
La Ricerca in Rete Danco Singer novembre 2002 novembre 2002 Master in Editoria Multimediale La Ricerca in Rete: strategie di navigazione.
CORSO DI RICERCA BIBLIOGRAFICA 3. giornata (26 ottobre 2007) Inspec Web of Science.
La partita è molto combattuta perché le due squadre tentano di vincere fino all'ultimo minuto. Era l'ultima giornata del campionato e il risultato era.
Lautore e il ricercatore nellambiente digitale 2. edizione 12 aprile 2007 Introduzione al Portale AIRE A cura di Cristina Capodaglio (Biblioteca del Dipartimento.
Laboratorio di Informatica
Cercare informazioni sul Web. 5-2 Organizzazione dellinformazione tramite gerarchie Classificazione gerarchica Linformazione è raggruppata in un piccolo.
IPOGLICEMIA PARTE I : Quando si ha una crisi ipoglicemica
Cos’è un problema?.
Guida alla costruzione di siti attraverso la rete ________________________ A cura dellUfficio Comunicazione Pag.1/31 CON LEUROPA INVESTIAMO NEL VOSTRO.
STILI DI APPRENDIMENTO ED EVOLUZIONE INTERFACCE
1 RISORSE DISPONIBILI PER GLI UTENTI B.A.U. Orientamento bibliografico – II modulo.
Portale Capacità STOGIT
2 3 4 RISERVATEZZA INTEGRITA DISPONIBILITA 5 6.
ISTITUTO COMPRENSIVO TORREGROTTA REPORT DATI QUESTIONARIO Alunni Scuola Primaria Classe V A.S.2012/2013.
Cos’è Internet Una rete globale di reti basata sul protocollo TCP/IP.
Test Reti Informatiche A cura di Gaetano Vergara Se clicchi sulla risposta GIUSTA passi alla domanda successiva Se clicchi sulla risposta ERRATA passi.
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
ISOIVA (LOCALE) TO ISOIVA (WEB) RIPARTIZIONE INFORMATICA UFFICIO APPLICATIVI AMMINISTRATIVI 13/04/2011 UNIVERSITÀ DEGLI STUDI DI FERRARA 1.
ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE.
CORSO AVANZATO INFORMATICA
Internet Ricerche nel web Gli indici sistematici (directory)
TECNOLOGIE DELLINFORMAZIONE E DELLA COMUNICAZIONE PER LE AZIENDE Materiale di supporto alla didattica.
ISTITUTO COMPRENSIVO “G. BATTAGLINI” MARTINA FRANCA (TA)
Motori di Ricerca presente e futuro prossimo
Protocollo informatico: interoperabilità e PEC
Bando Arti Sceniche. Per poter procedere è indispensabile aprire il testo del Bando 2ROL - Richieste On Line.
Gli internauti italiani e il consumo di informazioni tramite media classici e new media UNA RICERCA QUANTITATIVA SVOLTA DA ASTRA RICERCHE PER LORDINE DEI.
LE SAI LE TABELLINE? Mettiti alla prova!.
QUIZ – PATENTE EUROPEA – ESAME WORD
1 Questionario di soddisfazione del servizio scolastico Anno scolastico 2011/2012 Istogramma- risposte famiglie.
Un trucchetto di Moltiplicazione per il calcolo mentale
Fondamenti delle Reti di Computer Seconda parte Carasco 15/04/2010.
21 marzo 2002 (ri-)Avvisi: Giovedi 28 marzo la lezione e sospesa. Nuovo indirizzo di Spedire messaggi e esercizi solo.
Prima rilevazione sullo stato di attuazione della riforma degli ordinamenti nelle istituzioni scolastiche in LOMBARDIA Attuazione del D.L. 59/2003 a.s.
GLI OBIETTIVI DELLA RICERCA
Esempi risolti mediante immagini (e con excel)
Sviluppare un programma in C che, dato un array da 100 elementi interi caricato con numeri casuali compresi tra [10,100], sia in grado di cercare il valore.
Università degli studi di Roma la Sapienza --- Laboratorio di Basi di Dati II - a.a. 2003/04 Presentato da: CAU Simone Matricola:
NO WASTE Progetto continuità scuola primaria scuola secondaria Salorno a.s. 2013_
a cura di Francesco Lattari
A.P. cat. B - 1 Per chi vuole: Libro di testo D.P. Curtis, K. Foley, K. Sen, C. Morin Informatica di base 2° edizione Mc Graw-Hill Companies.
1 Microsoft Access Gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni Informatica per laurea triennale.
Realizzazione Sito Web
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
MOTORI DI RICERCA. Un motore di ricerca è un sistema automatico che analizza un insieme di dati spesso da esso stesso raccolti e restituisce un indice.
Comunicazione Multimediale Letizia Catarini. La differenza tra un motore di ricerca e una directory La differenza tra un motore di ricerca e una directory.
1 Consigli ai Naviganti: Funzioni di Base Concetti base del web, utilizzo dei principali motori di ricerca, creazione di account di posta elettronica.
Transcript della presentazione:

Se non sai, sappi dove (e come) cercare! Motori di Ricerca Se non sai, sappi dove (e come) cercare!

Motori ! V1.1 05/2003 Il web oggi dimensioni, lingue etc. Glossario di ricerca Motori, metamotori, integratori Come funzionano, Come si utilizzano Directory Newsgroups

2002: 6 miliardi di pagine presenti cip: Enorme! Dimensioni del Web 2002: 6 miliardi di pagine presenti 2004: 100 miliardi di pagine Oltre 8 milioni di siti (ott. 2001) , 73% in inglese, 7% in tedesco …

cip: Web: in Italiano “ragnatel” IL WEB!

Il Web oggi (2002): alcune informazioni Degli 8.4 milioni di siti, 3.1 milioni sono classificati come siti pubblici (i.e. siti il cui contenuto è liberamente accessibile al pubblico), 2.1 come privati (accesso ristretto) e 3.2 provvisori o in uno stato transitorio (non terminati) 10% di link “morti” (dead links)

Web: Info Lingue: Inglese 73%, tedesco 7%, giapponese 5%, francese e spagnolo 3% (e l’Italiano?) Il 47% dei siti pubblici sono negli USA

Quanto è grande Internet? cip: dati 2001 Quanto è grande Internet? “Surface” web (SW, circa 2,5 Miliardi di documenti) “Deep” web (DW) circa 500 volte più grande SW cresce di circa 7 milioni di pagine al giorno Media di 20KB per pagina

Quanto è grande Internet? DW= SW più DB (Data Bases), pagine dinamiche, Intranets … I due DB più grossi accessibili sono il “National climatic data center” www.ncdc.nooa.com e la NASA (circa 585 Terabytes di Informazione

Tipi di documenti nel web Pagine Html PDF (adobe Acrobat) DOC (Microsoft Word) PS (Adobe Postscript) PPT (Microsoft Powerpoint) XLS (Microsoft Excel) RTF (Rich Text Format)

Utenti e lingue Internet cip: e il “cinese”? Utenti e lingue Internet Solo circa il 50% degli utenti Internet è di madrelingua Inglese Il 78% dei siti e il 96% dei siti di e-commerce è in Inglese Traduttori…. E-mail: circa 2000 miliardi di messaggi all’anno (spam)

Glossario (1) Ricerca Booleana Una ricerca che permette la inclusione o la esclusione di documenti che contengono certe parole tranite l’uso di operatori come AND, NOT e OR. Ricerca Concettuale La ricerca di documenti che sono in relazione con una parola, piuttosto che di quelli che la contengono specificamente. Indice “Full-text”: un indice che contiene ogni parola di ogni documento, incluse le “stop words” Fuzzy search: Una ricerca che trova risultati anche quando le parole sono scritte parzialmente o male.

Glossario (2) Indice: Il catalogo dei documenti creato dal motore di ricerca (chiamato anche catalogo) Ricerca per parole chiave (Keyword search): una ricerca di documenti che contengono una o più parole specificate dall’utente. Ricerca di una Frase: Ricerca di documenti che contengono una frase (sentence) esatta. Precisione: Quanti dei documenti segnalati effettivamente rispondono alla richiesta fatta. Per esempio, se un motore lista 80 documenti ma solo 20 di essi contengono le parole cercate, la sua precisione è del 25%

Glossario (3) Ricerca di Prossimità: Una ricerca in cui le parole cercate devono essere vicine fra di loro. Query-By-Example: Ricerca in cui si richiedono ulteriori documenti simili ad un particolare documento "find similar." Rilevanza: Quanto un documento fornisce l’informazione cercata.

Glossario (4) Motore di ricerca: Il software che cerca in un indice e fornisce i risultati.Spesso viene usato come sinonimo di Spider e Crawler anche se si tratta di componenti separati. Spider: Il software che esplora pagine web e le aggiunge ad un indice seguendo i collegamenti (Iperlink). Anche “Crawler” Stemming: La capacità in una ricerca di includere la radice delle parole ad es nuotatore… nuoto

Glossario: (5) Stop words: congiunzioni, preposizioni articoli e altre parole come “e, a, un, il” che appaiono frequentemente nei documenti ma significano poco. Thesaurus: Una lista di sinonimi che un motore può utilizzare quando cerca particolari parole anche se i termini cercati non appaiono nei documenti.

Motori di ricerca: come operano Programmi robot (crawler, Spider o indicizzatori) che aggiornano automaticamente gli indici del motore di ricerca Le informazioni non vengono “filtrate” Aggiornamenti costanti e precisi Raccolgono le informazioni su tutte le pagine web dei siti e non solo sulla Home Page Enormi DataBase

Motori di ricerca: categorie Motori (Altavista, Google, Hotbot, Ask Jeeves, etc etc.) Metamotori (Metacrawler…) “Integratori” (Copernic o altri)

Motori, metamotori etc Funzionano in maniera diversa Sia come indicizzazione che come utilizzo Informazioni su... www.Searchenginewatch.com www.motoridiricerca.it Motori che usano linguaggio naturale (ask jeeves) www.ask.com

Differenti caratteristiche dei motori Da http://www.searchenginewatch.com/facts/ataglance.html Caratteristiche comuni (esempi) Includi “+” Escludi “-” Frase “xxxx” Caratteristiche Non comuni Nesting: pizza AND (pomodoro OR acciughe) Minuscole maiuscole “near” pizza near pomodoro *paolo --->(pierpaolo gianpaolo etc.)

Motori: alcune specificità cip: ? Motori: alcune specificità Esempi: Il qualificatore “Near” è gestito da Altavista (10 parole), Lycos (25 parole) e basta… Paol* non gestito da Google http://www.motoridiricerca.it/tabella.htm

Rilevanza: Come viene dato peso alle pagine web Come fanno i motori a stabilire la rilevanza dei risultati? Usano algoritmi proprietari (e segreti) con le seguenti regole generali Posizione delle parole e Frequenza Esempio del bibliotecario e “viaggi”, prima i libri con la parola viaggi(o) nel titolo. (tag <title>) Si cerca anche che la parola appaia nelle prime righe della pagina.

Frequenza La Frequenza è il secondo criterio per determinare la rilevanza. Motori diversi, diverso numero di pagine indicizzate, diversa frequenza di visita, diverso tempismo, dunque risultati diversi. I Meta tags, non sono letti da tutti i motori e sono comunque trattati in modo differente Penalizzazione dello spamming, lotta continua con i webmasters, incluse le lamentele degli utenti.

Come funziona, il peso dato alle pagine Fattori “fuori pagina” (Off The Page) Analisi dei link può determinare l’argomento e l’importanza (punteggio) Quante volte viene cliccato un certo risultato? Il Punteggio cambia (+ o -) Vedere il Search Engine Features Chart e il Search Engine Design Tips su www.searchenginewatch.com. http://www.searchenginesinfo.com/

I motori “di moda” Google Altavista Motori italiani (Yahoo, america online ed altri usano google)

Usenet newsgroups Oltre 35000 (100.000?) gruppi di discussione Testo, no multimedia (*) Protocollo NNTP Esistono da molti anni prima del “Web” e del browser Utilissimi Soprattutto le “Faq” (frequently asked questions) Storia dall’81 su Google

Usenet Newsgroups Accessibili tramite un Newsreader ( in netscape, Outlook o altro) si specifica un newsserver (p. es. “News.tin.it”) e ci si “abbona” ai newsgroups a scelta. Contengono discussioni su temi disparati. Usa il protocollo NNTP Accesso tramite web browser su google o altavista www.faq.org http://www.google.it/grphp?hl=it

Newsgroups importanti News.answers Comp.answers

Tre miliardi di documenti indicizzati Due miliardi di pagine web, Er meio! furbo e potente Tre miliardi di documenti indicizzati Due miliardi di pagine web, 300 milioni di immagini 700 milioni di usenet posts Dati 2002

Google Copia cache Ricerca nei risultati Traduzione (Beta test) Maiuscole minuscole “And” automatico “Mi sento fortunato” Newsgroups

Google traduzioni !!!!!

Google immagini!

Altri servizi Google Froogle Catalogs! News etc.

Cercando sul web Portale: sito di accesso alla rete, con directory, news, servizi, giochi, chat, etc. Directory: comprendono collezioni di siti organizzati per categorie omogenee Motore di ricerca: mettono a disposizione un archivio di pagine web

Portale

Directory correlate da una breve descrizione Fornisce liste di siti suddivisi in categorie correlate da una breve descrizione Categorie e descrizioni sono raccolte da persone specializzate (web surfers) secondo il proprio giudizio Gli aggiornamenti dipendono dai tempi “umani”

Quale strumento usare? Web Directory Motore di ricerca Usa una categoria per trovare siti con offerte di lavoro. Usa il motore di ricerca per trovare un impiego particolare che vada bene per le tue capacità. Usa una categoria per trovare siti che parlano di musica. Usa il motore di ricerca per le ultime novità su un cd appena uscito. Usa una categoria per trovare le agenzie di viaggio. Usa il motore di ricerca se cerchi un itinerario particolare. Usa una categoria per avere una lista dei siti dei maggiori quotidiani. Usa il motore di ricerca per trovare una citazione da un articolo. Usa una categoria per trovare il sito di un personaggio famoso. Usa il motore di ricerca per trovare una persona di cui conosci solamente il nome. Usa una categoria per trovare per trovare un sito di ricette. Usa il motore di ricerca per trovare una particolare ricetta.

Le directories di AltaVista

Le directories di Google

Metamotori: Fanno lavorare gli altri Utili per uscire dal tran tran Per trovare più informazioni Ultima spiaggia?

Metacrawler

Integratori come Copernic Molto utile www.copernic.com Sottomette le richieste a vari motori, aggiungendo del suo.. Ricerca per categorie Opera in locale sul tuo PC. Versione base gratuita

Copernic (“Integratore”)

Copernic, un gioiello! Copernic usa siti specifici, ritiene che ci siano info più pertinenti/più aggiornate Info che i normali motori non trovano! Categorie: MP3s, notizie locali, enciclopedie, giochi, downloads, viaggi etc.

Copernic La versione base opera una metaricerca che prende i risultati da molti altri motori AltaVista, Excite, Fast Search, Lycos, WebCrawler, MSN Web Search, Yahoo!, Hotbot, GoTo, FindWhat e l’ Open Directory Project. (….) Validazione “dead links”, ricerche su categorie (enciclopedie, immagini, mp3, indirizzi di posta…)

Motori e pubblicità Normale pubblicità (banners) Come “Quattroruote” e la Fiat? Pagamenti per alzare il punteggio delle pagine Trasparenti o no. Paid placement e Paid inclusion

Non dimentichiamo i siti specializzati: esempi GSMbox.it Html.it Pignascuola.it www.istruzione.it www.mit.edu Findarticles.com Elibrary.com

Morale: Motori diversi; tecniche diverse Scegline almeno un paio Studiateli BENE Usa i metamotori e gli “integratori” Cercate nei siti specializzati Ah, … l’inglese è importantissimo!!

Esercizi Su Altavista elenca le categorie di documenti che si possono ricercare. Cerca la stessa cosa su Altavista e su Google, valuta le differenze Prova metacrawler e paragonalo ad AV e Google Trova immagini su google usando la ricerca avanzata

Esercizi II Trova altri metamotori oltre a metacrawler Studia la ricerca avanzata su google e su Altavista, elenca le principali differenze http://www.google.it/intl/it/help.html

Esercizi (Newsgroups) Attiva il newsreader di explorer, specifica come News server “News.tin.it” Scegli un paio di newsgroups a piacere e abbonati, leggi i posts. Cerca nei newsgroups italiani una fiat punto (o altro veicolo) in vendita. Trova un newsgroup di prova italiano ed inserisci un messaggio di prova Visita i Newsgroups News.answers e comp.answers Cosa contengono?) Cerca la FAQ sui newsgroups Italiani e leggila

Esercizi III Ricerca sia su google che su altavista foto di “gatto” e “cat” (per esempio), valutare le differenze numero di foto trovate, pertinenza etc. Cerca un dizionario di inglese online (possibilmente parlante) su web Prova l’opzione “pagine simili” di google Cerca siti web contenenti informazioni sull’esame di maturità

Esercizi IV Inserisci gli opportuni metatags nelle tue pagine web Cerca i metatags nei sorgenti di pagine web note. Trova una pagina web molto pesante Prova cosa “aggiunge di suo” copernic Cerca a chi è intestato il dominio www.itismeucci.it

Esercizi V Trova un filmato realmedia “streamabile” sotto i 56Kbps e visualizzalo, Trova informazioni sul funzionamento di “carnivore”, il sistema CIA di sorveglianza della posta elettronica.

Quando non sai, sappi dove (e come) cercare! Motori di Ricerca Quando non sai, sappi dove (e come) cercare!

Fine

Altavista: Uso della funzionalità di ricerca avanzata Digitare le parole chiave o le espressioni “booleana” nella casella ricerca Specificare la modalità di visualizzazione nel menù “Ordina per” Specificare l’intervallo di tempo che si vuole usare per la ricerca Selezionare dal menù la lingua desiderata Selezionare “siti italiani” o “su tutto il web” Cliccare sul pulsante “Cerca”