Introduzione Estrazione di Informazioni dal Web Prof. Paola Velardi.

Slides:



Advertisements
Presentazioni simili
Lezione 12.1: Conclusione e Q&A
Advertisements

TIC per ricerca e condivisione dell'informazione
L’algoritmo PageRank.
Linguaggi di Programmazione e compilatori
1 Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento.
1 SPEGNETE GRAZIE. 2 MATEMATICA (A-L) a.a Numero di crediti :8 Docente:Prof. Gianni Ricci Periodo di svolgimento del corso: primo semestre.
Presentazione del Corso di CALCOLATORI ELETTRONICI
1 Cdl in Educazione Professionale METODOLOGIA delle SCIENZE SOCIALI Dott.ssa Anna Cugno a.a
Ontologie per la costruzione di un portale sull'Adobe.
Elaborazione di Immagini e Suoni Syllabus
PROGRAMMA DEL CORSO DI INFORMATICA (1) Introduzione al corso: obiettivi didattici, modalità di svolgimento, programma e testi di riferimento 1.Introduzione.
PROGRAMMA DEL CORSO DI INFORMATICA (1). TESTO PREVISTO Sciuto, D., Buonanno, G., Gornaciari, W., Mari, L., Introduzione ai Sistemi Informatici 2/ed, McGraw-hill.
Enver Sangineto, Dipartimento di Informatica Multimedia Information Retrieval.
Introduzione Estrazione di Informazioni dal Web Prof. Paola Velardi.
Modeling, managing and accessing e-content Linguistic Computing Laboratory Prof. Paola Velardi.
Prof. Pier Giorgio Ardeni
Informatica A (informatica grafica) Allievi di Ingegneria Civile, L-Z
Presentazione del corso Comunicazione dei diritti e della cittadinanza attiva Prof. Marco Binotto Prof.ssa Gaia Peruzzi.
LA RICERCA BIBLIOGRAFICA NEL SETTORE BIOMEDICO: i motori di ricerca e la gestione dellinformazione biomedica CENTRO DI BIOTECNOLOGIE SETTORE DOCUMENTAZIONE.
Approcci avanzati alla ricerca in rete. La capacità dellutente Information literacy: imparare a cercare su Internet La situazione: –problemi di Internet.
Metodi e tecniche per lE-Tutor nella scuola Modulo 1 – Tecnologie didattiche e comunicazione multimediale APG Attività pratica guidata 16/2/2008.
1 Lezione XXXVI Ma 29-Dic-2005 Informazioni varie.
Calcolo di PageRank: esercizio
Argomenti – Lezione 8 Modulo III --- Calcolo del PageRank Modulo IV --- Costruzione del Dizionario Globale delle Parole.
Informatica e Tecnologie per la comunicazione in rete 1
Concetti di base IR spiegati con l'esempio di Google.
Corso di Laurea in Comunicazione Digitale Corso di Realtà Virtuali - a.a. 2009/10 Prof. Paolo Pasteris Tutor: Stefano Baldan PRESENTAZIONE CORSO Contenuti.
Metodologie di Annotazione Semantica per la Rappresentazione della Conoscenza nellambito dei Beni Culturali Paola Velardi Dipartimento di Informatica Università
Chi è Expert System Da oltre 15 anni Expert System è leader nella realizzazione di soluzioni avanzate di Semantic Intelligence per la gestione "intelligente"
Dipartimento di Sistemi e Informatica
e verifiche intermedie (B) Scienze giuridiche
Diritto del lavoro Prof. Giancarlo Ricci a.a Programmi, esami e verifiche intermedie.
Intelligenza Artificiale
1 Internet e nuove tecnologie Anno Accademico Prof. Flavio De Paoli Dott. Marco Loregian.
Codifica di Testi Il corso e lesame. Argomenti del corso La teoria della codifica XML: introduzione e livello avanzato (DTD, Schema W3C) La Text Encoding.
Studio di euristiche per il miglioramento di algoritmi di ranking per il World-Wide Web Università degli Studi di Milano Corso di Laurea in Informatica.
Applicazioni di modelli matematici alla ricerca semantica
INFORMATICA MATTEO CRISTANI. INDICE CICLO DELLE LEZIONI LEZ. 1 INTRODUZIONE AL CORSO LEZ. 2 I CALCOLATORI ELETTRONICI LEZ. 3 ELEMENTI DI TEORIA DELL INFORMAZIONE.
Il Semantic Web applicato ai percorsi formativi nelle organizzazioni innovative By CSTAdvising CSTAdvising, professionisti della conoscenza,
LA CERTIFICAZIONE DITALS
Sociologia (corso progredito)
Architettura degli Elaboratori
Multimedia Information Retrieval
COMUNICAZIONE ONLINE, RETI E VIRTUALITA MATTEO CRISTANI.
I costi di produzione Lezione XI
Corso di Marketing - Prof. Carlo Nardello
Sistemi basati su conoscenza Gestione della conoscenza Prof. M.T. PAZIENZA a.a
Corso di WebMaster Mercoledì 14 Novembre. Parte I – Introduzione al Corso Lezione 1: Presentazione Descrizione Breve del Corso Semplice Valutazione.
Ugo de'Liguoro - Informatica 2 - Introduzione Informatica 2 Introduzione al corso a.a. 2003/04.
SCHEDA INFORMATIVA DI UNITÀ
Verso un approccio model driven alla simulazione e analisi di scenari di crisi ed emergenza Seminario UTMEA 13 Settembre, 2012 Antonio De Nicola UTMEA-CAL,
Corso di Laurea in Ingegneria dell’Informazione
Prof. Romano Boni Assistente Silvia Torrani ECONOMIA AZIENDALE AA Note Organizzative.
PART 3: DATA ANALYSIS THROUGH OMNIFIND. Il cliente: una sorgente importante di informazioni Mercato iper-competitivo, altamente caotico. Cliente al centro.
DATA MINING PER IL MARKETING Andrea Cerioli Sito web del corso
Linguistica computazionale: task sul linguaggio naturale Cristina Bosco 2015 Informatica applicata alla comunicazione multimediale.
PROGETTO… Internet Providers, registrazione del dominio Costruire una home page … e renderla visibile sul Web.
Prof. Pier Giorgio Ardeni Dr. Andrea Gentili, Dr.ssa Cecilia Tinonin
Laboratorio di Tecnologie dell’Informazione
Progetto ATLAS Campagna di diffusione per lo sviluppo della città sostenibile Flavio Fontana Usability Lab ENEA C.R. Casaccia
KAPPAELLE Problemi Aperti Carlo Tasso LIA - UNiUD Gruppo infoFACTORY.
Corso ICT - SI per la multimedialità Introduzione ai WIS1 Introduzione ai sistemi informativi basati sul Web (WIS)
Linguistica computazionale: come accedere all’informazione codificata nel linguaggio naturale (seconda parte) Cristina Bosco 2014 Informatica applicata.
Prof. Romano Boni ECONOMIA AZIENDALE AA Note Organizzative.
Tecniche di ricerca semantica a supporto del recupero di link di tracciabilità tra artefatti software RelatoreCandidato Chiar.mo Prof. Rocco OlivetoStefano.
UNITÀ DIDATTICA Argomento: Acquisizione ed espansione del lessico ricettivo e produttivo: creazione di un cruciverba multidisciplinare Docente: Colantonio.
Progetto AMBIT: Ottimizzazione e Valutazione Sperimentale del Motore di Ricerca Semantico Basato sul Contesto Università degli studi di Modena e Reggio.
Sport e turismo 1° lezione. Scienze Motorie A.A Sport e Turismo Prof. Giuseppe Russo
Economia e Organizzazione Aziendale canale A-L
Benvenuti al corso di Economia dello sviluppo Paolo Sospiro Università di Macerata Macerata 29 Settembre 2014 Economia dello Sviluppo.
Transcript della presentazione:

Introduzione Estrazione di Informazioni dal Web Prof. Paola Velardi

Argomenti del corso Metodi, strumenti e sviluppi per un migliore accesso alle risorse (documenti, dati, servizi) sul web Il web e le tecniche di accesso esistenti: –Information Retrieval classico (retrieval per parole chiave o keywords) –Web Information Retrieval (retrieval tenendo conto del grafo del web) I nuovi obiettivi del web e la visione del web semantico –Knowledge-based Retrieval (retrieval tenendo conto della semantica) –Mini-corso su Jena (Ambiente di sviluppo per applicazioni avanzate del web)

Information Retrieval (classico) Data una collezione (statica) di documenti, linsieme dei metodi per: –Rappresentare i documenti –Strutturare i documenti in archivi indirizzabili –Associare uno o più documenti ad una richiesta di un utente (query)

Web Information Retrieval La collezione di documenti è enorme Non è statica Non solo documenti: dati, servizi web, multimediali I documenti (pagine web) sono legati fra loro (href): lanalisi di questi collegamenti è rilevante per le operazioni di retrieval

La visione del semantic web Web Information retrieval: classic information retrieval (= keywords) + metodi di rinforzo che tengono conto di altri fattori, es. il grafo del web. Semantic Web: non keywords ma concetti. Obiettivo: rappresentare/manipolare i contenuti (=concetti) delle pagine web (=risorse)

Syllabus Information Retrieval –Definizione e architettura –Metodi di ranking classici (booleano, vettoriale, bayesiano) –Metodi di ranking avanzati (LSI, query expansion) Web Information Retrieval –La ricerca sul web: spiders e robots –Metodi di ranking per il web (Page Rank, Hits) Semantic Web –Ontologie e reasoners –Metodi e strumenti per la costruzione di ontologie –Ambiente di sviluppo: Jena Progetto:annotazione di documenti

Come si svolge lesame Progetto (di gruppo) vale il 60% del voto di esame Prova orale vale il 40% Il 60-70% lezioni frontali Il 40-30% incontri per discutere del progetto (da fine novembre) Pagina web: (prossimamente su TWIKI)