KAPPAELLE Problemi Aperti Carlo Tasso LIA - UNiUD Gruppo infoFACTORY
WEB 2.0 Nuovi REQUISITI e nuovi PROBLEMI: verso la Content-based online Business Intelligence A.Monitorare automaticamente siti Web, riviste online, portali tematici, community, UGC (forum, blog, newsgroup), ecc. B.Analisi semantica dei testi: Identificazione dei concetti e relazioni, capire di cosa trattano C.Annotazione Semantica automatica, basata su ontologie di dominio D.Filtraggio semantico personalizzato delle informazioni, superando l’approccio delle “parole chiave” E.Sistemi di classificazione e clustering automatici F.Strumenti di information extraction G.Sentiment Analysis, analisi della polarità delle opinioni H.Social Network Analisys, quantitativa a qualitativa/content-based (capire la struttura del network, identificare diversi gruppi, identificare influencer, ponti, riconoscere contenuti simili per raccomandare e notificare proattivamente, … ) I.Key Performance Indicators significativi per l’analisi
Information Access, Motori di Ricerca: Problemi Aperti Automatic Tagging, semantic mark-up Uso dei tag cloud e delle folksonomie come aiuto alla ricerca, nuove forme di visualizzazione e di elaborazione,… ) Uso di ontologie di dominio per modificare/raffinare una query: –Query costituite da testi –Estraggo i termini della query –Cerco i concetti relativi in WordNet, e disambiguo –Trovo altri termini sinonimici (o in relazione) dall’ontologia del dominio –Estendo la query Ordinamento in base ai concetti del dominio, estratti dall’ontologia Costruzione automatica di Ontologie Monitoraggio della stato dell’arte dei motori di ricerca. Analisi delle tendenze.
Personalizzazione nei siti Web 2.0: Problemi Aperti Strumenti personalizzati per l’ausilio alla ricerca di informazioni (wikipedia) Strumenti di annotazione (oltre ai tag), ed analisi semantica delle annotazioni e tag, basata o meno su ontologie Suggerimenti basati sui contenuti Analisi del comportamento degli utenti, analisi basata sui contenuti Match-making basato sui contenuti e su ontologie Analisi delle opinioni Analisi dei profili utente, sintesi di stereotipi
Towards Information Extraction: Problemi Aperti ‘Intelligent’ scraping Information extraction in Italian Language Opinion Mining, Extraction, Summarization con tecniche NLP ( 07-tutorial-WCM-to-NLP.pdf) Sentiment Analysis per l’Italiano Relation/event extraction Automating Online Business Intelligence, verso la Knowledge Discovery