Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Relatore:Candidato:

Slides:



Advertisements
Presentazioni simili
L'energia nei paesi in via di sviluppo Ralph Gebauer Monday, May 31 st, 2010 Le filiere dell'energia Fondazione Internazionale Trieste.
Advertisements

Estrazione di informazioni da testo. Perchè occuparsene? E unapplicazione particolarmente complessa. Sfrutta la maggior parte delle risorse utilizzate.
ASP .NET & Web Service: Introduzione
Luca Bianchi Windows Development Day Bologna 28 gennaio 2005 SQL Server Desktop Engine (MSDE) & SQL Server 2005 Express.
Strumenti di sviluppo Microsoft Campagna incentivi per Software Assurance Opportunità di vendita.
Modalità di ricerca semantica nelle Biblioteche digitali Maria Teresa Biagetti DIPARTIMENTO DI SCIENZE DOCUMENTARIE LINGUISTICO-FILOLOGICHE E GEOGRAFICHE.
XSLT UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re Anno Accademico
WSDL (Web Services Description Language) Laurea Magistrale in Informatica Reti 2 (2006/07) dott. Federico Paoloni
1 Integrazione di Sorgenti HTML in MOMIS: Analisi Comparativa degli Strumenti Esistenti Integrazione di Sorgenti HTML in MOMIS: Analisi Comparativa degli.
Progetto e sviluppo del wrapper EDIFACT per il sistema MOMIS Relatore: Chiar.mo Prof. Sonia Bergamaschi Relatore: Chiar.mo Prof. Sonia Bergamaschi Correlatore:
UNIVERSITÀ DEGLI STUDI G. dAnnunzio Facoltà di Lingue e Letterature Straniere LANCASTER UNIVERSITY Department of European Languages and Cultures 11 aprile.
Microsoft Robotics Studio Marco Petrucco Microsoft Student Partner - Udine.
EJB Enterprise Java Beans B. Pernici. Approccio Java.
Model – View - Controller
EJB Getting started Database: MySql Application Server: Pramati Server Ambiente di sviluppo: Pramati Studio 3 Applicazione esempio: Logon Trento, 30/10/2002.
Biometry to enhance smart card security (MOC using TOC protocol)
Corso di Laurea in Ingegneria Elettronica - U niversità di N apoli F EDERICO II Autori XXXXX XXXXXXX YYYYY YYYYYYY ZZZZZ ZZZZZZZ Titolo tesina Parte X:
Lincidenza dei tumori Italia: stato dellarte Emanuele Crocetti e AIRT Working group Reggio Emilia, 7 aprile 2006.
Introduzione alle griglie computazionali - a.a LEZIONE LEZIONE N. 12 Grid Monitoring modello GMA GridICE GridICE demo Introduzione alle griglie.
Avis Contact Centres Review
2000 Prentice Hall, Inc. All rights reserved. 1 Capitolo 3 - Functions Outline 3.1Introduction 3.2Program Components in C++ 3.3Math Library Functions 3.4Functions.
Array Ricerca Ordinamento Fusione Nicola Fanizzi Laboratorio - Corso di Programmazione (B) C.d.L. in Informatica DIB - Università degli Studi di Bari.
FONDAMENTI DI INFORMATICA III WfMC-1. FONDAMENTI DI INFORMATICA III WfMC-2 WFMC Cose WfMC Workflow Management Coalition (WfMC), Brussels, è unorganizzazione.
ROLLIO PER UN VEICOLO INFINITAMENTE RIGIDO
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea in Informatica Sandra Mantovani Relatore:
1 Titolo Presentazione / Data / Confidenziale / Elaborazione di... ASP. Net View State e controlli Elaborazione di Franco Grivet Chin.
Elementi di programmazione ad oggetti a. a. 2009/2010 Corso di Laurea Magistrale in Ingegneria Elettronica Docente: Mauro Mazzieri, Dipartimento di Ingegneria.
SOURCE TERM ON NPP SAFETY ANALYSES Marino Mazzini Professore Ordinario nel s.s.d. Impianti Nucleari Università di Pisa Facoltà di Ingegneria Dipartimento.
The International Nuclear Event Scale (INES)
UNIVERSITA DEGLI STUDI DI ROMA La Sapienza F ACOLTÀ DI S CIENZE M ATEMATICHE, F ISICHE E N ATURALI C ORSO DI L AUREA S PECIALISTICA IN I NFORMATICA F ORMAL.
PASTIS CNRSM, Brindisi – Italy Area Materiali e Processi per lAgroindustria Università degli Studi di Foggia, Italy Istituto di Produzioni e Preparazioni.
UNIVERSITÀ DEGLI STUDI DI BARI FACOLTÀ DI SCIENZE MATEMATICHE, FISICHE E NATURALI CORSO DI LAUREA IN INFORMATICA TESI DI LAUREA IN METODI AVANZATI DI PROGRAMMAZIONE.
CORSO PER OPERATORI DI COMUNITA BIENNIO 2004/2005 Vicenza, 19 marzo 2004 Direzione Regionale per i Servizi Sociali Servizio Prevenzione delle Devianze.
Calcolo di Modelli Stabili Attraverso la Semplificazione di Programmi Logici Fabrizio Magni Relatore: Prof.ssa Stefania Costantini Corelatore: Dott. Alessandro.
Progetto Rover – Fase 1. Obiettivo e Vincoli Obiettivo è creare applicazione capace di controllare in remoto un Rover, dotato di torretta sensoriale e.
Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione.
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria “Enzo Ferrari” – Sede di Modena Corso di Laurea Specialistica in Ingegneria Informatica.
Filtered Index and Statistics Filtered Indexes Sergio Govoni
Università degli studi di Roma La Sapienza Facoltà di Scienze Matematiche Fisiche E Naturali Corso di Laurea in Tecnologie Informatiche Presentazione Relazione.
DA NATIVI DIGITALI A INTERNAUTI CONSAPEVOLI
Il Booking Engine Html di HermesHotels è studiato per permettere I-Frame sui siti degli Hotels. Disponibile anche in modalità Pop- Up https, simile.
Gli elementi della valutazione 2 Che cosa contiene un giudizio di valutazione?
Il modello ECM –CPD lombardo nel sistema sanitario regionale
UNIVERSITA’ DEGLI STUDI DI NAPOLI FEDERICO II
Firenze – Festival della Creatività 2009 Comm.it s.r.l. – Ing. Davide Rogai, Ph.D. – Software >> eyelander tracking semplice con il tuo cellulare.
UNIVERSITÀ DEGLI STUDI DELLINSUBRIA Facoltà di Scienze matematiche, fisiche e naturali Corso di Laurea in SCIENZE DELLA COMUNICAZIONE Dott. Nicola AMATO.
INTERNET Internet è una rete a livello mondiale che permette alle persone di comunicare ed ad accedere a banca dati da qualunque parte del mondo e su qualunque.
AgentGroup MEnSA Project - Future work Agent and Pervasive Computing Group Dipartimento di Ingegneria dellInformazione Università degli Studi di Modena.
Sistema Informativo Demanio Idrico marzo Per aumentare lefficienza del servizio abbiamo realizzato un sistema in grado di gestire in modo integrato.
Andrea Petricca Problematiche di rete nella sperimentazione di file-system distribuiti su WAN per applicazioni di GRID-Computing Rapporto trimestrale attività
INTERNET Antonio Papa Classe 2^ beat I.S.I.S. G. Meroni a.s. 2007/2008.
System for Card DOCUMENTO PROGRAMMATICO SULLA SICUREZZA Presentazione del Servizio ASP di System for Card.
PROGETTO DI STRUMENTI PER LA CONFIGURAZIONE DI APPLICAZIONI JAVA ENTERPRISE Anno Accademico 2006 / 2007 Sessione III FACOLTÀ DI INGEGNERIA CORSO DI LAUREA.
LA SICUREZZA NELLE AZIENDE OSPEDALIERE, ELEMENTI PER ELABORARE UN BILANCIO A ree di eccellenza e bilancio di attività nella prevenzione sul lavoro in azienda.
UNIVERSITÀ DEGLI STUDI DI PAVIA FACOLTÀ DI ECONOMIA, GIURISPRUDENZA, INGEGNERIA, LETTERE E FILOSOFIA, SCIENZE POLITICHE. Corso di Laurea Interfacoltà in.
Attribution-NonCommercial-ShareAlike Le novità
Attribution-NonCommercial-ShareAlike Le novità
MARKETING DIGITALE E SOCIAL MEDIA NELLE ATTIVITA Dİ COMUNICAZIONE DEL PALINSESTODEL CANALE TV CIELO: STRATEGIE E METODI Relatore: Prof. Claudio Bellinzona.
CHI SIAMO è una società di consulenza. Il nostro CORE BUSINESS è costituito dallattività di: PROJECT MANAGEMENT, SYSTEM INTEGRATOR in ambiente SAP WEB.
Curriculum in International Economics and Business
Enzo Anselmo Ferrari By Giovanni Amicucci. Di Enzo Questo è Enzo Anselmo Ferrari. Enzo compleanno è diciotto febbraio Enzo muore è quattordici agosto.
Visual Studio Tools for Office: Developer Solutions Platform Fulvio Giaccari MCSD.NET / MCT Responsabile Usergroup ShareOffice Blog:
Giovedì 17 Aprile 2008 Heroes {Community} Launch Giovedì 17 Aprile 2008.
20 maggio 2002 NETCODE Set up a thematic network for development of competence within the Information Society.
1 Basi di dati (Sistemi Informativi) Scuola di Dottorato in Scienze Veterinarie per la Salute Animale e la Sicurezza Alimentare a.a Ing. Mauro.
Analysis and Development of Functions in REST Logic: Application to the «DataView» Web App UNIVERSITA’ DEGLI STUDI DI MODENA E REGGIO EMILIA DIPARTIMENTO.
Introduction to automatic ABMs documentation Keywords: Doxygen ODD protocol MASON documentation Simone Romano.
Sistemi di elaborazione dell’informazione Modulo 3 -Protocolli applicativi Unità didattica 4 - Protocolli del Web Ernesto Damiani Lezione 3 – Esempi HTTP.
Interrogazioni private di database mediante Filtri di Bloom:
המים בגוף האדם. מגישות:קרישטל אירית אנגיל עירית.
Transcript della presentazione:

Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Relatore:Candidato: Prof. Sonia BergamaschiSimone Ferrari Anno Accademico 2005 – 2006 Information Extraction: il rapporto GATE – Named Entity Recognition

Iter seguito Differenziazione Information Retrievial – Information Extraction Discussione Information Extraction Named Entity Recognition Descrizione GATE ANNIE Applicazione a siti web di GATE per NER Valutazione prestazioni Conclusioni e sviluppi futuri

Information Retrievial vs Information Extraction Sistema IR Input: insieme di documenti (corpus) + query (key words) Output: documenti rilevanti + score Sistema IE Input: insieme di documenti (corpus) + query (key words) Output: frammenti dei documenti con informazioni poco ambigue in formato prestabilito Vantaggi IE: minor tempo danalisi formato delloutput Svantaggi IE: difficoltà dimplementazione in alcuni casi meno accurato rispetto alla lettura umana

Information Extraction Concetto nato allinterno delle MUCs In MUC (1998) - Named Entity recognition (NE) - Coreference resolution (CO) - Template Element construction (TE) - Template Relation construction (TR) - Scenario Template production (ST) Successore di MUC : ACE (1999) Jim bought 300 shares of Acme Corp. in 2006

GATE a General Architecture for Text Engineering Hamish Cunningham (University of Sheffield) versione 1 nel 1996; versione 3.1 su algoritmi + dati + GUI = applicazioni Language Resources (LRs) Processing Resources (PRs) Visual Resources (VRs) = CREOLE a Collection of REusable Objects for Language Engineering

ANNIE A Nearly New IE system contiene al suo interno le PRs Tokeniser Gazetteer Sentence Splitter POS Tagger Semantic Tagger OrthoMatcher (NameMatcher)

Attività sperimentale NER utilizzando GATE applicato a siti WISDOM ( output codice prestazioni modifiche e prestazioni2

Booking.com Input Output

XML Booking.com Attività preliminare del Tokeniser BOOKING. COM online hotel reservations (…) Serialized Nodes Creazione dellannotation set di default da parte del Tokeniser rule1 Location1 rule2 LocFinal locType city matches <Value className="java.util.ArrayList" itemClassName="java.lang.Integer">2567;2568;2686 Berlin majorType location minorType city Berlincity.lst:location:city

Valutazione delle prestazioni Tramite lAnnotationDiff Tool di GATE consente di confrontare due set di annotazioni Confronto prestazioni di GATE nellIE: inglese vs italiano inglese referenziato vs inglese italiano referenziato vs italiano

Inglese referenziato vs Inglese Default Modifiche: Norwalk, Loulècity.lst; Tuscanyregion.lst; PT country_cap.lst Dopo 48,84%58,14% Miss rimanenti: mancanza di regole adeguate

Conclusioni e sviluppi futuri Sistema GATE fornito in modalità primitiva: necessità di un raffinamento (Gazetteer, POS e Semantic Tagger) Training pesante (centinaia di testi, mesi) Sviluppo multilingua recente (molto da implementare) PRs sempre più intelligenti background working