Sommarizzazione e Generazione Fiori Alessandro 12 Ottobre 2013 - Pisa.

Slides:



Advertisements
Presentazioni simili
Trieste, 26 novembre © 2005 – Renato Lukač Using OSS in Slovenian High Schools doc. dr. Renato Lukač LinuxDay Trieste.
Advertisements

LEGAL INFORMATION ON THE WEB: THE ITALIAN SITUATION
Brussels launch of the Association Bruno Trentin-ISF-IRES Fulvio Fammoni President Associazione Bruno Trentin-Isf-Ires (Italy) Brussels, 26 settembre 2013.
Il Marketing Mix e il Modello delle “4 P”
L’esperienza di un valutatore nell’ambito del VII FP Valter Sergo
Cache Memory Prof. G. Nicosia University of Catania
FOXBIT property. The diffusion or disclosure of this document or the contained information without explicit authorization/agreement is prohibited. Any.
Teoria e Tecniche del Riconoscimento
1. Web 1.0 al Web 2.0: come cambiano le modalità del comunicare, la società e la formazione 2. I nativi digitali chi sono e come apprendono: risultati.
1 Teaching Cloud Computing and Windows Azure in Academia Domenico Talia UNIVERSITA DELLA CALABRIA & ICAR-CNR Italy Faculty Days 2010.
Linked Data in Digital Library Nicola Ghirardi - Cineca StarHotels Excelsior Bologna, 23 Maggio 2013.
A. Oppio, S. Mattia, A. Pandolfi, M. Ghellere ERES Conference 2010 Università Commerciale Luigi Bocconi Milan, june 2010 A Multidimensional and Participatory.
Modalità di ricerca semantica nelle Biblioteche digitali Maria Teresa Biagetti DIPARTIMENTO DI SCIENZE DOCUMENTARIE LINGUISTICO-FILOLOGICHE E GEOGRAFICHE.
EBRCN General Meeting, Paris, 28-29/11/20021 WP4 Analysis of non-EBRCN databases and network services of interest to BRCs Current status Paolo Romano Questa.
DG Ricerca Ambientale e Sviluppo FIRMS' FUNDING SCHEMES AND ENVIRONMENTAL PURPOSES IN THE EU STRUCTURAL FUNDS (Monitoring of environmental firms funding.
VOICE and MOISE Projects - Madrid I PROGETTI VOICE E MOISE Presentazione di Giuliano Pirelli European Commission Joint Research Centre Institute for the.
Each student will be able to ask an adult or stranger: What do you like to do? and What dont you like to …?
© and ® 2011 Vista Higher Learning, Inc.4B.1-1 Punto di partenza Italian uses two principal tenses to talk about events in the past: the passato prossimo.
Cancer Pain Management Guidelines
A. Nuzzo U.O. di Oncologia Medica ospedale Renzetti di Lanciano (CH)
Il presente del congiuntivo (the present subjunctive)
Raffaele Cirullo Head of New Media Seconda Giornata italiana della statistica Aziende e bigdata.
SOCIOLOGIA DEI PROCESSI CULTURALI E COMUNICATIVI Prof.ssa Donatella Padua A.A. 2011/12 A.A. 2011/12.
Biometry to enhance smart card security (MOC using TOC protocol)
Corso di Laurea in Ingegneria Elettronica - U niversità di N apoli F EDERICO II Autori XXXXX XXXXXXX YYYYY YYYYYYY ZZZZZ ZZZZZZZ Titolo tesina Parte X:
Ergo : what is the source of EU-English? Standard British English? Standard American English? Both!!!! See morphology (use of British.
LInnovazione di Prodotto. Lo sviluppo di nuovi prodotti e nuovi servizi: una vecchia sfida per le imprese innovative. [emilio bellini]
Directive 96/62/EC - Ambient Air Quality List of air pollutants in the context of air quality assessment and management.
Nanoscience Laboratory Silicon nanophotonics Metamaterials Nanobiotechnologies, antioxidants and human health Few lab members.
Synthema TALeP 2006 Pisa Carlo Aliprandi Language and Speech Solutions Manager Synthema srl.
HERES OUR SCHOOL.. 32 years ago this huge palace was built and it was just the beginning; It is becoming larger and larger as a lot of students choose.
1 Attivita di ricerca Carlo Batini. 2 Aree Come costruire ed esprimere il contenuto informativo integrato di sistemi informativi complessi basati.
Concord A tool for the analysis and concordances of the terminological constituents P. Plini, N. Mastidoro* * - Èulogos, Rome Institute for Atmospheric.
Institute for Atmospheric Pollution – EKOLab Consiglio Nazionale delle Ricerche Environmental Terminology Workshop 2 nd Ecoterm Group Meeting UBA - Umweltbundesamt.
PASTIS CNRSM, Brindisi – Italy Area Materiali e Processi per lAgroindustria Università degli Studi di Foggia, Italy Istituto di Produzioni e Preparazioni.
Ischia, giugno 2006Riunione Annuale GE 2006 Exploiting the Body Effect to Improve Analog CMOS Circuit Performances *P. Monsurrò, **S. Pennisi, *G.
PROJECT MANAGEMENT Comune di Cervia attraverso il CENTRO RISORSE FINANCED PIANI SOCIALI DI ZONA (Legge Quadro 328/00 L.R. 2/03) INTENDED FOR scuole e.
Mobile e Social per portare traffico nei negozi H&m Isabella Federico.
Gli ambienti di apprendimento Firenze, 3 marzo 2006.
1 Ordine dei Farmacisti della provincia di Trento Assemblea Generale ordinaria 26 novembre 2013 Ordine dei Farmacisti della provincia di Trento Assemblea.
Project Review byNight byNight December 6th, 2011.
UNIVERSITÀ DEGLI STUDI DI PAVIA FACOLTÀ DI ECONOMIA, GIURISPRUDENZA, INGEGNERIA, LETTERE E FILOSOFIA, SCIENZE POLITICHE. Corso di Laurea Interfacoltà in.
ROBINSON CRUSOE ROBINSON CRUSOE’S ISLAND L’ ISOLA DI
La Gioconda was painted by which Italian renaissance artist? a) Raphael b) Leonardo da Vinci c) Caravaggio d) Michelangelo.
PLANNING, SPEECH ACTS E DIALOGO Planning:un metodo di soluzione automatica di problemi Planner: un linguaggio per la soluzione automatica di problemi.
Rosemarie Truglio By, Giulia Abad. Questo è Rosemarie Truglio Rosemarie ha cinquantatre anni Rosemarie ha cinquantatre anni Rosemarie è da Hoboken, Nuovo.
embryo GPS dish (Rieger et al., 2007) Avvicinamento degli embrioni rispetto a micro gocce tradizionali e minore superficie.
Interculturalità e la scelta di materiali didattici per linsegnamento della lingua inglese Catherine Blundell CLIRO - Forlì
ISTITUTO DI SCIENZE E TECNOLOGIE DELLA COGNIZIONE Piero Cosi SEZIONE DI PADOVA - FONETICA E DIALETTOLOGIA Via Martiri della libertà, 2 – adova (Italy)
Tutor: Elisa Turrini Mail:
Project Review Novembrer 17th, Project Review Agenda: Project goals User stories – use cases – scenarios Project plan summary Status as of November.
Project Review byNight byNight December 21th, 2011.
Project Review byNight byNight December 6th, 2011.
Project Review Novembrer 17th, Project Review Agenda: Project goals User stories – use cases – scenarios Project plan summary Status as of November.
Project Review byNight byNight December 5th, 2011.
Riccardo Mazza, AICA 2001, 20 sett Scuola universitaria professionale della Svizzera italiana Formazione continua e classe virtuale lapprendimento.
Quale Europa? Riscopriamo le radici europee per costruire unEuropa PIÙ vicina a noi ISTITUTO COMPRENSIVO MAZZINI CASTELFIDARDO PROGETTO COMENIUS 2010/2012.
Obesity surgery triples among U.S. teens Long-term outcomes unknown, especially for patients as young as 12 Surgeons to carry out plastic surgery on obese.
20 maggio 2002 NETCODE Set up a thematic network for development of competence within the Information Society.
EMPOWERMENT OF VULNERABLE PEOPLE An integrated project.
Introduction to automatic ABMs documentation Keywords: Doxygen ODD protocol MASON documentation Simone Romano.
Teorie e tecniche della Comunicazione di massa Lezione 7 – 14 maggio 2014.
Early Language Learning and Multilingualism: Scottish and European Perspectives BILINGUALISM MATTERS.
Lezione n°27 Università degli Studi Roma Tre – Dipartimento di Ingegneria Corso di Teoria e Progetto di Ponti – A/A Dott. Ing. Fabrizio Paolacci.
Italian 1 -- Capitolo 2 -- Strutture
1 Giornata AIRI per l’Innovazione Industriale 2014 AIRI: 40 anni a sostegno della ricerca industriale italiana 26 maggio 2014 Horti Sallustiani, Roma.
Scenario e Prospettive della Planetologia Italiana
WRITING – EXERCISE TYPES
Prof. Stefano Zambon Università di Ferrara e WICI
Transcript della presentazione:

Sommarizzazione e Generazione Fiori Alessandro 12 Ottobre Pisa

Cosè un riassunto Riassunto (summary) (Oxford Dictionary Online 2013): a brief statement or account of the main points of something (Garzanti Linguistica 2013): esposizione in forma sintetica di uno scritto, di un discorso, di un fatto e simili (Radev et.al. 2002): a text that is produced from one or more texts, that conveys important information in the original text(s), and that is no longer than half of the original text(s) and usually significantly less than that. Text here is used rather loosely and can refer to speech, multimedia documents, hypertext, etc.

Cosè un sommarizzatore Sommarizzazione (Automatic Summarization) (Mani & Maybury, 1999): "to take an information source, extract content from it, and present the most important content to the user in a condensed form and in a manner sensitive to the user's or application's needs (Mani, 2001): a process to produce a condensed representation of the content of its input for human consumption (Sparck-Jones, 1999): a reductive transformation of source text to summary text through content condensation by selection and/or generalization on what is important in the source (Rehm & Uszkoreit, 2012): tenta di presentare gli elementi essenziali di un testo lungo in forma abbreviata

Scenario Generazione sommari Riassunto

Perché i riassunti? Motivazioni grandi volumi di documenti informazioni ridondanti tempi di consultazione e ricerca elevati Obiettivi riduzione del volume di dati estrazione delle informazioni rilevanti riduzione dei tempi di consultazione

Tipologie Estrattivi estratti di frasi dei testi originali poco fluidi nella presentazione Astrattivi rifrasatura del testo simile al riassunto generato dalluomo Documento singolo struttura e presentazione coerenti Multi-documento punti di vista e forma eterogenei Generici indipendenti dal contesto applicativo Focalizzati orientati al dominio e/o interessi del fruitore Monolingua analisi grammaticale (POS tagging) Multilingua analisi semantica

Metodi Clustering i gruppi rappresentano frasi con significati simili utilizzo di misure di similarità selezione rappresentante per ogni gruppo Grafi i nodi identificano una frase e/o concetto similarità misurata sugli archi individuazione nodi rilevanti (PageRank) Classificatori definizione di classi di concetti apprendimento di un modello da esempi assegnazione di etichette alle frasi term a term b term c term d term a term b term a term c term d gruppi di frasi

Prospettive future Social interessi degli utenti (opinion mining) sicurezza (sentiment analysis) servizi personalizzati (social reading) Aggiornamento dinamico incremento continuo delle collezioni flusso storico delle informazioni cambiamenti dei gruppi di utenti Nuovi domini applicativi contextual advertising medicina e biologia e-learning

In Italia Ricerca di base Definizione di nuove rappresentazioni delle informazioni (itemsets) Nuove metodologie: multilingua aggiornamento dinamico dipendenti dal dominio di interesse Integrazione sorgenti di informazioni esterne: social media ontologie e vocabolari controllati Ricerca industriale Social reading E-learning Opinion mining

Nel mondo Chi sarà il prossimo?

Bibliografia Garzanti Linguistica: Mani I. (2001). Automatc summarization, Book, Volume 3 of Natural language processing, Amsterdam/Philadelphia, John Benjamins Publishing Company. Mani, I., & Maybury, M. (ED.). (1999). Advances in Automatic Text Summarization, MIT Press. Oxford Dictionary Online: Radev D., Hovy E., & McKeown K. (2002). Introduction to the special issue on text summarization. Computational Linguistics, 28(4). Rehm, G. & Uszkoreit, H. (2012). The Italian Language in the Digital Age. Sparck-Jones, K. (1999). Automatic summarizing: factors and directions. In I. Mani and M. Maybury(Eds.), Advances in Automatic Text Summarization, MIT Press.

Libro Innovative Document Summarization Techniques: Revolutionizing Knowledge Understanding Alessandro Fiori (IRCC, Institute for Cancer Research and Treatment, Italy) The prevalence of digital documentation presents some pressing concerns for efficient information retrieval in the modern age. Readers want to be able to access the information they desire without having to search through a mountain of unrelated data, so algorithms and methods for effectively seeking out pertinent information are of critical importance. Innovative Document Summarization Techniques: Revolutionizing Knowledge Understanding evaluates some of the existing approaches to information retrieval and summarization of digital documents, as well as current research and future developments. This book serves as a sounding board for students, educators, researchers, and practitioners of information technology, advancing the ongoing discussion of communication in the digital age.

Contatti Alessandro Fiori Project IRCC di Candiolo Docente a contratto presso Politecnico di Torino Web: