Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Automatic Text Segmentation: Text Relationship Map (Salton 1996) Ing. Leonardo.

Slides:



Advertisements
Presentazioni simili
Come analizzare i dati (principali test statistici impiegati)
Advertisements

1 Pregnana Milanese Assessorato alle Risorse Economiche Bilancio Preventivo P R O P O S T A.
Open Document Format for Office Applications Organization for the Advancement of Structured Information Standards Sergio Capone ITP.
Latina, 24 novembre ma Sessione Generale Cigre Parigi, agosto 2010 Comitato di studio B1 INSULATED CABLES Marco Marelli, membro italiano.
Outline Gene Finding: Struttura ed identificazione di geni in procarioti ed eucarioti; Hidden Markov Models; Genscan; Dept. of Mathematics and Computer.
Automatic Text Segmentation: TextTiling (Hearst)
Unified Modeling Language class C {…} class B extends C {…} Esiste una notazione grafica per mostrare le relazioni di ereditarietà. Object StringC B Tutte.
HDM Information Design notation v.4. HDM Information Design.
LA RICERCA BIBLIOGRAFICA NEL SETTORE BIOMEDICO: Pubmed CENTRO DI BIOTECNOLOGIE SETTORE DOCUMENTAZIONE BIOMEDICA A.O.R.N. A.CARDARELLI- NAPOLI Prof.ssa.
Sistemi didattici per la rete Un motore di ricerca basato su ontologie per il retrieval di LO.
FUNZIONI DI GRUPPO Le funzioni di gruppo operano su un set di record restituendo un risultato per il gruppo. AVG ([DISTINCT|ALL] n) media, ignora i valori.
SOURCE TERM ON NPP SAFETY ANALYSES Marino Mazzini Professore Ordinario nel s.s.d. Impianti Nucleari Università di Pisa Facoltà di Ingegneria Dipartimento.
The International Nuclear Event Scale (INES)
Ricerca di una chiave: Search(x, k) if x == nil or k == x.key return x
PRINCIPALI STRATEGIE DI PROBLEM SOLVING
Progetto Strutture e personale del Ministero
Verolanuova 09 Maggio 2013 Dott. Alfredo Baldino.
1 IL PARADIGMA DELLE RETI DINAMICHE PER LA CARATTERIZZAZIONE DI MODELLI DI MOTO COLLETTIVO CANDIDATO GIUSEPPE MARZIALE RELATORE ING. ALESSANDRO RIZZO POLITECNICO.
GE.CO. Gestione per competenze. Introduzione a GE.CO. Orienta nella scelta di nuovi modelli organizzativi. Elabora modelli concettuali ed operativi. Introduce.
Muoversi tra le finestre
C aso di Studio Gruppo9: DAvino,Vetrano,Monda,Papa, Berardini,Schettino.
Piano gestione solventi
JavaScript Lezione 5 Tipizzazione ed operazioni tra tipi diversi Istruzioni di input.
NOI RAGAZZI DEL PERCORSO FORMAZIONE ANIMAZIONE 2006 ABBIAMO REALIZZATO QUESTA PRESENTAZIONE PER FAR CONOSCERE UNA NUOVA FIGURA AL SERVIZIO DELLA COMUNITA…
PRESENTAZIONE: La ditta SONICAL s.r.l. presente da tempo nel mondo dello stampaggio in pressofusione a camera calda delle leghe di zinco, ha sviluppato.
PRIMA PARTE Lezione 21 dicembre 2008 Luciano Molinari.
Filtered Index and Statistics Filtered Indexes Sergio Govoni
Trieste 7 marzo 2013 SVILUPPO DELLE INFRASTRUTTURE ED EFFICIENZA DELLE CATENE LOGISTICHE IN PROVINCIA DI TRIESTE.
Benvenuti al Corso sulla Multimedialità Istituto Tecnico Commerciale docente: Massimiliano Canale A.S. 1999/2000.
una generalizzazione del Modello Media-Varianza
Telemarketing & Market Research Advanced on Line Business Oriented Research Solutions ALBORS.
DIPARTIMENTO DI ELETTRONICA E INFORMAZIONE Lab 4: 15 Aprile 2013 Gianluca Durelli – Marco D. Santambrogio –
MANAGEMENT PARTE B a.a. 2012/2013 Docente: Prof.ssa Enrica Pavione
DA NATIVI DIGITALI A INTERNAUTI CONSAPEVOLI
Creare e gestire un sito Web scolastico P.O.N ITIS Marconi Nocera a.s
Internet Struttura di un sito web Navigazione in un sito web.
PORTE APERTE SUL WEB L'officina del webmaster: strumenti, materiali, iniziative, fonti di informazione, e poi perché costruire siti scolastici ? Laura.
Benvenuti nel marketplace dei macchinari per la deformazione della lamiera.
SCUOLA SECONDARIA DI PRIMO GRADO CLASSI III A E III B ISTITUTO COMPRENSIVO T. GULLUNI Colonna (Roma)
È un luogo di situazioni complesso ed articolato di tipo Pull e non Push È qualcosa di assolutamente nuovo rispetto alla comunicazione tradizionale È
Data Rev. 08/05/2013 ASR Accordo tra Centro Studi Cesare Ferrari e Consulman.
Confidential & Proprietary Copyright © 2009 The Nielsen Company Piccoli e grandi a confronto MONICA MANZOTTI Responsabile Bookscan The Nielsen Company.
1 Target Cross Intelligence Le decisioni d'impresa, spesso, non sono né giuste né sbagliate. Le decisioni d'impresa, spesso, non sono né giuste né sbagliate.
I.P.S.I.A. GALILEO GALILEI - Castelfranco Veneto (TV) GREEN SCHOOLS COMPETITION Referente di Progetto: prof.ssa Regina Stocco SCUOLA SOSTENIBILE? … SI.
Tutorial relativo al Mio EBSCOhost. Benvenuti al tutorial dedicato a Mio EBSCOhost, verranno fornite le istruzioni per la configurazione e lutilizzo ottimizzato.
Di Sara Citterio Eleonora Mossini Isabella Lamoglie
Moduli o Form I Moduli permettono all'utente di immettere informazioni...
FASE 8 Esercizi di riparazione
Alcune importanti premesse Senza le quali è inutile andare avanti.
GLI STUDI DI SETTORE: UN PROCESSO GRADUALE DI EMERSIONE IN UN CONTESTO DI COMPLIANCE 1.
INTERNET Internet è una rete a livello mondiale che permette alle persone di comunicare ed ad accedere a banca dati da qualunque parte del mondo e su qualunque.
AgentGroup MEnSA Project - Future work Agent and Pervasive Computing Group Dipartimento di Ingegneria dellInformazione Università degli Studi di Modena.
Gruppo 4: Gelmi Martina, Morelato Francesca, Parisi Elisa La mia scuola ha un sito Web: modelli per la qualità dei siti (Ingegneria del Web)
Gli Egizi: webquest.
On-line multi modal information
Università degli Studi di Palermo Associazione SINTESI - SINergie TEcnologiche in SIcilia CRES - Centro per la Ricerca Elettronica in Sicilia Automatizzazione.
Attività Formativa Sviluppo di un WORKFLOW ENGINE di Dott. Riccardo Gasperoni Alessandro Caricato Gabriele Trabucco in collaborazione con Progesi S.p.A.
LEGGI DI CONSERVAZIONE
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
L4 Tecniche di Background Subtraction
Analysis and Development of Functions in REST Logic: Application to the «DataView» Web App UNIVERSITA’ DEGLI STUDI DI MODENA E REGGIO EMILIA DIPARTIMENTO.
1 An Approximation- Based Data Structure for Similarity Search R. Weber, S. Blott Hermes, 1998 Sistemi Informativi per le Decisioni Diego Cera – Michele.
Lezione n°10 Prof.ssa Rossella Petreschi
Branch and Bound Lezione n°19 Prof.ssa Rossella Petreschi
Branch and Bound Lezione n°14 Prof.ssa Rossella Petreschi
Il problema del cammino minimo
Devi studiare! Cioè?!?.
Intervalli di Fiducia Introduzione Intervalli di fiducia per la media – Caso varianza nota Intervalli di fiducia per la media – Caso varianza non nota.
La poesia Schema riassuntivo.
Introduzione a PowerPoint 2007
Transcript della presentazione:

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Automatic Text Segmentation: Text Relationship Map (Salton 1996) Ing. Leonardo Rigutini Dipartimento di Ingegneria dellInformazione Università di Siena Via Roma – SIENA – ITALY

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Text Relationship map Salton 1996 Vector space model: D i =(d i1, d i2, …, d it ) d ik = peso del termine T k nel documento D i Sim( D i, D j ) = d ik x d jk Sim viene normalizzata in modo da (0,1) Una volta calcolate le similitudini si costruisce la mappa

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Text Relationship map Figure 1: Text Relationship Map: articoli di enciclopedia riguardanti lenergia termo-nucleare Link under 0.01 ignored

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Nodi e archi Importanza di un nodo correlata al numero di archi incidenti: Un nodo centrale è caratterizzato da un grande numero di archi Grafo altamente connesso: Molti nodi importanti Trattazione dellargomento omogenea Grafo debolmente connesso: Nodi importanti sparsi Piu argomenti separati (poca omogeneita) Trattazione cronologica, geografica ecc...

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Grafo altamente connesso

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Grafo scarsamente connesso

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Automatic Text Decomposition Studio delle relazioni tra i nodi del grafo Due tipi di analisi: Segmenti unita di testo (nodi) omogenee e contigue, altamente connesse tra loro e poco connesse con i restanti nodi del grafo. Tematiche unita di testo semanticamente omogenee senza vincoli di adiacenza.

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Text Segments - 1 Trovare gap nelle connessioni tra paragrafi adiacenti Vengono eliminati i collegamenti tra nodi distanti oltre un certo k (Salton pone k=5)

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Text Segments - 2 Non e garantita la coerenza del tema trattato Molti argomenti possono essere trattati in maniera non lineare Per cercare coerenza bisogna rilassare il vincolo di adiacenza e considerare tutti i collegamenti esistenti Text Theme

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Text Themes Si considerano i triangoli presenti nel grafo triangolo = insieme di tre nodi mutualmente correlati Ogni triangolo e rappresentato da un vettore centroide C i =(N 1,N 4,N 8 ) dove N k e il nodo k un valore S i che e la media dei vettori del triangolo Fusione dei centroidi: I triangoli vengono fusi quando la similitudine tra coppie di centroidi supera una determinata soglia Il processo si ripete fino a che nessuna fusione e possibile

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Text Themes - es

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Relazioni tra segmenti e temi E possibile calcolare gradi di similitudine: segment-segment informazioni sulla struttura del documento (figura 7) theme-theme informazioni sulla centralita di alcune tematiche e sulla particolarita di altre (figura 8) theme-segment tipo di documento: –singolo tema trattato sotto piu punti di vista –piu temi scorrelati –un tema centrale e vari paragrafi secondari] –ecc...

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Segment-segment

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Theme-theme

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Theme-segment 1.segmenti & temi abbastanza congruenti: Tema sviluppato in maniera lineare parti di testo abbastanza adiacenti Es. –articoli su un singolo argomento –articoli su piu argomenti abbastanza scorrelati e trattati in maniera cronologica (relazione 1 a 1) –Temi trattati sotto piu punti di vista ( T piu S) 2.temi e segmenti non congruenti Argomento sospeso e ripreso in seguito Es. –Introduzione e succesive spiegazioni

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Es. singolo tema

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Es. Storie multiple

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Es. Tema scorrelato dal resto del documento

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Es. grande tema centrale e due piccoli approfondimenti

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Text retrieval Tecniche standard di recupero possono non essere quelle migliori Quando una query riguarda un tema discontinuo nel documento, il recupero di segmenti non e una buona soluzione, ma e meglio restituire un insieme di segmenti Quindi: Per strutture semplici text segment Per strutture complesse text theme

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Information retrieval: simple structure

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Information retrieval: simple structure

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Information retrieval: complex structure

Ing. Rigutini Leonardo – Automatic Text Segmentation: Text Relationship Map Information retrieval: complex structure