Tecniche di ricerca semantica a supporto del recupero di link di tracciabilità tra artefatti software RelatoreCandidato Chiar.mo Prof. Rocco OlivetoStefano.

Slides:



Advertisements
Presentazioni simili
“Niente di Nuovo” Mercatino dell’Usato
Advertisements

USABILITÁ Sembra banale, ma….
L’algoritmo PageRank.
Laurea Magistrale in Informatica Percorso: Metodi e Modelli (M & M) a.a. 2007/2008.
Analisi e progettazione
Il laboratorio e l’attività di campagna
La costruzione e lo sviluppo delle competenze a scuola Prof. Losito
Inizio… Linguaggi Linguaggi di programmazione Linguaggi di programmazione Linguaggi di programmazione Linguaggi di programmazione Linguaggi Formali Linguaggi.
una interfaccia internet per il sistema Momis
Obiettivo della tesi Percorso
1 Integrazione di Sorgenti HTML in MOMIS: Analisi Comparativa degli Strumenti Esistenti Integrazione di Sorgenti HTML in MOMIS: Analisi Comparativa degli.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Semantic.
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica MOMIS: servizi di wrapping.
COMPARAZIONE DI STRUMENTI SOFTWARE PER LA CREAZIONE, LA GESTIONE E LINTEGRAZIONE DI ONTOLOGIE Università degli Studi Modena e Reggio Emilia Facoltà di.
Lez. 131 Universita' di Ferrara Facolta' di Scienze Matematiche, Fisiche e Naturali Laurea Specialistica in Informatica Algoritmi Avanzati Rappresentazione.
Apprendimento cooperativo: open learning e nuovi media
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Corso di Laurea in Biotecnologie Informatica (Programmazione)
Corso di Informatica (Programmazione)
UNIVERSITA DEGLI STUDI DI MILANO Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea Trienmale in Informatica Relatore:Prof.ssa FIORELLA.
Introduzione Estrazione di Informazioni dal Web Prof. Paola Velardi.
Daniel Stoilov Tesi di Laurea
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea in Scienze dellInformazione Applicazione.
Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea in Informatica Progetto e sviluppo.
Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria Enzo Ferrari Modena Corso di Laurea in Ingegneria Informatica PROGETTO E SVILUPPO.
Elementi di Informatica
Applicazioni di modelli matematici alla ricerca semantica
Corso di Laurea in Ingegneria Meccanica
INFORMATICA MATTEO CRISTANI. INDICE CICLO DELLE LEZIONI LEZ. 1 INTRODUZIONE AL CORSO LEZ. 2 I CALCOLATORI ELETTRONICI LEZ. 3 ELEMENTI DI TEORIA DELL INFORMAZIONE.
Sistema di interrogazione intelligente di
Il Semantic Web applicato ai percorsi formativi nelle organizzazioni innovative By CSTAdvising CSTAdvising, professionisti della conoscenza,
Lo sviluppo del software e i linguaggi di programmazione
Sistemi di Elaborazione delle Informazioni Mod.I.
Sistemi - Stabilità - Rielaborazione di Piero Scotto
UNIVERSITÀ DI PISA FACOLTÀ DI INGEGNERIA CORSO DI LAUREA SPECIALISTICA IN INGEGNERIA INFORMATICA PER LA GESTIONE D’AZIENDA Tesi di laurea: Progettazione.
Titolo della tesi Nome candidato Relatore: prof. Davide Pettenella
UNIVERSITA' DEGLI STUDI DI MILANO Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea in Informatica Analisi, progettazione e realizzazione.
Laurea Magistrale in Informatica Percorso: Metodi e Modelli M & M a.a. 2008/2009.
Politecnico di Torino maggio DIDAMATICA 2011 Insegnare Futuro EXCEL4PS&SP – 6 Maggio 2011 Prof. Nicola Armenise, PhD I.T.E.S. “A. Olivetti” -
PART 3: DATA ANALYSIS THROUGH OMNIFIND. Il cliente: una sorgente importante di informazioni Mercato iper-competitivo, altamente caotico. Cliente al centro.
Informatica 3 V anno.
FUNZIONI STRUMENTALI PIANO DI LAVORO Anno scolastico 2012/13.
Un Sistema per la Redazione Assistita di Testi Giuridici Tesi di Laurea Specialistica in Informatica di Emiliano Giovannetti Un Sistema per la Redazione.
Commenti all’esempio del treno Nell’esempio del treno si è iniziato dalle attività generiche e/o attività operative che tipicamente costituiscono i passi.
Informatica 4 Funzioni. FUNZIONE: definizione MATEMATICA Relazione (o applicazione) binaria tra due insiemi A e B che associa a ogni elemento di A un.
WEB DESIGN A COMPLESSITÀ ADATTIVA: PRESTAZIONI COGNITIVE E PROFILAZIONE UTENTE UNIVERSITA’ DEGLI STUDI DI PAVIA Corso di Laurea Specialistica Interfacoltà.
Sorrentino, Corvino, Palumbo, Credendino, Salzano, Ponticiello Caso di studio 2 Gruppo 7 Materia : Informatica- progetto ABACUS Scuola: ITIS indirizzo.
L'analisi dei testi per la realizzazione del Web Semantico: quali gli strumenti e le applicazioni Paolo Poto Expert System Spa.
Ingegneria del software Modulo 1 -Introduzione al processo software Unità didattica 6 -Gestione della configurazione software Ernesto Damiani Università.
Scrivere e compilare programmi
Matematica e Statistica "dai dati, ai modelli, alle scelte“ I.I.S. “V. Emanuele II – Ruffini”, GE Istituto Tecnico Commerciale “G. Ruffini”, IM Liceo Scientifico.
II - Approccio progettuale
B IBLIO S ERVICE consultazione di articoli online Anna Riccioni Progetto per il corso di Reti di Calcolatori L-S Anno Accademico
Il software Claudia Raibulet
Ingegneria del software Modulo 1 - Introduzione al processo software Unità didattica 1 -Cicli di vita Ernesto Damiani Università degli Studi di Milano.
Intervalli di confidenza
U NIVERSITÀ DEGLI S TUDI DI P AVIA D IPARTIMENTI DI G IURISPRUDENZA, I NGEGNERIA I NDUSTRIALE E DELL 'I NFORMAZIONE, S CIENZE E CONOMICHE E A ZIENDALI,
Sistemi di Gestione dei Dati e dei Processi Aziendali Computer-Assisted Audit Technique (CAAT)
Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Fisiche, Informatiche e Matematiche Corso di Laurea in Informatica Progettazione e.
Programmazione dei Calcolatori Elettronici
Progetto AMBIT: Ottimizzazione e Valutazione Sperimentale del Motore di Ricerca Semantico Basato sul Contesto Università degli studi di Modena e Reggio.
ICT e Sistemi informativi Aziendali Materiale di supporto alla didattica.
Informatica Problemi e algoritmi. una situazione che pone delle domande cui si devono dare risposte. Col termine problema o situazione problematica s’indica.
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Diagramma degli Stati. Diagramma degli Stati … Definizione è un grafico con nodi ed archi in cui i nodi rappresentano gli stati di una classe e gli archi,
Parsing ricorsivo discendente Il parsing ricorsivo discendente (recursive descent parsing) è un metodo di tipo top-down che può essere facilmente codificato.
ANALISI DEI SEGNALI Si dice segnale la variazione di una qualsiasi grandezza fisica in funzione del tempo. Ad esempio: la pressione in un punto dello spazio.
Basi di dati - 09Marco Maggini1 Forme normali forme normali  Le forme normali verificano la qualità di uno schema di una base di dati relazionale  Presenza.
ALGORITMI, LINGUAGGI E PROGRAMMI Facoltà di Lingue e Letterature Straniere Corso di laurea in Relazioni Pubbliche.
Perché i netbook in classe???
Transcript della presentazione:

Tecniche di ricerca semantica a supporto del recupero di link di tracciabilità tra artefatti software RelatoreCandidato Chiar.mo Prof. Rocco OlivetoStefano Ricchiuti U NIVERSITÀ DEGLI S TUDI DEL M OLISE Facoltà di Scienze Matematiche Fisiche e Naturali Corso di Laurea in Informatica T ESI DI L AUREA IN L ABORATORIO DI I NGEGNERIA DEL S OFTWARE A NNO A CCADEMICO 2009/2010

Contesto Applicativo percorso evolutivo di un software percorso complesso non si limita alla sola progettazione produce un insieme di documenti (repository) ciclico, possibilità di evoluzioni future

Contesto Applicativo introduzione di modifiche Il repository degli artefatti, risultante dal processo di sviluppo, è un insieme di documenti, diagrammi ed elaborati dipendenti tra loro. repository Introdurre una modifica o una nuova funzionalità, potrebbe coinvolgere uno o più artefatti già integrati nel sistema

Contesto Applicativo recupero della tracciabilità Per introdurre modifiche, è necessario individuare i collegamenti che intercorrono tra tutti i documenti dell’insieme. login.java Funzionalità: Login Test case : Login * I collegamenti tra i documenti sono dipendenze di varia natura che prendono il nome di link di tracciabilità. Il processo di individuazione di tutti il link è detto recupero della tracciabilità.

Motivazioni gestione della tracciabilità AMBITI DI APPLICAZIONE Program Comprehension Manutenzione Requirements tracing Impact analysis Riuso del codice CRITICITÀ Elevato numero di link Costante aggiornamento I link vanno riconsiderati dopo ogni modifica NECESSITÀ DI AUTOMAZIONE

Motivazioni Information Retrieval e tracciabilità La maggior parte dei documenti relativi ad un software sono costituiti da testo. È possibile applicare tecniche di Information Retrieval. parole chiave Documenti rilevanti Information Retrieval Gestione tracciabilità Artefatto source Artefatti target INPUT OUTPUT

Motivazioni metodi IR vettoriali I metodi con modello vettoriale sono tra i più utilizzati ed efficaci documenti rappresentati come vettori angolo tra i vettori come misura della somiglianza il significato e numero delle dimensioni dipendono dal metodo

Motivazioni il metodo Latent Semantic Indexing (LSI) LSI è un metodo di IR vettoriale che considera legami semantici tra termini e documenti, e a differenza dei tradizionali metodi: risolve i problemi di polisemia e sinonimia spazio di indicizzazione semantico (struttura semantica latente) le dimensioni dello spazio corrispondono a dei «concetti» estratti dall’insieme dei documenti INCOGNITA = NUMERO DI CONCETTI DA ESTRARRE

Obiettivi obiettivi della tesi Il numero di dimensioni dello spazio di indicizzazione (indicato con k) influenza le prestazioni del metodo LSI e non è noto a priori Obiettivo DUPLICE: 1)Osservare in che modo il valore di k influenza le prestazioni nel recupero della tracciabilità del metodo LSI 2)Stabilire un’euristica per individuare un corretto valore di k

Obiettivi test effettuati EASY CLINIC: 30 casi d’uso 20 interaction diagrams 63 casi di test 37 artefatti codice sorgente 93 link di tracciabilità eTOUR: 58 casi d’uso 116 artefatti codice sorgente 364 link di tracciabilità Applicazione del metodo LSI per il recupero della tracciabilità con tutti i possibili valori di k e calcolo delle prestazioni.

Obiettivi risultati della sperimentazione Generalmente, le prestazioni del metodo migliorano all’aumentare di k, fino a stabilizzarsi sul valore corrispondente alle prestazioni migliori Osservando l’importanza dei concetti che il metodo LSI estrae dai documenti, è possibile individuare il valore di k che corrisponde al punto di stabilizzazione

Conclusioni risultati ed obiettivi raggiunti È sempre possibile individuare il punto di stabilizzazione delle prestazioni del metodo LSI applicato al recupero della tracciabilità tra artefatti software. Il corrispondente valore di k è anche nella maggior parte dei casi, il valore che fornisce le prestazioni migliori, mentre nei casi in cui ciò non si verifica, indica il limite superiore del numero concetti da estrarre, oltre il quale le prestazioni non cambiano.

Sviluppi futuri possibili estensioni del lavoro svolto eseguire la stessa sperimentazione su basi di dati più ampie e con caratteristiche diverse, verificando che i risultati siano confrontabili con quelli precedenti Applicare le stesse considerazioni nell’ambito dell’Information Retrieval Analizzare i casi in cui le prestazioni hanno una variazione anomala con un massimo non determinabile con l’osservazione dell’importanza dei concetti indicizzati