Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Matematiche Fisiche e Naturali Progetto e Sviluppo di unApplicazione Mobile per il.

Slides:



Advertisements
Presentazioni simili
Approximate Sequence Matching: Implementazione e Analisi Prestazionale
Advertisements

CORSO DI RECUPERO CONTROLLI AUTOMATICI Prof. Filippo D’Ippolito
UNIVERSITA’ DI MILANO-BICOCCA LAUREA MAGISTRALE IN BIOINFORMATICA
Introduzione ad XML Mario Arrigoni Neri.
Sistemi di Classificazione usando NCD
Classe III A A.s – 2011 Programma di Informatica 5 ore settimanali (3 laboratorio) Docenti –Prof. Alberto Ferrari –Prof. Alberto Paganuzzi.
Politecnico di Milano Sviluppo di strumenti per l'analisi e la manipolazione di bitstream per la riconfigurabilità parziale Relatore: Prof. Fabrizio FERRANDI.
XSLT UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re Anno Accademico
una interfaccia internet per il sistema Momis
Query OQL e XQUERY a confronto
Progetto e realizzazione di un wrapper XML Schema per il sistema MOMIS
Facoltà di Ingegneria di Modena ANALISI E SVILUPPO DI TECNICHE PER
Università degli studi di Modena e Reggio Emilia
1 Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Protocolli.
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Relatore:
Motore di news per portali Web: progetto ed implementazione Relatore: Chiar.mo Prof. Sonia Bergamaschi Tesi di Laurea di: Roberto Delfini Anno Accademico.
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Progetto e sviluppo di.
Re-engineering del wrapper XML Schema per il sistema MOMIS
1 Integrazione di Sorgenti HTML in MOMIS: Analisi Comparativa degli Strumenti Esistenti Integrazione di Sorgenti HTML in MOMIS: Analisi Comparativa degli.
Il mio nome è Alain Fergnani e nel corso della tesi mi sono occupato della dinamica delle ontologie per il Web Semantico, e in particolare dell’approccio.
Università degli Studi di Modena e Reggio Emilia
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica MOMIS: servizi di wrapping.
UNIVERSITA’ DEGLI STUDI DI MODENA E REGGIO EMILIA
Università degli studi di Modena e Reggio Emilia Progetto e realizzazione di un tool di sincronizzazione database server – palmare per il controllo del.
COMPARAZIONE DI STRUMENTI SOFTWARE PER LA CREAZIONE, LA GESTIONE E LINTEGRAZIONE DI ONTOLOGIE Università degli Studi Modena e Reggio Emilia Facoltà di.
TW Analisi dei documenti n Classificazione dei componenti n Selezione dei componenti, costruzione della gerarchia, dei blocchi informativi e degli elementi.
1 Università della Tuscia - Facoltà di Scienze Politiche.Informatica 2 - a.a Prof. Francesco Donini Active Server Pages.
XML e XSL. XSL - eXtensible Stylesheet Language XSL è un linguaggio di annotazione che serve a "trasformare" la struttura di un documento in formato XML.
Introduzione1 Algoritmi e strutture dati - Definizioni Struttura dati: organizzazione sistematica dei dati e del loro accesso Algoritmo: procedura suddivisa.
Access: Query semplici
Ulteriori Abilità Informatiche
Analisi e formalizzazione dei requisiti non funzionali
Corso di Laurea in Ingegneria per lAmbiente e il Territorio Informatica per lAmbiente e il Territorio Docente: Giandomenico Spezzano Tutor: Alfredo Cuzzocrea.
Introduzione ai fogli elettronici: EXCEL
Daniel Stoilov Tesi di Laurea
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea in Scienze dellInformazione Applicazione.
Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea in Informatica Progetto e sviluppo.
Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria Enzo Ferrari Modena Corso di Laurea in Ingegneria Informatica PROGETTO E SVILUPPO.
Architettura Java/J2EE
Meteo Service Corso di Reti di Calcolatori LS Casarini Stefano matr
1 IsaPress. 2 Obiettivo Realizzare uno strumento di facile uso per estrarre il contenuto da documenti binari di vario tipo in un formato utile per l'impaginazione.
1 IsaPress. 2 Obiettivo Realizzare uno strumento di facile uso per estrarre il contenuto da documenti binari di vario tipo in un formato utile per l'impaginazione.
Perfect sampling di processi di coda UNIVERSITÀ DEGLI STUDI DI ROMA TOR VERGATA Corso di laurea in Ingegneria dei Modelli e dei Sistemi Studente: Paolo.
Algoritmi di String Matching
Descrizione Semantica ad Alto Livello di Ambienti Virtuali in X3D
Proposta di unImplementazione per i Servizi di Localizzazione e Traffic Monitoring nellIntelligent Trasportation System Pegasus UNIVERSITÀ DEGLI STUDI.
Sistema di interrogazione intelligente di
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria “Enzo Ferrari” – Sede di Modena Corso di Laurea Specialistica in Ingegneria Informatica.
Progettare un database
Universita' degli Studi di Modena e Reggio Emilia
UNIVERSITÀ DI PISA FACOLTÀ DI SCIENZE MATEMATICHE FISICHE E NATURALI CORSO DI LAUREA IN INFORMATICA Realizzazione completa di un’interfaccia grafica in.
Corso JAVA Lezione n° 11 Istituto Statale di Istruzione Superiore “F. Enriques”
Linguaggi e modelli computazionali LS Manni Tiziano
Microsoft Access (parte 5) Introduzione alle basi di dati Scienze e tecniche psicologiche dello sviluppo e dell'educazione, laurea magistrale Anno accademico:
1 di 15 Università degli studi di Modena e Reggio Emilia Mail Configurator: un’applicazione ad agenti mobili basata su ruoli dinamici Correlatori: Ing.
Interrogare il database
1 PerfectFit06 Sistema di personalizzazione dei contenuti per gli scavi archeologici di Ercolano Candidato: Vincenzo Scognamiglio Relatore: Prof. Ernesto.
Education & Training Training per Microsoft Access 97 Perché Education & Training ? Perché StartPoints crede nell’importanza strategica delle Risorse Umane.
TW Asp - Active Server Pages Nicola Gessa. TW Nicola Gessa Introduzione n Con l’acronimo ASP (Active Server Pages) si identifica NON un linguaggio di.
Lucia Melotti 1/14 Bologna, 7 luglio 2004 Aspetti di sicurezza nello scambio di messaggi XML tra un partner ebXML ed un Web Service di Lucia Melotti Relatore:
Università degli Studi di Bologna Facoltà di Scienze Matematiche Fisiche e Naturali Corso di Laurea in Scienze dell’Informazione Università degli Studi.
Corso integrato di Matematica, Informatica e Statistica Informatica di base Linea 1 Daniela Besozzi Dipartimento di Informatica e Comunicazione Università.
Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Fisiche, Informatiche e Matematiche Corso di Laurea in Informatica Progettazione e.
Progetto AMBIT: Ottimizzazione e Valutazione Sperimentale del Motore di Ricerca Semantico Basato sul Contesto Università degli studi di Modena e Reggio.
Dispositivi Mobili per Sentiment Analysis
1 Lixto tools evaluations for HTML data Integration in Momis Lixto tools evaluations for HTML data Integration in Momis Università degli Studi di Modena.
UNIVERSITA’ DEGLI STUDI DI MODENA E REGGIO EMILIA Dipartimento di Scienze Fisiche, Informatiche e Naturali Corso di Laurea in Informatica Progetto e Sviluppo.
Dal problema al programma – ciclo di sviluppo del software La scrittura del programma è solo una delle fasi del processo di sviluppo di un'applicazione.
Transcript della presentazione:

Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Matematiche Fisiche e Naturali Progetto e Sviluppo di unApplicazione Mobile per il Calcolo dellH-Index Daniele Cristofori Relatore: Prof. Riccardo Martoglia Anno accademico 2010/2011

INTRODUZIONE Negli ultimi anni Google e Microsoft hanno cercato sempre di più di democratizzare i criteri di valutazione degli scienziati. Tentativo a tale scopo H-Index di Jorge E. Hirsch. Definizione di Hirsch: Uno scienziato possiede un indice h se h dei suoi Np lavori hanno almeno h citazioni ciascuno e i rimanenti (Np – h) lavori hanno ognuno al più h citazioni. Introduzione1 Esistono in rete diverse applicazioni che calcolano lH-Index appoggiandosi a Google Scholar ma presentano tutte dei problemi…

INTRODUZIONE Introduzione2 Non appartiene a Floriana Esposito

INTRODUZIONE La precedente pubblicazione, pur non appartenendo a Floriana Esposito, partecipa al calcolo dellH-Index Errore!!! Introduzione3 Soluzione: Estrarre tutte le pubblicazioni dallhomepage dello scienziato di riferimento e considerare solo quelle nel calcolo dellH-Index. Alcune applicazioni hanno la funzionalità che permette di selezionare o deselezionare da parte dellutente quelle pubblicazioni che si ritiene non appartengono allo scienziato considerato Troppo oneroso dal punto di vista utente!!!

INTRODUZIONE E stata creata unapplicazione H-Index Calculator per iPhone (adottando quindi il linguaggio di programmazione Objective-C) che calcoli lH-Index di un qualsiasi scienziato in maniera ottimale. Introduzione4

LAPPROCCIO SEGUITO Estrazione pubblicazioni da homepage. Confronto pubblicazioni da Google Scholar con pubblicazioni da homepage. Lapproccio seguito5

ESTRAZIONE PUBBLICAZIONI DA HOMEPAGE Obiettivo: Estrapolazione di tutte le pubblicazioni (titoli ed eventualmente autori) da una qualunque homepage. Estrazione pubblicazioni da homepage 6 Problema: Non si ha la conoscenza della struttura della pagina HTML che contiene tutte le pubblicazioni. Soluzione: Ideazione ed implementazione di un algoritmo che, in maniera automatica, cerca di capire comè strutturata lhomepage. Di seguito è mostrata una simulazione dellalgoritmo.

ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE Estrazione pubblicazioni da homepage 7 … MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION. … INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING. …

INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING. … MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION. ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE Estrazione pubblicazioni da homepage 8

… INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING. … MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION. ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE Estrazione pubblicazioni da homepage 9

… INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING. … MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION. ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE Estrazione pubblicazioni da homepage 10

… INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING. … MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION. ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE Estrazione pubblicazioni da homepage 11

… INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING. … MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION. ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE Estrazione pubblicazioni da homepage 12

… INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING. … MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION. ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE Estrazione pubblicazioni da homepage 13

… INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING. … MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION. ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE Estrazione pubblicazioni da homepage 14 Fine della risalita!

LAPPROCCIO SEGUITO Algoritmo intelligente di estrapolazione pubblicazioni da homepage. Confronto pubblicazioni da Google Scholar con pubblicazioni da homepage. Lapproccio seguito15

CONFRONTO PUBBLICAZIONI Obiettivo: Riconoscere lo stesso titolo estratto dallhomepage in Google Scholar e viceversa. Problema: In diversi casi una determinata pubblicazione estratta da Google Scholar è presentata con qualche piccola differenza di caratteri rispetto alla stessa pubblicazione allinterno dellhomepage. Non si può quindi usare un metodo di uguaglianza. Soluzione: Definire un grado di similarità sopra il quale le due pubblicazioni vengano considerate la stessa. Questo lo si può fare grazie allalgoritmo Edit Distance. Edit Distance: date str1 e str2 due stringhe in input, ritorna il numero minimo di modifiche elementari che consentano di trasformare la stringa str1 nella stringa str2. Confronto pubblicazioni16

INTRODUZIONE Introduzione17 Verrebbe scartata

INTRODUZIONE Introduzione18 Grazie allEdit Distance viene presa in considerazione

ALGORITMO EDIT DISTANCE Algoritmo Edit Distance19 e(i, j) = min c(a, b) = εANALYSIS-AND-THE-SODAS ε A1 N2 A3 L4 Y5 S6 I7 S8 -9 A10 N11 D S14 O15 D16 A17 S18

ALGORITMO EDIT DISTANCE Algoritmo Edit Distance20 e(i, j) = min c(a, b) = εANALYSIS-AND-THE-SODAS ε A10 N2 A3 L4 Y5 S6 I7 S8 -9 A10 N11 D S14 O15 D16 A17 S18

ALGORITMO EDIT DISTANCE Algoritmo Edit Distance21 e(i, j) = min c(a, b) = εANALYSIS-AND-THE-SODAS ε A10 N21 A3 L4 Y5 S6 I7 S8 -9 A10 N11 D S14 O15 D16 A17 S18

ALGORITMO EDIT DISTANCE Algoritmo Edit Distance22 e(i, j) = min c(a, b) = εANALYSIS-AND-THE-SODAS ε A10 N21 A32 L4 Y5 S6 I7 S8 -9 A10 N11 D S14 O15 D16 A17 S18

ALGORITMO EDIT DISTANCE Algoritmo Edit Distance23 e(i, j) = min c(a, b) = εANALYSIS-AND-THE-SODAS ε A N A L Y S I S A N D S O D A S

ALGORITMO EDIT DISTANCE Algoritmo Edit Distance24 εANALYSIS-AND-THE-SODAS ε A N A L Y S I S A N D S O D A S LEdit Distance tra la stringa ANALYSIS AND THE SODAS e ANALYSIS AND SODAS è 4 e(i, j) = min c(a, b) = Con un grado di similarità adeguato, Le due pubblicazioni verrebbero considerate uguali

TECNOLOGIE ADOTTATE Tecnologie adottate25 Lapplicazione è stata sviluppata sfruttando: 1.Il sistema operativo iOS 2.Il linguaggio di programmazione Objective-C 3.I componenti grafici della libreria UIKit 4.Lo standard W3C del linguaggio XPath 5.Il database sqlite 6.I parser JujuParser e HTMLParser

CONCLUSIONE E SVILUPPI FUTURI Conclusione e sviluppi futuri27 Si è arrivati alla creazione di unapplicazione per iPhone che calcoli in maniera ottimale lH-Index di un qualsiasi scienziato. Punto di forza: prendere in considerazione in modo automatico solo quelle pubblicazioni che appartengono allo scienziato in questione scartando quelle pubblicazioni sporche comunque restituite da Google Scholar. Sviluppi futuri: 1.Aggiunta funzionalità di modifica delle pubblicazioni. 2.Miglioramento algoritmo estrazione pubblicazioni da homepage che presentano i titoli/autori in maniera non omogenea. 3.Modifica o creazione parser che possano parser qualunque tipo di pagina HTML/XML.

28 GRAZIE PER LATTENZIONE!