La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Matematiche Fisiche e Naturali Progetto e Sviluppo di unApplicazione Mobile per il.

Presentazioni simili


Presentazione sul tema: "Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Matematiche Fisiche e Naturali Progetto e Sviluppo di unApplicazione Mobile per il."— Transcript della presentazione:

1 Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Matematiche Fisiche e Naturali Progetto e Sviluppo di unApplicazione Mobile per il Calcolo dellH-Index Daniele Cristofori Relatore: Prof. Riccardo Martoglia Anno accademico 2010/2011

2 INTRODUZIONE Negli ultimi anni Google e Microsoft hanno cercato sempre di più di democratizzare i criteri di valutazione degli scienziati. Tentativo a tale scopo H-Index di Jorge E. Hirsch. Definizione di Hirsch: Uno scienziato possiede un indice h se h dei suoi Np lavori hanno almeno h citazioni ciascuno e i rimanenti (Np – h) lavori hanno ognuno al più h citazioni. Introduzione1 Esistono in rete diverse applicazioni che calcolano lH-Index appoggiandosi a Google Scholar ma presentano tutte dei problemi…

3 INTRODUZIONE Introduzione2 Non appartiene a Floriana Esposito

4 INTRODUZIONE La precedente pubblicazione, pur non appartenendo a Floriana Esposito, partecipa al calcolo dellH-Index Errore!!! Introduzione3 Soluzione: Estrarre tutte le pubblicazioni dallhomepage dello scienziato di riferimento e considerare solo quelle nel calcolo dellH-Index. Alcune applicazioni hanno la funzionalità che permette di selezionare o deselezionare da parte dellutente quelle pubblicazioni che si ritiene non appartengono allo scienziato considerato Troppo oneroso dal punto di vista utente!!!

5 INTRODUZIONE E stata creata unapplicazione H-Index Calculator per iPhone (adottando quindi il linguaggio di programmazione Objective-C) che calcoli lH-Index di un qualsiasi scienziato in maniera ottimale. Introduzione4

6 LAPPROCCIO SEGUITO Estrazione pubblicazioni da homepage. Confronto pubblicazioni da Google Scholar con pubblicazioni da homepage. Lapproccio seguito5

7 ESTRAZIONE PUBBLICAZIONI DA HOMEPAGE Obiettivo: Estrapolazione di tutte le pubblicazioni (titoli ed eventualmente autori) da una qualunque homepage. Estrazione pubblicazioni da homepage 6 Problema: Non si ha la conoscenza della struttura della pagina HTML che contiene tutte le pubblicazioni. Soluzione: Ideazione ed implementazione di un algoritmo che, in maniera automatica, cerca di capire comè strutturata lhomepage. Di seguito è mostrata una simulazione dellalgoritmo.

8 ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE Estrazione pubblicazioni da homepage 7 … MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION. … INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING. …

9 INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING. … MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION. ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE Estrazione pubblicazioni da homepage 8

10 … INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING. … MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION. ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE Estrazione pubblicazioni da homepage 9

11 … INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING. … MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION. ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE Estrazione pubblicazioni da homepage 10

12 … INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING. … MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION. ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE Estrazione pubblicazioni da homepage 11

13 … INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING. … MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION. ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE Estrazione pubblicazioni da homepage 12

14 … INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING. … MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION. ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE Estrazione pubblicazioni da homepage 13

15 … INFERENCE OF ABDUCTION THEORIES FOR HANDLING INCOMPLETENESS IN FIRST-ORDER LEARNING. … MULTISTRATEGY OPERATORS FOR RELATIONAL LEARNING AND THEIR COOPERATION. ALGORITMO ESTRAPOLAZIONE PUBBLICAZIONI DA HOMEPAGE Estrazione pubblicazioni da homepage 14 Fine della risalita!

16 LAPPROCCIO SEGUITO Algoritmo intelligente di estrapolazione pubblicazioni da homepage. Confronto pubblicazioni da Google Scholar con pubblicazioni da homepage. Lapproccio seguito15

17 CONFRONTO PUBBLICAZIONI Obiettivo: Riconoscere lo stesso titolo estratto dallhomepage in Google Scholar e viceversa. Problema: In diversi casi una determinata pubblicazione estratta da Google Scholar è presentata con qualche piccola differenza di caratteri rispetto alla stessa pubblicazione allinterno dellhomepage. Non si può quindi usare un metodo di uguaglianza. Soluzione: Definire un grado di similarità sopra il quale le due pubblicazioni vengano considerate la stessa. Questo lo si può fare grazie allalgoritmo Edit Distance. Edit Distance: date str1 e str2 due stringhe in input, ritorna il numero minimo di modifiche elementari che consentano di trasformare la stringa str1 nella stringa str2. Confronto pubblicazioni16

18 INTRODUZIONE Introduzione17 Verrebbe scartata

19 INTRODUZIONE Introduzione18 Grazie allEdit Distance viene presa in considerazione

20 ALGORITMO EDIT DISTANCE Algoritmo Edit Distance19 e(i, j) = min c(a, b) = εANALYSIS-AND-THE-SODAS ε012345678910111213141516171819202122 A1 N2 A3 L4 Y5 S6 I7 S8 -9 A10 N11 D12 -13 S14 O15 D16 A17 S18

21 ALGORITMO EDIT DISTANCE Algoritmo Edit Distance20 e(i, j) = min c(a, b) = εANALYSIS-AND-THE-SODAS ε012345678910111213141516171819202122 A10 N2 A3 L4 Y5 S6 I7 S8 -9 A10 N11 D12 -13 S14 O15 D16 A17 S18

22 ALGORITMO EDIT DISTANCE Algoritmo Edit Distance21 e(i, j) = min c(a, b) = εANALYSIS-AND-THE-SODAS ε012345678910111213141516171819202122 A10 N21 A3 L4 Y5 S6 I7 S8 -9 A10 N11 D12 -13 S14 O15 D16 A17 S18

23 ALGORITMO EDIT DISTANCE Algoritmo Edit Distance22 e(i, j) = min c(a, b) = εANALYSIS-AND-THE-SODAS ε012345678910111213141516171819202122 A10 N21 A32 L4 Y5 S6 I7 S8 -9 A10 N11 D12 -13 S14 O15 D16 A17 S18

24 ALGORITMO EDIT DISTANCE Algoritmo Edit Distance23 e(i, j) = min c(a, b) = εANALYSIS-AND-THE-SODAS ε012345678910111213141516171819202122 A10123456789101112131415161718192021 N2101234567891011121314151617181920 A321012345678910111213141516171819 L43210123456789101112131415161718 Y5432101234567891011121314151617 S654321012345678910111213141516 I76543210123456789101112131415 S8765432101234567891011121314 -987654321012345678910111213 A109876543210123456789 1112 N11109876543210123456789 11 D1211109876543210123456789 -131211109876543210123456789 S1413121110987654321123445678 O15141312111098765432223454567 D161514131211109876543333455456 A1716151413121110987654444456545 S1817161514131211109876555554565

25 ALGORITMO EDIT DISTANCE Algoritmo Edit Distance24 εANALYSIS-AND-THE-SODAS ε012345678910111213141516171819202122 A10123456789101112131415161718192021 N2101234567891011121314151617181920 A321012345678910111213141516171819 L43210123456789101112131415161718 Y5432101234567891011121314151617 S654321012345678910111213141516 I76543210123456789101112131415 S8765432101234567891011121314 -987654321012345678910111213 A109876543210123456789 1112 N11109876543210123456789 11 D1211109876543210123456789 -131211109876543210123456789 S1413121110987654321123445678 O15141312111098765432223454567 D161514131211109876543333455456 A1716151413121110987654444456545 S18171615141312111098765555545654 LEdit Distance tra la stringa ANALYSIS AND THE SODAS e ANALYSIS AND SODAS è 4 e(i, j) = min c(a, b) = Con un grado di similarità adeguato, Le due pubblicazioni verrebbero considerate uguali

26 TECNOLOGIE ADOTTATE Tecnologie adottate25 Lapplicazione è stata sviluppata sfruttando: 1.Il sistema operativo iOS 2.Il linguaggio di programmazione Objective-C 3.I componenti grafici della libreria UIKit 4.Lo standard W3C del linguaggio XPath 5.Il database sqlite 6.I parser JujuParser e HTMLParser

27 CONCLUSIONE E SVILUPPI FUTURI Conclusione e sviluppi futuri27 Si è arrivati alla creazione di unapplicazione per iPhone che calcoli in maniera ottimale lH-Index di un qualsiasi scienziato. Punto di forza: prendere in considerazione in modo automatico solo quelle pubblicazioni che appartengono allo scienziato in questione scartando quelle pubblicazioni sporche comunque restituite da Google Scholar. Sviluppi futuri: 1.Aggiunta funzionalità di modifica delle pubblicazioni. 2.Miglioramento algoritmo estrazione pubblicazioni da homepage che presentano i titoli/autori in maniera non omogenea. 3.Modifica o creazione parser che possano parser qualunque tipo di pagina HTML/XML.

28 28 GRAZIE PER LATTENZIONE!


Scaricare ppt "Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Matematiche Fisiche e Naturali Progetto e Sviluppo di unApplicazione Mobile per il."

Presentazioni simili


Annunci Google