Linguaggi e Modelli Computazionali a.a. 2009/2010 FantaGenius Docente: Studente: Enrico Denti Gabriele Morlini
FantaGenius: Lo scopo Lo scopo di questa applicazione è aiutare il giocatore di Fantacalcio nelle attivita di routine, evitando di analizzare diverse pagine di quotidiani e siti internet, alla ricerca delle informazioni necessarie per essere vincenti in questo gioco. L'applicazione deve fornire quindi le informazioni reperite dai siti web, in maniera comoda per il giocatore attraverso un interfaccia grafica, e aiutarlo nelle decisioni. Ma cos’è il fantacalcio? Un breve accenno..
FantaGenius: Cos’è il Fantacalcio Il Fantacalcio è un gioco nel quale un gruppo di persone si sfidano con le proprie “fantasquadre”. Una “fantasquadra” è composta da 25 giocatori della serie A di squadre anche diverse. Le “fantasquadre” si affrontano in un campionato parallelo a quello della serie A. Le “fantasquadre” si affrontano in una serie di partite,per ognuna delle quali bisogna creare una formazione, in cui vince chi fa il punteggio più alto. Il punteggio della formazione schierata è determinata dalla somma dei voti assegnati in pagella dai quotidiani e dai punti "bonus" e "malus" .
FantaGenius: Le attivà di routine Prima di ogni giornata di campionato bisognava: Conoscere le formazioni probabili, per sapere chi gioca o meno. Conoscere le medie dei voti dei giocatori, per scegliere i giocatori migliori Creare una formazione. Dopo ogni giornata di campionato bisognava: Calcolare il punteggio di una partita fra due formazioni. Dal punteggio ricavare il risultato.
FantaGenius: Obiettivi Realizzare un parser in grado di prima di tutto di riconoscere una pagina web già esistente, fornendo solo le informazioni interessanti all’interprete, organizzandole in maniera adeguata, in una insieme di nodi/classi legate fra di loro. Realizzare un interprete in grado di utilizzare le informazioni fornite sotto forma di classi, per aiutare l’utente nelle attività di routine,attraverso una comoda interfaccia grafica.
FantaGenius: Linguaggi I linguaggi studiati quindi nel corso della realizzazione di questa applicazione, si riconducono all’ HTML (HyperText Markup Language). Al fine di poter estrarre le informazioni dalle pagine, sono state realizzate delle grammatiche che riconoscono i tipi e la posizione dei tag Html. Ogni grammatica può essere divisa in 2 parti: Una parte condivisa per riconoscere gli elementi costitutivi di un documento HTML. Una parte specifica per riconoscere le informazioni utili.
FantaGenius: I siti internet Le pagine web da cui si è partiti per scrivere le grammatiche: Per le formazioni probabili www.fantagazzetta.com/probabili-formazioni-serie-a.asp Per conoscere le medie dei voti dei giocatori, per scegliere i giocatori migliori: www.fantagazzetta.com/statistiche_portieri.asp www.fantagazzetta.com/statistiche_difensori.asp www.fantagazzetta.com/statistiche_centrocampisti.asp www.fantagazzetta.com/statistiche_attaccanti.asp Per i voti dei giocatori per il calcolo del punteggio di una partita. http://www.pianetafantacalcio.it/Voti_Ufficiali.asp
FantaGenius: Le grammatiche Per le formazioni probabili: www.fantagazzetta.com/probabili-formazioni-serie-a.asp Per conoscere le medie dei voti dei giocatori, per scegliere i giocatori migliori: www.fantagazzetta.com/statistiche_portieri.asp www.fantagazzetta.com/statistiche_difensori.asp www.fantagazzetta.com/statistiche_centrocampisti.asp www.fantagazzetta.com/statistiche_attaccanti.asp Per i voti dei giocatori per il calcolo del punteggio di una partita. http://www.pianetafantacalcio.it/Voti_Ufficiali.asp ProbFormGrammar.jj StatPortGrammar.jj StatGiocGrammar.jj VotiGrammar.jj
Le grammatiche: la parte comune La parte comune si tratta principalmente dello scanner che riconosce i tag HTML e li fornisce sottoforma di token al parser, e alcune produzioni della grammatica. TOKEN: <DIGIT>::= ["0"-"9"] <#StringElement>::= <DIGIT> | ["a"-"z"] | ["A"-"Z"] | "!" | "?" | ":" | "_"| "=" | "/" | "\"" | "\\" | "-" | ";" | "(" | ")" | "{" | "}" | "[" | "]" | "+" | "&" | "|" | "*" | "#" | "%" | "." | ","| "\'" | "@" | "\u00c3\u00a8" | … e atri caratteri particolari...> <STRING>::= <StringElement> (<StringElement> | " ")*> <SUBSTRING::= "\'" (<STRING> | "<" | ">")* "\'">
Le grammatiche: la parte comune La parte comune si tratta principalmente dello scanner che riconosce i tag HTML e li fornisce sottoforma di token al parser, e alcune produzioni della grammatica. TOKEN: <HTMLstart>::= "<html " <STRING> <END> <HTMLend>::= "</html>" <BODYstart>::= "<body>" <BODYend>::= "</body>" <HEADstart::= "<head>" <HEADend::= "</head>" <END>::= "/>" | ">"
Le grammatiche: la parte comune La parte comune si tratta principalmente dello scanner che riconosce i tag HTML e li fornisce sottoforma di token al parser, e alcune produzioni della grammatica. TOKEN: <TABLEstart>::= "<table " <STRING> ">" <TABLEend>::= "</table>" <TRstart>::= "<tr " <STRING> ">" | "<tr>" <TRend>::= "</tr>" <TDstart>::= "<td " <STRING> ">" | "<td>" <TDend>::= "</td>" e così via per tutti i possibili tag HTML...
Le grammatiche: la parte comune La parte comune si tratta principalmente dello scanner che riconosce i tag HTML e li fornisce sottoforma di token al parser, e alcune produzioni della grammatica. SCOPO: Html_page ::= Html_comment <HTMLstart> <HEADstart> Html_HEAD <HEADend> <BODYstart> Html_BODY <BODYend> <HTMLend> <EOF>
Le grammatiche: la parte comune La parte comune si tratta principalmente dello scanner che riconosce i tag HTML e li fornisce sottoforma di token al parser, e alcune produzioni della grammatica. PRODUZIONI: Html_HEAD ::= ( Html_head_element )* Html_head_element ::= <META>|<TITLE>|<LINK>| Html_script| Html_comment Html_BODY ::=( Html_body_element )* Html_body_element::=Html_comment | Html_href | Html_form | Html_ul | Html_table| Html_script | <BR>| <STRING> | Html_div |...e molti altri..
Le grammatiche: la parte comune La parte comune si tratta principalmente dello scanner che riconosce i tag HTML e li fornisce sottoforma di token al parser, e alcune produzioni della grammatica. PRODUZIONI: Html_img::=<IMGstart> ( <STRING> )+ <END> Html_strong::=<STRONGstart> ( <STRING> | <EM> | Html_img | Html_href | <BR> )* <STRONGend> Html_href::=<HREFstart> ( <STRING> | Html_strong | Html_img )* <HREFend> Html_span::=<SPANstart> ( <BR> | <STRING> | <BOLD> | Html_img | Html_strong )* <SPANend> ....E così via per tutti gli altri possibili elementi Html...
Le grammatiche: la parte comune La parte comune si tratta principalmente dello scanner che riconosce i tag HTML e li fornisce sottoforma di token al parser, e alcune produzioni della grammatica. PRODUZIONI: Html_div ::= <DIVstyleStart> ( Html_body_element )+ ( <DIVend> )? | ( <DIVgen> ( <STRING> )* <END> | "<div>" ) ( Html_body_element )+ ( <DIVend> )? |<DIVtitolo> <STRING> <DIVend> | …….. Altra Produzione diversa per ogni grammatica specifica di una certa pagina web
Le grammatiche: Probabili Formazioni In una pagina web ci sono informazioni: trascurabili e altre interessanti Html_div ::= <DIVstyleStart> ( Html_body_element )+ ( <DIVend> )? | ( <DIVgen> ( <STRING> )* <END> | "<div>" ) ( Html_body_element )+ ( <DIVend> )? |<DIVtitolo> <STRING> <DIVend> | <DIVprobabili> Probabili <DIVend>
Le grammatiche: Probabili Formazioni Le formazioni probabili sono composti da una serie di scontri Probabili ::= ( <DIVscontro> Scontro <DIVend> )+ <DIVstyleStart><IFRAME><DIVend> ( <DIVscontro> Scontro <DIVend> )+
Le grammatiche: Probabili Formazioni Ogni scontro contiene diverse informazioni: Scontro::= <DIVtitolo><DIVintestazione> <STRING><DIVend> <DIVorario> <STRING><DIVend> <DIVend> <DIVgen> <STRING> <END> Ultime <DIVend> <DIVteam> TeamSx <DIVend> <DIVteam> TeamDx <DIVend> <DIVgen> <STRING> <END> html_body_element
Le grammatiche: Probabili Formazioni Ogni scontro contiene diverse informazioni:come il nome della squadra, e informazioni specifiche su alcuni giocatori. Ultime ::= <BOLD> ( <BR> )+ <SPANstart> <STRING> <SPANend> <STRING> <BOLD> <BR> ( <STRING> | <SUBSTRING> )* ( <BR> )+ InfoGiocatori ( html_href ( <BR> )+ )? <SPANstart> <STRING> <SPANend> ( <BR> )+
Le grammatiche: Probabili Formazioni Informazioni specifiche su alcuni giocatori: InfoGiocatori ::= ( <DIVstyleStart> ( Squalificati | Infortunati | InDubbio ) <DIVend> ( <BR> )+ )* Squalificati ::= <SPANsqualificati> <BR> <STRING> Infortunati ::= <SPANinfortunati> InDubbio ::= <SPANinDubbio>
Le grammatiche: Probabili Formazioni Informazioni specifiche sui giocatori titolari e in panchina in uno scontro: TeamSx::= ( GiocatoreSx )+ <DIVpanchinaSx> <STRING> <DIVend> ( GiocatoreSx )+ GiocatoreSx::= <DIVsx> <STRING> <DIVend> <DIVruolo> <STRING> <DIVend> TeamDx::= ( GiocatoreDx )+ <DIVpanchinaDx> <STRING> <DIVend> ( GiocatoreDx )+ GiocatoreDx::=<DIVruolo><STRING><DIVend> <DIVdx> <STRING> <DIVend> Nome giocatore
Le grammatiche: Probabili Formazioni Token specifici delle probabili formazioni: <SPANsqualificati>::= <SPANstart> "Squalificati" <SPANend> <SPANinfortunati>::=<SPANstart> "Infortunati" <SPANend> <SPANinDubbio>::= <SPANstart> "In dubbio" <SPANend> <DIVprobabili>::= "<div id=\"probabili\">" <DIVscontro>::= "<div class=\"scontro \">" <DIVteam>::= "<div class=\"team\">" <DIVsx>::= "<div class=\"sx\">" <DIVpanchinaSx>::= "<div class=\"panchinasx\">" <DIVdx>::= "<div class=\"dx\">" <DIVpanchinaDx>::= "<div class=\"panchinadx\">" <DIVruolo>::= "<div class=\"ruolo\">" <DIVintestazione>::= "<div class=\"intestazione\">" <DIVorario>::= "<div class=\"orario\">"
Le grammatiche: Statistiche In una pagina web ci sono informazioni: trascurabili e altre interessanti Html_div ::= <DIVstyleStart> ( Html_body_element )+ ( <DIVend> )? | ( <DIVgen> ( <STRING> )* <END> | "<div>" ) ( <DIVend> )? |<DIVtitolo> <STRING> <DIVend> | <DIVstat> Stat <DIVend> <DIVstat>::= "<div class=\"stat-box\">"
Le grammatiche: Statistiche Le statistiche di tutti i giocatori di un ruolo sono contenuti all'interno di una tabella: Stat ::= <TABLEstart> Giocatori<TABLEend> Ogni riga contiene i dati di un giocatore: Giocatori ::= ( <TRstart> Giocatore <TRend> )+
Le grammatiche: Statistiche Ogni statistica di un giocatore del campo,ovvero di tutti escluso il portiere, ha i seguenti dati: Giocatore ::= <TDstart> <STRING> <TDend> <TDstart> <HREFstart> <STRING> <HREFend> <TDend> <TDstart> <DIGIT> <TDend> <TDstart> ( <STRING> | <DIGIT> ) <TDend> <TDstart> ( <STRING> | <DIGIT> ) <Tdend> <TDstart> <DIGIT> <TDend> <TDstart> <DIGIT> <TDend> <TDstart> <DIGIT> <TDend> <TDstart> <DIGIT> <TDend> <TDstart> <DIGIT> <TDend> <TDstart> <DIGIT> <TDend> <TDstart> <STRING> <TDend> ID Giocatore Cognome Giocatore Partite Giocate Media Voto Media Voto con Bonus/Malus Media Voto prec. con Assist Goal Fatti Rigori a segno Rigori sbagliati Assist Ammonizioni Espulsioni Squadra Quotazione
Le grammatiche: Statistiche Mentre il portiere ha i seguenti dati: Giocatore ::= <TDstart> <STRING> <TDend> <TDstart> <HREFstart> <STRING> <HREFend> <Tdend> <TDstart> <DIGIT> <Tdend> <TDstart> ( <STRING> | <DIGIT> ) <TDend> <TDstart> <DIGIT> <TDend> <TDstart> <DIGIT> <TDend> <TDstart> <DIGIT> <TDend> <TDstart> <DIGIT> <TDend> <TDstart> <STRING> <TDend> ID Giocatore Cognome Giocatore Partite Giocate Media Voto Media Voto con Bonus/Malus Gol subiti Rigori parati Ammonizioni Espulsioni Squadra Quotazione
Le grammatiche: Voti Per i voti si è utilizzato un sito diverso,più orientato alle tabelle, questo ha implicato una grammatica un po' più rigida e meno leggibile: Html_div ::= ...sempre uguale... | <DIVvoti> <TABLEstart> Voti <TABLEend> <DIVend> Voti ::= {<TRstart> <TDstart> Html_table <TDend> <TRend>}3 <TRstart> ( <TDstart> Html_body_element <TDend> )+ <TRend>....
Le grammatiche: Voti .... <TRstart> <TDstart> Squadre <Tdend> <TRend> <TDstart> Html_table <Tdend> <Trend> Squadre::= <BR> ( Html_script )+ Html_table Html_div <BR> ( Squadra )+ <BR> Squadra ::= <TABLEstart>....<TABLEend> Giocatori
Le grammatiche: Voti Giocatori ::= ( <TABLEstart> <TRstart> Giocatore <TRend> ( <TRstart> ( <TDstart> html_body_element <TDend> )+ <TRend> )* <TABLEend> )+ <BR>
Le grammatiche: Voti Il voto di un giocatore ha 29 possibili attributi/colonne..il risultato è una grammatica un po' prolissa.. Giocatore ::= <TDstart> ( <STRING> | <IMGstart> <END> )* <Tdend> <TDstart> ( <IMGpor> | <IMGdif> | <IMGcen> | <IMGatt> | <IMGstart> <END> )* <TDend> <TDstart> ( <HREFstart> <STRING> <HREFend> | <STRING> ) <TDend> <TDstart> ( <STRING> | <IMGamm> | <IMGesp> )* <Tdend> <TDstart> ( <STRING> | <DIGIT> ) <TDend> ....
Grammatica e Linguaggio: Tipologia Grammatica di tipo 2(context‐free) secondo Chomsky perchè le produzioni sono vincolate alla forma:: A → α con A ε VN e α ε (VN U VT)+ Linguaggio di tipo 2 perché sono presenti produzioni che contengono self-embedding: A → α1 A α2 con A ε VN e α1, α2 ε (VN U VT)+ LL(1)perchè l’insieme degli director-symbols corrispondenti alle parti destre delle produzioni alternative di uno stesso metasimbolo sono fra loro disgiunti;
Grammatica e Linguaggio: Tipologia Grammatica di tipo 2(context‐free) secondo Chomsky perchè le produzioni sono vincolate alla forma:: A → α con A ε VN e α ε (VN U VT)+ Linguaggio di tipo 2 perché sono presenti produzioni che contengono self-embedding: A → α1 A α2 con A ε VN e α1, α2 ε (VN U VT)+ LL(1)perchè l’insieme degli director-symbols corrispondenti alle parti destre delle produzioni alternative di uno stesso metasimbolo sono fra loro disgiunti; All’interno di un documento HTML potrei avere una serie di elementi di tipo DIV annidati: Html_body_element::= <STRING>|…| Html_div Html_div ::= “<div>”( Html_body_element )+ ( <DIVend> )? Es.:<div><div>…<div>Ciao!!</div>…</div></div> All’interno di un documento HTML potrei avere una serie di elementi di tipo DIV annidati: Html_body_element::= <STRING>|…| Html_div Html_div ::= “<div>”( Html_body_element )+ ( <DIVend> )? Es.:<div><div>…<div>Ciao!!</div>…</div></div> All’interno di un documento HTML potrei avere una serie di elementi di tipo DIV annidati: Html_body_element::= <STRING>|…| Html_div Html_div ::= “<div>”( Html_body_element )+ ( <DIVend> )? Es.:<div><div>…<div>Ciao!!</div>…</div></div>
FantaGenius: La squadra Per salvare e caricare una squadra è stato realizzato uno specifico linguaggio di tipo 3(non c'è self-enbedding),descritto dalla seguente grammatica , gestita tramite la funzione “.split(String sep)” della classe String: Squadra:=ListaGiocatori"\n" ListaGiocatori"\n" ListaGiocatori ListaGiocatori::=(Giocatore ";" ListaGiocatori)|Giocatore ";" Giocatore::=Nome","Squadra Nome::=<STRING> Squadra::=<STRING> MiaSquadra.txt: Antonioli,CESENA;Cavalieri,CESENA;Handanovic,UDINESE; Criscito,GENOA;Samuel,INTER;Nesta,MILAN;Cassetti,ROMA;Dias,LAZIO;dellafiore,PARMA;Felipe,FIORENTINA;Grava,NAPOLI; Cambiasso,INTER;Pirlo,MILAN;alvarez e. a.,BARI;Colucci,CESENA;Giovinco,PARMA;Marchionni,FIORENTINA;Jimenez,CESENA;Marques,PARMA; Gilardino,FIORENTINA;Cassano,SAMPDORIA;Del Piero,JUVENTUS;pozzi,SAMPDORIA;paloschi,PARMA;marilungo,SAMPDORIA;
FantaGenius: La formazione Per salvare e caricare una formazione è stato realizzato uno specifico linguaggio di tipo 3(non c'è self-embedding) descritto dalla seguente grammatica, gestita tramite la funzione “.split(String sep)” della classe String: Formazione_S::="titolari:\n"Formazione "panchina:\n"Formazione Formazione:=Portiere"\n" ListaGiocatori"\n" ListaGiocatori Portiere::=<STRING> ListaGiocatori::=(<STRING> "," ListaGiocatori) |<STRING> MiaFormazione.txt: titolari: Antonioli Nesta,criscito,samuel,Dias Giovinco,Pirlo,Cambiasso Cassano,gilardino,del Piero panchina: Handanovic Cassetti,grava Marques,colucci Pozzi
FantaGenius: Strumenti utilizzati Linguaggio di programmazione: JavaSE 1.6 Generazione automatica di scanner e parser: JavaCC 5.0 Interfaccia grafica NetBeans 6.8 Ambiente di sviluppo: Eclipse 3.5
FantaGenius: Architettura Package: App: Classi necessarie all’interfaccia grafica. Elements: Classi a cui corrispondo le principali entità del sitema. Parser: Classi relative allo scanner ed al parser create in automatico da javacc.
FantaGenius: Architettura
FantaGenius: Architettura
FantaGenius: Test L'applicazione è già stata utilizzata nelle ultime due giornate di campionato di serie A. I giocatori che l'hanno provato sono rimasti soddisfatti.
FantaGenius: Interfaccia grafica Colori per rappresentare stato giocatori: Verde: titolare Azzurro: panchina Rosso: squalificato Grigio: infortunato Bianco: non esistente
FantaGenius: Interfaccia grafica
FantaGenius: Possibili sviluppi Utilizzo di tuProlog per calcolare il risultato di una partita e calcolare una formazione ideale in maniera più “intelligente” e flessibile. Unificare in un unico file la parte comune delle 4 grammatiche riguardanti i siti web. Possibilità di modificare alcuni parametri dell'applicazione, attraverso l'interfaccia grafica.