1 Legal Information Retrieval on the Web The Experience of the NiR Portal Costantino Ciampi.

Slides:



Advertisements
Presentazioni simili
LEGAL INFORMATION ON THE WEB: THE ITALIAN SITUATION
Advertisements

Consumare Web Service Andrea Saltarello
1 Quale spazio per uneducazione plurilingue nella scuola di oggi? Firenze, 30 settembre 2011 Silvia Minardi.
Sistemi per lelaborazione dellinformazione Maria Teresa Pazienza DISP - Dipartimento di Informatica, Sistemi e Produzione aa
1 STATO DELLINTEGRAZIONE TRA I 4 PROGETTI AVVISO 1575/2004 ATTIVITA DEL GRUPPO TECNICO OPERATIVO Riunione del Comitato Tecnico sullInteroperabilità MUR,
Nuovi prodotti e processi più efficienti: le opportunità tecnologiche e di finanziamento.
Best Practices: i Risultati dellInnovazione. Salerno, 26 Nov 07.
Roberto Dallari Seminario Nazionale sui Metadati Roma 3 aprile 2001
Queuing or Waiting Line Models
Teoria e tecniche della catalogazione e classificazione ricerca9web Prof.ssa Elisa Grignani Università degli studi di Parma aa. 2005/2006.
11 1 Roma, 11 dicembre 2006 Laura Gasparini Garanzia su Portafogli Estero.
Le pubblicazioni ufficiali dalla carta al web Il caso italiano Official publications from paper to web: the Italian case Official publications and Government.
La sicurezza può essere fornita in ciascuno degli strati: applicazione, trasporto, rete. Quando la sicurezza è fornita per uno specifico protocollo dello.
REGIONE AUTONOMA FRIULI VENEZIA GIULIA PROTEZIONE CIVILE DELLA REGIONE
Le politiche della Commissione Europea sull'accesso aperto. Il ruolo delle biblioteche accademiche Salone del libro di Torino, 10 maggio 2012 Maddalena.
Secure Socket Layer (SSL) Transport Layer Security (TLS)
Distribuzione del numero di alleli condivisi da coppie di fratelli e di non-parenti tipizzati rispettivamente per 5, 9 e 13 markers.
ANALYSIS & DESIGN 1. Analysis & Design The goal of the Analysis & Design workflow is to show how the system will be realized in the implementation phase.
FASTVID RENTALS: BUSINESS MODELING 1. Business Modeling One of the major problems with most business engineering efforts, is that the software engineering.
“Alternative methods in animal experimentation: evaluating scientific, ethical and social issues in the 3Rs context” Consiglio Nazionale delle Ricerche,
WP4 – Software Infrastructures. How it was Overall goal “The outcome of WP4 is the design, implementation and evaluation of software components that will.
Giovanni Biondi ICT e trasformazione della Scuola.
Prof. G. PassianteCorso di Economia dell’innovazione - A.A. 2012/13 Processi di gestione della conoscenza.
UML: Activity diagram Corso IS I /03 Gianna Reggio Versione 0.1.
4/20/20151 Metodi formali dello sviluppo software a.a.2013/2014 Prof. Anna Labella.
Metodi Quantitativi per Economia, Finanza e Management Lezioni n° 7-8.
Giuseppe Gramazio e Massimo Legnani Framework integrato per il delivery di applicazioni context aware, multimodali e accessibili – SAF (Situation aware.
Taccani1 7.4 Identification ANALISI DEI PERICOLI Hazard Analysis Identificazione Valutazione Misure di Controllo Control Measures Assessment.
Chapter Eighteen1 CHAPTER 3 Distribution of national income A PowerPoint  Tutorial To Accompany MACROECONOMICS, 7th. ed. N. Gregory Mankiw Tutorial written.
8 Maggio 2002Workshop CCR - La Biodola W2K Coordination Group & HEP-NT Report Enrico M.V. Fasanelli Gian Piero Siroli.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle.
Accoppiamento scalare
Politecnico di Milano Facoltà di Ingegneria dell’ Informazione Laurea Specialistica in INGEGNERIA INFORMATICA La laurea Specialistica in Ingegneria Informatica.
SUMMARY Time domain and frequency domain RIEPILOGO Dominio del tempo e della frequenza RIEPILOGO Dominio del tempo e della frequenza.
Mobilità tra i Paesi del Programma KA103 A.A. 2014/2015 (KA103) Mobility Tool+ e il Rapporto Finale Claudia Peritore Roma luglio 2015.
L A R OUTINE D EL M ATTINO Ellie B.. Io mi sono svegliata alle cinque del mattino.
RIEPILOGO Transistor JFET
Alessandra De Cugis Progetto Tempi e Orari del Comune di Milano Time in the cities, a holistic approach for urban time issues, the case of Milan Paper.
Project Review Novembrer 17th, Project Review Agenda: Project goals User stories – use cases – scenarios Project plan summary Status as of November.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle Prof.
40 years of the Italian JPO Programme: an overview 14 dicembre Camera dei deputati - Roma Giovani italiani nelle Nazioni Unite: una storia lunga.
La governance europea. Governance without government J. N. Rosenau e E. O. Czempiel, Governance without government: order and change in world politics,
Titolo evento Luogo, data Seminario INSPIRE Bologna, luglio 2012 INSPIRE NETWORK SERVICES obblighi normativi e metodologie per valorizzare il patrimonio.
Prof. M. Battaglia «Prostate network» Uno modello organizzativo innovativo in epoca di HTA e spending review.
Prof. Giacomo Dalseno USARE MOODLE Differenti forme di interazione.
Buon giorno, ragazzi oggi è il quattro aprile duemilasedici.
Corso di ricerca bibliografica. I motori di ricerca in rete Un motore di ricerca è un software composto da tre parti: 1.Un programma detto ragno (spider)
Music Television Special Features. Etere For Music TV Integrated Music scheduling Music Video Cross fade Titling control.
Domenica Taruscio Direttore Centro Nazonale Malattie Rare Istituto Superiore di Sanità Roma
Laurea Magistralis in “Economia e Legislazione d’Impresa” (Economics and Law for Business) Objectives and Overview Program Structure Courses Advisory Board.
EContentplus ATHENA - Access to Cultural Heritage Networks across Europe - Per l’integrazione dei dati in Europeana.
ITALIAN ITALIAN FOR POST GRADUATE STUDENTS 22 nd February 2016 WEEK 1 Aureliana Di Rollo.
Titolo evento Luogo, data Seminario INSPIRE Bologna, luglio 2012 Profili, strumenti ed implementazioni dei metadati Antonio Rotundo Agenzia per l’Italia.
A.A CORSO INTEGRATO DI INFORMATICA E BIOINFORMATICA per il CLT in BIOLOGIA MOLECOLARE Scuola di Scienze, Università di Padova Docenti: Proff.
ORGANISATION OF THE EDUCATION SYSTEM IN ITALY 2010/2011.
Grundtvig Project IOLI Example of flexible, blended and distance learning materials used in Ce.s.i.e Onlus Il presente progetto è finanziato con il sostegno.
TGC upgrade for SLHC (ATL-P-MN-0028 ) Fra le parti più colpite dall’aumento di rate previsto a SLHC ci sono le Small Wheels Le TGC con catodo a bassa resistività.
Project IOLI Practical exemple in Italy and in Sicily Il presente progetto è finanziato con il sostegno della Commissione europea. L’autore è il solo responsabile.
STMan Advanced Graphics Controller. What is STMan  STMan is an advanced graphic controller for Etere automation  STMan is able to control multiple graphics.
Futuro di EGI EGI è menzionato esplicitamente nel draft delle nuove calls EU ( H2020 ) Da ultima versione (per me) data 18-9 di –HORIZON 2020 – WORK PROGRAMME.
MSc in Communication Sciences Program in Technologies for Human Communication Davide Eynard Facoltà di scienze della comunicazione Università della.
Do You Want To Pass Actual Exam in 1 st Attempt?.
Riunione INFN – Bologna, 17 January 2013
MONBOX Federico Bitelli bitelli<at>fis.uniroma3.it
Dichiarazione dei servizi di sito nel GOCDB
PhD Theses Institutional Archive Unitn-eprints PhD Upload, mandatory deposit and copyright issues at Unitn Highlights DRSBA. Ufficio Anagrafe della ricerca,
General Office for Airspace
SWORD (School and WOrk-Related Dual learning)
Accesso al corpus it. / ing. parola cercata sintagmi preposizioni.
Transcript della presentazione:

1 Legal Information Retrieval on the Web The Experience of the NiR Portal Costantino Ciampi

Legal Information Retrieval on the Web The Experience of the NiR Portal ( Costantino Ciampi CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t Contents Normeinrete (NIR) – “Access to Law on the Net”: an e-Government project Project description (goals, technology, results) Standardization in the legal domain: XML representation of Italian norms URN adoption to automate hyperlinking among norms in a distributed environment Rome, 26 April 2004

3 NiR Project " Access to Law on the Net " Improving accessibility to legislation by providing a unique point of access to Italian and EU legal documents published on different web sites – ICT to allow rights fulfillment Supporting PA in managing legislative documentation life cycle and law consolidation by providing standardization, software tools and methodologies – ICT to improve PA efficiency CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t Project goals A system prototype ( third version ) is available at the Url:

4 Main Actors: –Minister of Justice (beginner) ( –AIPA -> CNIPA - (Authority ->) National Center for Information Technology in the Public Administration (founder and technical coordinator) (now CNIPA) ( Scientific and Technical Partners: –Institute of Legal Information Theory and Technologies of the CNR, Florence ( –CINECA Consortium, Bologna ( Public Administrations participating at the Project CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t NiR Actors

5 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t Phase I (May May 2000) First Study of feasibility and realization of the Portal prototype Phase II (December November 2001) Second Study of feasibility, extension of the documentary base and qualitative evolution of the Portal prototype Phase III (years 2002/2003) D efinition of standards (URN and XML) and preparation of the software for the dissemination of the standards (parser of references and parser of structures, NIREditor XML) Phase IV (years 2004/2005) Commitment to external managers and full operation of the NIR Portal (with economic resources from the e-Government programme and Italian financial laws) Steps and Resources of the NiR Project

6 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t Implementation of a specialized portal, delivering search and retrieval functions of legislative documents published on various Public Administration's web sites; Definition of standards, consistent with Internet technologies, to represent data and metadata meaningful in the legal domain; Development and distribution of open source software to support legislative document management and publishing; Training and knowledge sharing among Public Administrations. NiR Project Strategy

7 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t provides unified access to Italian and European Union legislation published on different institutional web sites So far –more than 50 public institutions have taken part in the Project; –more than 140,000 documents have been indexed; –about 160,000 search sessions are held monthly on the site; –creation and updating of the NiR Legal Database ("Norm Catalogue") including metadata; –definition of the NiR Standards. Two standards issued by AIPA/CNIPA as technical norms –DTDs definition for Italian legislation; –URN definition for any kind of legal document; –Editors and other software tools developed and distributed to PA to support standard implementation. Present Results

8 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t The system is based on co-operative technological architecture, resulting in a federation of legislative data bases developed on different platforms. Co-operation is achieved by means of suitable application gateways which provide "loose" integration by adopting two standards: –one for identifying legal resources (URNs), and –one for representing document structures and metadata by XML mark-up language according to ad hoc DTDs. NiR Features

9 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t Searching Tools and Architecture of the NIR System (1) The NIR System consists of: NiR nodes: components belonging to administration domains containing legal database systems and related application gateways. Documents can be stored in the file system or within database/full text management systems: they are all accessible through the Internet Central registries: components in the co-operative layer publishing information, needed to allow effective co-operation

10 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t Searching Tools and Architecture of the NIR System (2) Central registries include: –Standards repository (XML DTD and URN grammar definitions and tools); –Registry of official Authority names, needed to standardise URN adoption; –Registry of NiR nodes, containing information needed to allow interaction between NiR agents and domain application gateways; –Norm Catalogue, containing, for each norm: title, basic classification, URN and the list of known physical addresses (URL) where it is published.

11 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t The Norm Catalogue (> documents) –The Norm Catalogue is a relational database containing, for each norm: title, basic classification, URN and the list of known physical addresses (URL) where it is published

12 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t NiR Standards Uniform Resource Name (URN) definition (based on IETF) to: –identify each document regardless of its physical address (URL) –allow automatic hyperlink through a resolution system (as DNS) Document Type Definition (DTD) for Italian legislative and regulatory acts (based on W3C XML Meta-language) to represent documents structure, semantics and metadata (*) The standards have been issued as AIPA/CNIPA technical standards and published as regulations in the Italian Official Journal

13 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t URNs (1/3) Each law contains several references to other laws: the whole legislative corpus can be seen as a net, laws being nodes connected through references; Manual activity is required to build laws hypertext through URLs; The URN is a persistent, location-independent, resource identification mechanism; The URNs are defined as a combination of elements, according to a specific grammar, that are basically: name of the enacting Authority, type of norm, date, number and a some more detailed specifications when needed; URNs can be built regardless the availability of corresponding documents on-line.

14 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t URNs (2/3) The adoption of a URN-based scheme allows to build an automated distributed hypertext, according to a model similar to the DNS (Domain Name System) used to resolve the self-explaining web sites' names into numerical HTTP addresses. This opportunity relies on the following considerations: –the natural language expressions used in law references usually contain repetitive patterns, thus automatically detectable; –the URN is built by combining data (almost) always included in the reference; –cross references between each URN and the list of corresponding URLs, needed for the resolution service, can be built automatically.

15 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t URNs: tools and examples (3/3) Parser –Available on-line, automatically detects references within laws. Resolution service –Resolves URNs into URLs (when known).

16 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t XML Representation of Italian Legislative and Regulatory Acts (1/5)  Documents with a well-defined structure –laws, constitutional laws, regional laws  Documents partially structured –regulation acts, decrees  Generic documents –any kind of non-structured acts, enclosures,.. Three categories

17 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t Basic DTD: well structured simple documents Strict DTD: well structured complex documents Loose DTD: documents with irregular structure, exceptions (suitable for historical documents) Three DTDs DTD definition approach (2/5) Each DTD can represent several document types Mark-up must be carried out using only relevant elements

18 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t Structural elements –heading, preamble, sections, articles, paragraphs... Special elements –references to other laws, formatted representation of text- embedded relevant entities (institution, dates, places) Elements containing Metadata –subject-matter classification, publication data, preparatory iter Semantic elements –obligation, prohibition, penalties, exceptions, modifications, abrogations,... XML Elements (categories) (3/5)

19 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t Example of an Italian Act, tagged with DTD Basic Examples of fragments of legal texts in different formats (XML vs Html) Examples of Legal Texts in XML (4/5) Navigating the document structure with a visual XML editor

20 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t Considering the relevance of XML to NIR: an intense training activity has been carried out, also with the aid of multimedia e-learning product developed by ITTIG-CNR; an XML Editor, that will be distributed as open source software, has been developed and enriched of parsing functions by ITTIG-CNR. Training on XML and Development of an XML NirEditor (5/5)

21 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t Advanced search functions Supporting legislative documents life-cycle (law enacting workflow, "law in force" at any given date) Moving from a totally “free” approach to a more formally-defined organizational model in order to achieve completeness and to improve precision Opportunities deriving from NIR standards

22 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t Software tools to support Administrations in the adoption of NiR standards XML Schema definition Parsing services New metadata Implementation of distributed URN resolution Certification of the authenticity of acts through digital signature technology Conclusive Remarks: Current Developments and Future Initiatives

23 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t... The End …

24 CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t

25 Structural Elements in NiR DTD (First Level) CONSIGLIO NAZIONALE DELLE RICERCHE Istituto di Teoria e Tecniche dell’Informazione Giuridica h t t p : / / w w w. i t t i g. c n r. i t

TITLEX2001.mdb CATALOGO NORME NATURA ATTO DATA PROMULGAZIONE NUMERO UFF./non UFF/NIR TITOLO ATTO CLASSIFICAZIONE VERSIONE URL URN AUTORITA’ EMITTENTE ARCHIVIO DEI FILES DI LOG URL ESTREMI ATTO TITOLO ATTO AUTORITA’ EMITTENTE NUMERO UF./non UFF/NIR URN Titlex Guritel W3MIR =

c docc. c docc. increm. = 1.000/mese 40 ->60 files Increm.=3/mese