INTRODUZIONE ALLE ARCHITETTURE DEI SISTEMI INFORMATIVI
I SERVIZI DI TELECOMUNICAZIONE IN AZIENDA LA GESTIONE DEI DATI AZIENDALI LE ARCHITETTURE DEI SISTEMI INFORMATIVI LA GESTIONE DELL’ETEROGENEITA’ DELLE INFORMAZIONI SISTEMI INFORMATIVI E INTERNET
I SERVIZI DI TELECOMUNICAZIONE IN AZIENDA
LE TELECOMUNICAZIONI AZIENDALI 1° FASE (< ANNI ‘80) TELEFONO (POTS), TELEX, TRASMISSIONE DATI INDIPENDENTI SU RETI SEPARATE 2° FASE (ANNI ‘80 - ‘95) PROGETTO E REALIZZAZIONE DI GRANDI RETI DI TELECOMUNICAZIONE DIGITALI SVILUPPO DI RETI LOCALI DI PC E WORKSTATION 3° FASE (> 1995) INTEGRAZIONE E GESTIONE DI GRANDI RETI ETEROGENEE E DI RETI LOCALI
APPLICAZIONI DEI SISTEMI DISTRIBUITI ACCESSO A RISORSE REMOTE possibilità di collegarsi mediante lo stesso terminale a diversi elaboratori e centri di calcolo (p.e. TELNET, FTP, ...) ELABORAZIONE DISTRIBUITA possibilità di realizzare sistemi complessi nei quali il processo applicativo utilizza più elaboratori e/o più insiemi di dati, tra loro collegati con sistemi di telecomunicazione (p.e. sistemi informativi distribuiti, HPC, …) APPLICAZIONI TELEMATICHE posta elettronica teleconferenza accesso a banche di dati
GESTIONE DEI DATI IN RETE
GESTIONE DEI DATI IN RETE: BASI DI DATI INDIPENDENTI
GESTIONE DEI DATI IN RETE: LINGUAGGIO DI COMANDI STANDARD
GESTIONE DEI DATI IN RETE: BASE DI DATI DISTRIBUITA DDBMS
I NUOVI SISTEMI INFORMATIVI LE RETI DI TELECOMUNICAZIONE DIVENTANO UNA COMPONENTE ESSENZIALE PER IL BUON FUNZIONAMENTO ECONOMICO E OPERATIVO DELL’AZIENDA LA DISPONIBILITA’ DI SISTEMI DI TELECOMU-NICAZIONE EFFICACI CONSENTE LO SVILUPPO DI NUOVI TIPI DI BUSINESS
SISTEMA CON DISTRIBUZIONE VERTICALE DELLE FUNZIONI PABX ISDN BACKBONE FDDI oppure MAN 802.6 UFFICIO TECNICO 802.5 FABBRICA 802.4 MAGAZZINO 802.3 CENTRO EDP UFFICI AMMINISTRATIVI 802..3 gateway SISTEMA CON DISTRIBUZIONE VERTICALE DELLE FUNZIONI
UFFICI AMMINISTRATIVI PABX ISDN BACKBONE FDDI oppure MAN 802.6 CENTRO EDP UFFICI AMMINISTRATIVI 802..3 gateway SISTEMA CON DISTRIBUZIONE ORIZZONTALE DELLE FUNZIONI
LA GESTIONE DEI DATI AZIENDALI
GESTIONE DEI DATI 1° FASE (< ANNI 70) 2° FASE (ANNI ‘70 - ‘90) FILE SPARSI 2° FASE (ANNI ‘70 - ‘90) GRANDI BASI DI DATI CENTRALIZZATE 3° FASE (> 1990) GESTIONE DISTRIBUITA DEI DATI
ARCHITETTURA DEI SISTEMI UN PROCESSO DIALETTICO
GESTIONE DISTRIBUITA DEI DATI: SCOPI FUNZIONALI AFFIDABILITA’ CONDIVISIONE DEL CARICO DI LAVORO CONDIVISIONE DI RISORSE QUALITA’ DI SERVIZIO PER L’UTENTE
SCOPI FUNZIONALI: AFFIDABILITA’ LA PRESENZA DI RISORSE HW/SW RIDONDANTI CONSENTE DI UTILIZZARLE PER OTTENERE UN’ ELEVATA DISPONIBILITA’ DEL SISTEMA - SISTEMI TOLLERANTI AI GUASTI (FAULT TOLERANT) - SISTEMI A DEGRADAZIONE GRADUALE (SOFT DEGRADATION)
SCOPI FUNZIONALI: CONDIVISIONE DEL CARICO CONSENTE UN DIMENSIONAMENTO EQUILIBRATO DELLE RISORSE WKL1 WKL1 MESE ORA
SCOPI FUNZIONALI: CONDIVISIONE DI CARICO CONSENTE UN DIMENSIONAMENTO EQUILIBRATO DELLE RISORSE WKL1 WKL1 MESE ORA
GESTIONE DISTRIBUITA DEI DATI: SCOPI FUNZIONALI CONDIVISIONE DI RISORSE POSSIBILITA’ DI CONDIVIDERE RISORSE SPECIALIZZATE O UNICHE PRESENTI IN QUALCHE SITO DEL SISTEMA MIGLIORAMENTO DELLA QUALITA’ DEL SERVIZIO POSSIBILITA’ DI ELABORAZIONE LOCALE RIDUZIONE DEI TEMPI DI RISPOSTA INTERFACCIA UTENTE PIU’ COMODA
GESTIONE DISTRIBUITA DEI DATI: FATTORI ECONOMICI E ORGANIZZATIVI A FAVORE MAGGIORE CONTATTO TRA UTENTE E SISTEMA GRAZIE ALL’EFFICACIA DEI SISTEMI LOCALI DISTRIBUZIONE DEL “POTERE” (ORGANIZZATIVO, PSICOLOGICO, POLITICO, …) ASSOCIATO AL POSSESSO DELL’INFORMAZIONE INTEGRAZIONE DELLE ATTIVITA’ ORGANIZZATIVE IN IMPRESE TERRITORIALMENTE DISTRIBUITE COSTI/BENEFICI ??? CONTRO LA NECESSITA’ DI COORDINAMENTO E COLLABORAZIONE RICHIESTA A TUTTI I LIVELLI RICHIEDE UNA “ATTITUDINE CULTURALE” CHE NON SI TROVA FREQUENTEMENTE
LE ARCHITETTURE DEI SISTEMI INFORMATIVI
SISTEMI DISTRIBUITI SISTEMI NEI QUALI IL TEMPO DI TRASMISSIONE DEI MESSAGGI NON E’ TRASCURABILE RISPETTO AL TEMPO CHE INTERCORRE TRA GLI EVENTI DI UN SINGOLO PROCESSO
GESTIONE DISTRIBUITA DEI DATI: ARCHITETTURE ARCHITETTURA Hw/Sw GESTIONE DEI DATI sistemi debolmente connessi a banda stretta reti di calcolatori geograficamente distribuite sistemi per la gestione di basi di dati distribuite banda larga reti locali, sistemi funzionalmente distribuiti back-end processor sistemi paralleli fortemente connessi a banda larga sistemi multiprocessori, memorie associative, … database machine
(DISTRIBUTED DATA SHARING SYSTEMS) DBMS distribuiti federati eterogenei distribuzione eterogeneita' autonomia omogenei sistemi multidatabase integrati locali LO SPAZIO DEI DDSS (DISTRIBUTED DATA SHARING SYSTEMS)
TASSONOMIA DEI DDSS TIPO DI SISTEMA IL SISTEMA GLOBALE ACCEDE A ... I NODI LOCALI SONO TIPICAMENTE ... FUNZIONI DI DB GLOBALE MODO DI PORRE L’INFORMAZ. GLOBALE funzioni interne del DBMS basi di dati omogenee spazio dei nomi e schema globali basi di dati distribuite si multidatabase con schema globale interfaccia utente del DBMS basi di dati eterogenee si schema globale interfaccia utente del DBMS basi di dati eterogenee schemi globali parziali basi di dati federate si multidatabase con linguaggio di sistema interfaccia utente del DBMS basi di dati eterogenee funzioni di accesso del linguaggio si interfaccia utente del DBMS e alcune funzioni interne multidatabase omogenei con linguaggio di sistema basi di dati omogenee funzioni di accesso del linguaggio si qualsiasi sorgente di dati che soddisfi il protocollo di interfaccia applicazioni al di sopra del DBMS sistemi interoperabili no scambio di dati
GESTIONE DISTRIBUITA DEI DATI ARCHITETTURA CLIENT-SERVER MOLTI CLIENTI SI RIVOLGONO AD UN UNICO SERVER USATA PRINCIPALMENTE PER OLTP SU RETI LOCALI BASI DI DATI DISTRIBUITE MOLTI CLIENTI SI RIVOLGONO A MOLTI SERVENTI USATE PER OLTP SU RETI LOCALI E GEOGRAFICHE DATA WAREHOUSE COLLEZIONE DI DATI PROVENIENTI DA PIU’ SISTEMI SORGENTE USATE PER DSS SU RETI LOCALI E GEOGRAFICHE
ARCHITETTURE CLIENT-SERVER
ARCHITETTURA CLIENT-SERVER A DUE LIVELLI GESTISCE I DATI ED ELABORA LE APPLICAZIONI COMPLESSE FRONT END (GESTORE DI RETE O DI PERIFERICHE) BACK END (DBMS O SIMILE) CLIENT GESTISCE L’INTERFACCIA CON L’UTENTE FUNZIONI GRAFICHE PREPARAZIONE DEI DATI
DDSS IN ARCHITETTURA CLIENT-SERVER IL CLIENT E’ GESTITO DAL PROGRAMMATORE APPLICATIVO E’ ADATTO ALL’INTERAZIONE CON L’UTENTE FINALE AL QUALE PRESENTA UN’INTERFACCIA AMICHEVOLE UTILIZZA SQL STATICO O DINAMICO IL SERVER E’ GESTITO DALL’ AMMINISTRATORE DELLA BD DIMENSIONATO IN FUNZIONE DEL CARICO E DEI SERVIZI CHE DEVE OFFRIRE GESTISCE LE PROCEDURE DI OTTIMIZZAZIONE
DDSS IN ARCHITETTURA CLIENT-SERVER USO DI PRIMITIVE DEL DDBMS PRIMITIVE DI ACCESSO ALLA BASE DI DATI SITO CLIENT PROGRAMMA APPLICATIVO DDBMS1 DATABASE SITO SERVER RISULTATI DDBMS2
DDSS IN ARCHITETTURA CLIENT-SERVER USO DI PROGRAMMI AUSILIARI E RPC SITO CLIENT PROGRAMMA APPLICATIVO DBMS1 RPC SITO SERVER DATABASE DBMS2 PROGRAMMA AUSILIARIO RISULTATI PRIMITIVE DI ACCESSO ALLA BASE DI DATI
DDSS IN ARCHITETTURA CLIENT-SERVER USO DI PRIMITIVE DEL DDBMS IL COMPONENTE LOCALE DEL DDBMS INDIRIZZA LA RICHIESTA AL SERVER CHE ESEGUE L’ACCESSO E RESTITUISCE I RISULTATI MAGGIOR TRASPARENZA ALLA DISTRIBUZIONE GRAZIE A NOMI DI FILE GLOBALI BASSA EFFICIENZA PERCHE’ VIAGGIA UNA TUPLA ALLA VOLTA USO DI PROGRAMMI AUSILIARI E RPC L’APPLICAZIONE CHIEDE L’ESECUZIONE DEL PROGRAMMA AUSILIARIO SUL SERVER. QUESTO ESEGUE L’OPERAZIONE E RESTUISCE I RISULTATI IL PROGRAMMA AUSILIARIO E’ IN GRADO DI ASSEMBLARE LE SINGOLE TUPLE IN INSIEMI RISULTATO COSI’ AUMENTANDO L’EFFICIENZA DELLE TRASMISSIONE
ARCHITETTURA CLIENT-SERVER A TRE LIVELLI PRESENTAZIONE BROWSER (Netscape Navigator, Internet Explorer, ecc.) CLIENT FUNZIONALE FUNZIONI APPLICATIVE E DI GESTIONE DI RETE WEB SERVER APPLICAZIONE DBMS O SIMILE BACK END
BASI DI DATI DISTRIBUITE
BASE DI DATI DISTRIBUITA INSIEME DI FILE, MEMORIZZATI IN NODI DIVERSI DI UN SISTEMA DISTRIBUITO LOGICAMENTE CORRELATI O DA RELAZIONI FUNZIONALI O PERCHE’ COPIE MULTIPLE DI UNO STESSO FILE COSTITUISCONO UN’UNICA COLLEZIONE DI DATI
UNA BASE DI DATI DISTRIBUITA ... E’ UNA BASE DI DATI DEVE ESISTERE UN MODO INTEGRATO PER ACCEDERE AI DATI DEVE ESSERE PROTETTA CONTRO INCONSISTENZE E GUASTI IN MODO DA GARANTIRE L’INTEGRITA’ DEI DATI E’ DISTRIBUITA LA DISTRIBUZIONE FISICA DEI DATI DEVE ESSERE TRASPARENTE ALL’UTENTE FINALE
DATA WAREHOUSE
DATA WAREHOUSE (DW) TECNICA PER ASSEMBLARE E GESTIRE CORRETTAMENTE DATI PROVENIENTI DA SORGENTI DIVERSE AL FINE DI OTTENERE UNA VISIONE DETTAGLIATA DI UN SISTEMA ECONOMICO E’ UNA RACCOLTA DI DATI INTEGRATA PERMANENTE VARIABILE NEL TEMPO ORIENTATA AD UN PRECISO ARGOMENTO A SUPPORTO DI DECISIONI MANAGERIALI E’ L’ELEMENTO DI SEPARAZIONE TRA I CARICHI DI LAVORO OLTP E QUELLI DSS
PRINCIPALI PROBLEMATICHE DI UN DW MANUTENZIONE DELLE VIEW E DEI METADATI GESTIONE DELLA REPLICAZIONE GESTIONE DELLA CONSISTENZA REALIZZAZIONE DELLE APPLICAZIONI
LA GESTIONE DELL’ETEROGENEITA’ DELLE INFORMAZIONI
ETEROGENEITA’ DELLE INFORMAZIONI CONFLITTI STRUTTURALI (schemi differenti) CONFLITTI SEMANTICI (anche con schemi uguali) OMONIMIA (STESSO NOME, MA SIGNIFICATO DIVERSO) AMBIGUITA’ (NOME DIVERSO, MA STESSO SIGNIFICATO) FORMATO (NUMERICO ALFANUMERICO, ...) AGGREGAZIONI (PART-OF, …) SEMANTICA PROPRIA DEL DATO (DIFFERENZA DI UNITA’ DI MISURA, DI VALUTAZIONE, DI GRANULARITA’, …) AGGIORNAMENTO SPESSO RISTRETTO ALL’ATTIVITA’ LOCALE
RISOLUZIONE DEI CONFLITTI SEMANTICI RISTRUTTURAZIONE DELLE BASI DI DATI LOCALI (POCO PROPONIBILE) AGGIUNTA ESPLICITA NEGLI SCHEMI DI INFORMAZIONI SULLA SEMANTICA DEI SINGOLI DATI IN MODO DA PERMETTERE ALLE PROCEDURE APPLICATIVE DI FARVI FRONTE
ESEMPIO DI CONFLITTO SEMANTICO CONTESTO C1: VALORI MONETARI IN VALUTA DI ORIGINE VALORI MONETARI IN SCALA 1:1 TRANNE LO YEN CHE E’ IN SCALA 1:1000 CONTESTO C2: VALORI MONETARI IN USD IN SCALA 1:1 DA VALUTA A VALUTA TASSO USD JPY 104.0 JPY USD .0096 r3 DITTA SPESE IBM 1 500 000 NTT 5 000 000 r2 DITTA FATTURATO PAESE IBM 1 000 000 USA NTT 1000 000 JPN r1 VALUTA USA USD JPN JPY r4 select r1.ditta, r1.fatturato from r1, r2 where r1.ditta = r2.ditta and r1.fatturato > r2.spese
MEDIATORI UN MEDIATORE E’ UN MODULO SOFTWARE (A LIVELLO 7 ISO-OSI) CHE UTILIZZA LA CONOSCENZA IMPLICITA DI ALCUNI INSIEMI O SOTTOINSIEMI DI DATI PER CREARE INFORMAZIONE PER UN LIVELLO SUPERIORE DI APPLICAZIONI (WIEDERHOLD) LA SUA FUNZIONE PRINCIPALE E’ LA FUSIONE DI OGGETTI RAGGRUPPARE LE INFORMAZIONI SULLA STESSA ENTITA’ DEL MONDO REALE RIMUOVERE LE RIDONDANZE TRA LE DIVERSE SORGENTI RISOLVERE LE INCONSISTENZE TRA LE DIVERSE SORGENTI
MEDIATORI MEDIATORE MECCANISMI DI DATI ASTRAZIONE CONOSCENZA SORGENTI DI DATI WORKSTATION UTENTE MEDIATORE DATI MECCANISMI DI ASTRAZIONE CONOSCENZA INTERROGAZIONE FORMATTATA RISPOSTE GREZZE EVENTI DI TRIGGER RISPOSTE UTILI ISPEZIONI
WRAPPER CONVERTONO LE INTERROGAZIONI IN UNO O PIU’ COMANDI/INTERROGAZIONI COMPRENSIBILI DALLA SPECIFICA SORGENTE POSSONO ESTENDERE LA POSSIBILITA’ DI INTERROGAZIONE DI UNA PARTICOLARE SORGENTE CONVERTONO I RISULTATI DAL FORMATO NATIVO AD UN FORMATO COMPRENSIBILE ALL’APPLICAZIONE LA LORO SCRITTURA COMPORTA UN NOTEVOLE SFORZO REALIZZATIVO, MA ESISTONO STRUMENTI CHE AGEVOLANO IL LAVORO (TSIMMIS TOOLKIT)
ESEMPIO DI ARCHITETTURA A MEDIATORI (TSIMMIS) APPLICAZIONE 1 APPLICAZIONE 2 MEDIATORE 1 MEDIATORE 2 WRAPPER 1 WRAPPER 2 WRAPPER 3 SORGENTE DI DATI 1 (RDBMS) SORGENTE DI DATI 2 (LOTUS NOTES) SORGENTE DI DATI 3 (WWW)
COMPLETAMENTE REPLICATO COMPLETAMENTE ASSENTE CATALOGO DI RETE CATALOGO COMPLETAMENTE REPLICATO IMMEDIATEZZA DI ACCESSO OCCUPAZIONE DI DISCO CONSISTENZA DEI DATI COMPLETAMENTE ASSENTE NECESSITA’ DI BROADCASTING OVERHEAD DI ACCESSO
COMPLETAMENTE CENTRALIZZATO PARZIALMENTE REPLICATO CATALOGO DI RETE CATALOGO COMPLETAMENTE CENTRALIZZATO COLLO DI BOTTIGLIA PER L’ACCESSO OCCUPAZIONE DI DISCO CONSISTENZA DEI DATI PARZIALMENTE REPLICATO BUON COMPROMESSO TRA OVERHEAD E EFFICIENZA IN ACCESSO LOCALE 2 MASTER LOCALE 1
ARCHITETTURA COMPLESSIVA LDBMS INTERFACCIA TRASPORTO SISTEMA OPERATIVO RETE DI TRASMISSIONE DATI DB LOCALE CATALOGO
MODELLO PER SERVIZI DI INFORMAZIONI DISTRIBUITE ED ETEROGENEE APPLICAZIONI ARCHITETTURA DEL SI INFRASTRUTTURA DEL SI SUPPORTO DATI SUPPORTO DI COMUNICAZIONE DW, EDI, INTRANET, ... TSIMMIS, Workflow, CoopWARE, ... CORBA, HTTP, ... DBMS, browser HTML, ... TCP/IP, ...
SISTEMI INFORMATIVI E INTERNET
SISTEMI INFORMATIVI E INTERNET LA DIFFUSIONE MASSICIA DI INTERNET HA INFLUENZATO I SISTEMI INFORMATIVI IN DUE MODI RICERCA DI INFORMAZIONI NON PIU’ SU UNA SINGOLA BANCA DI DATI, MA IN TUTTI I SITI DELLA RETE UTILIZZO DELL’ARCHITETTURA INTERNET/WWW ANCHE PER LA REALIZZAZIONE DI SISTEMI INFORMATIVI INTRA/INTER-AZIENDALI INTRANET + EXTRANET = INTERNET NECESSITA’ DI INTEGRAZIONE TRA LE TECNOLOGIE WEB E LE TECNOLOGIE TRADIZIONALI OLTP
IMPIEGHI COMMERCIALI DI INTERNET e-MAIL, FILE TRANSFER MARKETING SUPPORTO ALLE DECISIONI GROUPWARE TRANSAZIONI COMMERCIALI E FINANZIARIE WORKFLOW, BUSINESS TO BUSINESS MULTIMEDIA COMMERCIO VIRTUALE <1990 1992 1993 1994 1995 1996 1997 1998 1999 >2000
SISTEMI INFORMATIVI E INTERNET COMPLESSITA’ DEI DATI COMPLESSITA’ DELLE APPLICAZIONI SITI DI PRESENZA SITI ORIENTATI AI SERVIZI (hotmail) CATALOGO SISTEMI INFORMATIVI BASATI SU WEB COMMERCIO ELETTRONICO WORKFLOW DESIGN PROGETTO DI IPERTESTI
ESTENSIONE E MIGLIORAMENTO DEGLI ATTUALI MOTORI DI RICERCA RICERCHE SU RETE ESTENSIONE E MIGLIORAMENTO DEGLI ATTUALI MOTORI DI RICERCA INDICI DI RICERCA CENTRALIZZATI CON CATEGORIZZAZIONE MANUALE DEI CONTENUTI (Lycos, Yahoo) MOTORI BASATI SUL CONTENUTO E SUL CONTESTO CLASSIFICAZIONE EFFICACE DEI DOCUMENTI SUBJECT GATEWAYS I MOTORI TRADIZIONALI INDICIANO LE SINGOLE PAGINE UN SUBJECT GATEWAY RICONOSCE UNA RISORSA (DOCUMENTO) COME TALE, MANTENENDO LA COERENZA DELL’INFORMAZIONE
MOTORI DI RICERCA BASATI SU DIRETTORI (Yahoo, Magellan, ... ) ORGANIZZANO LA CONOSCENZA IN STRUTTURE E CLASSIFICANO LE SINGOLE PAGINE WEB IN QUESTE STRUTTURE LA CLASSIFICAZIONE E’ UN LAVORO MOLTO PESANTE E CI SONO PIU’ PAGINE CHE CLASSIFICATORI! SE L’INFORMAZIONE CERCATA NON RICADE NELLA CLASSIFICAZIONE E’ IMPOSSIBILE TROVARLA BASATI SU “SPIDER” (Alta Vista, Lycos, ... ) PROGRAMMI CERCANO QUALSIASI COSA E ORGANIZZANO LA MATERIA IN QUALUNQUE MODO LO SPIDER ESPLORA IL WEB E TROVA LE PAGINE UN DATABASE CONTIENE LE INFORMAZIONI TROVATE E GLI ALGORITMI DI ORDINAMENTO PER RILEVANZA UN’INTERFACCIA UTENTE PERMETTE LE INTERROGAZIONI E LA PRESENTAZIONE DEI RISULTATI
MOTORI DI RICERCA LE PRINCIPALI DIFFERENZE TRA LA RICERCA SU WEB E QUELLA SU BANCHE DI DATI TRADIZIONALI SONO: ENORME ETEROGENEITA’ DELLE INFORMAZIONI SU WEB ENORMI DIMENSIONI DEL DOMINIO DI RICERCA 400-500 MILIONI DI DOCUMENTI 15-20 MILA RICHIESTE DI RICERCA AL MINUTO NONOSTANTE IL GRANDE RECALL, VENGONO ESAMINATI SOLAMENTE I PRIMISSIMI DOCUMENTI GLI ALGORITMI DI ORDINAMENTO E DI RANKING SONO TRA I SEGRETI INDUSTRIALI MEGLIO CUSTODITI!
INTRANET ESTENDONO AL SISTEMA INFORMATIVO AZIENDALE LE CARATTERISTICHE DI SEMPLICITA’ E IMMEDIATEZZA DELLA TECNOLOGIA WEB DEVONO INTEGRARE IN MODO EFFICACE LE TECNOLOGIE DEI DBMS, DEI WFMS E DEI SISTEMI OLTP E OLAP TRADIZIONALI DEVONO GARANTIRE LA SICUREZZA DELL’ACCESSO NEI CONFRONTI DEL MONDO ESTERNO MEDIANTE FIREWALL