Introduzione ai Database NoSQL

Slides:



Advertisements
Presentazioni simili
Introduzione ai Database NoSQL
Advertisements

Corso di Basi di Dati Introduzione a MongoDB Home page del corso:
DDBMS Distributed database system. DDB Una base di dati distribuita è una collezione di dati che appartengono logicamente allo stesso sistema informativo.
Giuditta Cantoni, 4 E S.I.A I DATABASE. Definizione databese In informatica, il termine database, banca dati o base di dati (a volte abbreviato con il.
07/03/2014Basi di dati II , presentazione1 Basi di dati II Docente: Paolo Atzeni
29/02/2016Basi di dati II , presentazione1 Basi di dati II Docente: Paolo Atzeni
Basi di dati - Fondamenti
Facile da usare Un'interfaccia amministrativa completamente rinnovata, iniziare con Drupal è più facile!
Visual Analytics Dashboard
Esperienze di Advanced Analytics nella statistica ufficiale: strumenti e progetti Antonino Virgillito Direzione Centrale per le tecnologie informatiche.
Corso per Webmaster base
Progettazione di una base di dati relazionale
L’ ORGANIZZAZIONE DEI DATI IN AZIENDA
OLPC-Italia Brescia 16 Ottobre 2008.
Università degli Studi di Modena e Reggio Emilia
Crea il tuo sistema aziendale sul web a partire dei fogli Excel che usi. ShareXLS
Summary di (quasi) tutti gli utenti non presentati…
Rielaborato da Atzeni et al., Basi di Dati, Mc-Graw Hill
Università degli studi di Roma Tor Vergata
“Lenuove tecnologie” – Lezione2
Universita’ di Milano Bicocca Corso di Basi di dati 1 in eLearning C
Rielaborato da Atzeni et al., Basi di dati, Mc-Graw Hill
di Basi di Dati: Overview
Sistemi e Applicazioni per l’Amministrazione Digitale
Applicazione web basata su web service e web socket
Algoritmi di stima con perdita di pacchetti in reti di sensori wireless: modellizzazione a catene di Markov, stima e stima distribuita Chiara Brighenti,
Dati in rete Appunti.
Introduzione a MongoDB
Breve report su corso RedHat Enterprise Virtualization (RH318)
Rielaborato da Atzeni et al., Basi di dati, Mc-Graw Hill
Salvatore Upload data on Azure SQL Database using Azure Messaging, Stream Analytics & Logic Apps Salvatore
Universita’ di Milano Bicocca Corso di Basi di dati 1 in eLearning C
ORACLE Corso Base Copyright © Maggio 2008 Assi Loris Versione : 1
Cloud per HA nei Servizi
Metriche SE monitoring G.Donvito G.Cuscela INFN Bari
Corso di Basi di Dati Il Linguaggio SQL
Corso di Basi di Dati Il Linguaggio SQL
Il modello relazionale
FAQ.
analizzatore di protocollo
Sviluppo di un'applicazione web per l'utilizzo del framework SparkER
Studente : Andrea Cassarà Classe: 5AII A.S. 2014/2015 Link Sito
Enrico Ragaini - Paolo Perani, Conferenza Stampa Tecnologica, 5 febbraio 2015 Smart Grid Laboratory Avanzate tecnologie di comunicazione al servizio delle.
Database
Corso di Ingegneria del Web A A Domenico Rosaci 1
Organizzazione di una rete Windows 2000
NoSQL.
A cura dell’Ing. Buttolo Marco.
Introduzione alle basi di dati
Progetto di Tecnologie Web 2014/2015 THERMOWEB
Informatica - Prof. Gregorio Cosentino
Basi di dati - Fondamenti
INTRODUZIONE A EXCEL Il foglio elettronico o foglio di calcolo è una tabella che contiene parole e numeri che possono essere elaborati applicando formule.
Introduzione alla materia sistemi
Programma DB-A Franco Turini.
Dino Pedreschi Dipartimento di Informatica a.a. 2011– 2012
ADO Per gestire i database con tecnologia ASP si utilizzano strumenti ADO (ActiveX Data Objects): un'architettura che fornisce oggetti.
Basi di dati II , presentazione
Free .NET Hosting - somee.com
Basi di dati II , presentazione
Gli archivi e le basi di dati
Il modello relazionale
Fogli di Calcolo Elettronici
Basi di dati II , presentazione
Università degli studi di Modena e Reggio Emilia
UNIVERSITÀ DI MODENA E REGGIO EMILIA
Introduzione ai DBMS I Sistemi di Gestione di Basi di Dati sono strumenti software evoluti per la gestione di grandi masse di dati residenti su memoria.
Docente: Sabato Bufano
Vincoli di Integrità Non tutte le combinazioni possibili di valori dei domini su cui è definita una relazione sono accettabili. Alcuni attributi possono.
CLOUD.
Transcript della presentazione:

Introduzione ai Database NoSQL Corso di Basi di Dati Introduzione ai Database NoSQL Home page del corso: http://www.cs.unibo.it/~difelice/dbsi/

Introduzione ai database NoSQL NoSQL Movimento che promuove l’adozione di DMBS non basati sul modello relazionale. Il termine NOSQL appare per la prima volta in una pubblicazione di Carlo Strozzi nel 1998. Oggi, il termine NOSQL viene usato per lo più nell’accezione NoT Only SQL. “Next generation databases mostly addressing some of the points: being non-relational, distributed, open source and horizzontally scalable” (definizione da http://nosql-database.org/)

Introduzione ai database NoSQL PROPRIETA dei SISTEMI NO-SQL Database distribuiti Strumenti generalmente open-source NON dispongono di schema NON supportano operazioni di join NON implementano le proprietà ACID delle transazioni Sono scalabili orizzontalmente Sono in grado di gestire grandi moli di dati Supportano le repliche dei dati

Introduzione ai database NoSQL Motivazioni legate alla diffusione dei database NoSQL: Gestione dei Big-data Limitazioni del modello relazionale Teorema CAP

Introduzione ai database NoSQL Big data: moli di dati, eterogenee, destrutturate, difficili da gestire attraverso tecnologie tradizionali. Tecnologie tradizionali  RDBMS Il termine big-data è oggi usato sia per denotare tipologie di dati, sia le tecnologie e i tool di gestione degli stessi.

Introduzione ai database NoSQL Volume: Big data = grosse moli di data Esempio: Dati da esperimenti scientifici http://home.web.cern.ch/about/computing Acceleratore di particelle del CERN 600 milioni di collisioni al secondo 30 Petabyte di dati annui relativi ai collision event

Introduzione ai database NoSQL Un esempio di sorgente di Big-Data: Reti di sensori

Introduzione ai database NoSQL From an Internet of Humans … to an Internet of Things … Source: Cisco IBSG, April 2011

Introduzione ai database NoSQL Un esempio di sorgente di Big-Data: Dispositivi mobili 3. ANALYZE 4. PROVIDE SERVICES 2. SHARE 1. SENSE Fonte: Lane, Miluzzo et alt, A survey of mobile phone sensing, IEEE Communication Magazine, 2010

Introduzione ai database NoSQL Volume: Big data = grosse moli di data Social Media User Generated Contents Dati Scientifici PB Sensori Transazioni finanziarie Web Server Log Documenti Word, Excel, PDF TB CRM ERP GB MB Complessità bassa Complessità media Complessità alta

Introduzione ai database NoSQL Velocity: Big data = stream di dati Esempio: Sistemi health-care http://www-03.ibm.com/press/us/en/pressrelease /40624.wss?cm_mc_uid=34296522129514448284754 &cm_mc_sid_50200000=1444828475 Early-Warning System Predict rising brain pressure in patients with traumatic brain injuries. Stream di 1000 dati al secondo.

Introduzione ai database NoSQL Variety: Big data = dati eterogenei, multi-sorgente SOCIAL MEDIA DATA WAREHOUSE DBMS OPERATIVO REPORT SOFTWARE DI SUPPORTO DECISIONALE SITO WEB

Introduzione ai database NoSQL GARTNER HYPE CYCLE, 2014

Introduzione ai database NoSQL ESEMPI DI TECNOLOGIE BIG DATA Acquisizione API Social Media, Web Scraping, Apache Flume, Microsoft StreamInsight Organizzazione/Storage Hadoop, DMBS NoSQL Integrazione Hive, Sqoop Analisi Pig, R, Mahout

Introduzione ai database NoSQL Motivazioni legate alla diffusione dei database NoSQL: Gestione dei Big-data Limitazioni del modello relazionale Teorema CAP

Introduzione ai database NoSQL (LIMITAZIONE1) Il modello relazionale presuppone una rappresentazione tabellare, che accade se i dati non si presentano in tale forma?. ANAGRAFICA CF Nome Cognome Luogo Data ? PAGINA WEB

Introduzione ai database NoSQL (LIMITAZIONE2) Alcune operazioni non possono essere implementate in SQL. Esempio: Memorizzazione di un grafo, e calcolo del percorso minimo tra due punti.

Introduzione ai database NoSQL (LIMITAZIONE3) Scalabilità orizzontale dei DMBS relazionali. Scalabilità (def informale): capacità di un sistema di migliorare le proprie prestazioni per un certo carico di lavoro, quando vengono aggiunte nuove risorse al sistema. Scalabilità verticale aggiungere più potenza di calcolo (RAM, CPU) ad i nodi che gestiscono il DB. Scalabilità orizzontale aggiungere più nodi al cluster.

Introduzione ai database NoSQL (LIMITAZIONE3) Scalabilità orizzontale dei DMBS relazionali. PROBLEMI Gestione dei vincoli Repliche dei dati Gestione delle transazioni Soddisfacimento delle proprietà ACID Scalabilità lineare (operazioni / sec) Throughput Scalabilità RBDMS #Servers

Introduzione ai database NoSQL Motivazioni legate alla diffusione dei database NoSQL: Gestione dei Big-data Limitazioni del modello relazionale Teorema CAP

Introduzione ai database NoSQL Il teorema di Brewer (CAP Theorem) afferma che un sistema distribuito può soddisfare al massimo solo due delle tre proprietà elencate sotto: Consistency  Tutti i nodi della rete vedono gli stessi dati Availability  Il servizio è sempre disponibile Partion Tolerance  Il servizio continua a funzionare correttamente anche in presenza di perdita di messaggi o di partizionamenti della rete.

Introduzione ai database NoSQL CAP THEOREM PER DB DISTRIBUTI: Nel caso di un DB distribuito (gestito da un cluster), è possibile soddisfare al massimo solo due delle tre proprietà elencate sotto: Consistency  Se l’utente A modifica il dato X sul server 1, e B legge X dal server 2, B legge l’ultima versione disponibile di X. Availability  Se un utente effettua una query sul server A o B, la query restituisce un risultato. Partion Tolerance  Il servizio continua a funzionare correttamente anche in presenza di perdita di messaggi o di partizionamenti della rete.

Introduzione ai database NoSQL CAP THEOREM PER DB DISTRIBUTI: CASO 1: Consistency + Availability NO Partition Tolerance Il sistema non funziona correttamente in caso di perdita di messaggi. APPLICAZIONE Write X Read X SERVER1 SERVER2

Introduzione ai database NoSQL CAP THEOREM PER DB DISTRIBUTI: CASO 2: Availability + Partition Tolerance NO Consistency Repliche del dato non aggiornate! APPLICAZIONE Write X Read (old X) SERVER1 SERVER2

Introduzione ai database NoSQL CAP THEOREM PER DB DISTRIBUTI: CASO 3: Consistency+ Partition Tolerance NO Availability La query non produce risposta APPLICAZIONE No reply! Write X SERVER1 SERVER2

Introduzione ai database NoSQL

Introduzione ai database NoSQL PROPRIETA’ BASE Basically Available  I nodi del sistema distribuito possono essere soggetti a guasti, ma il servizio è sempre disponibile. Soft State  La consistenza dei dati non è garantita in ogni istante. Eventually Consistent  Il sistema diventa consistente dopo un certo intervallo di tempo, se le attività di modifica dei dati cessano.

Introduzione ai database NoSQL Il termine NoSQL identifica una moltitudine di DBMS, basati su modelli logici differenti: Database chiave/valore Database document-oriented Database column-oriented Database graph-oriented

Introduzione ai database NoSQL Esempi: BerkeleyDB, Project Voldemort Dati di un DB come liste di coppie chiave/valore (array associativi o dizionari) Chiave  valore univoco per operazioni di ricerca Valore  qualsiasi cosa … Chiave Valore 1 {Mario Rossi, 02311323} 2 {Mario Bianchi, 23} 3 {Dipartimento Informatica, Via Zamboni, 05143242}

Introduzione ai database NoSQL Il termine NoSQL identifica una moltitudine di DBMS, basati su modelli logici differenti: Database chiave/valore Database document-oriented Database column-oriented Database graph-oriented

Introduzione ai database NoSQL Esempi: MongoDB, CouchDB Gestione di dati eterogeneei e complessi (semi-strutturati) Scalabili orizzontalmente, supporto per partizionamento (sharding) dei dati in sistemi distribuiti Documenti  coppie chiave/valore (JSON) Forniscono funzionalità per aggregazione/analisi dei dati (MapReduce)

Introduzione ai database NoSQL Documento  collezione coppie chiave-valore {name: ‘Marco’, cognome: ‘Rossi’, eta: 22, data:new Date(1997,6,2,12,30) address: {via: Zamboni, numero: 7} {via: Irnerio, numero: 49} email: [rossi@gmail.com, rossi@tiscali.it] }

Introduzione ai database NoSQL Il termine NoSQL identifica una moltitudine di DBMS, basati su modelli logici differenti: Database chiave/valore Database document-oriented Database column-oriented Database graph-oriented

Introduzione ai database NoSQL Esempi: HBase, Cassandra Dati organizzati su colonne anziché su righe. Column family  contenitore di colonne. Ogni column family è scritta su un file diverso. Ogni riga dispone di una chiave primaria (row key).

Introduzione ai database NoSQL Nome Cognome Nascita Lavoro Salario Contratto Chiave della riga Column Family 1 (dati anagrafica) Column Family 2 (dati lavoro) FILE 1 FILE 2

Introduzione ai database NoSQL Schema flessibile Maggiore efficienza nello storage Maggiore possibilità di compressione dati Usato in sistemi dati read-oriented (es. warehousing)

Introduzione ai database NoSQL Il termine NoSQL identifica una moltitudine di DBMS, basati su modelli logici differenti: Database chiave/valore Database document-oriented Database column-oriented Database graph-oriented

Introduzione ai database NoSQL Esempi: Neo4J, Titan Dati strutturati sotto forma di grafi: nodi  attributi/righe, archi  relazioni tra attributi/righe PROPERTY GRAPH