SlideShare uma empresa Scribd logo
1 de 16
Nokia Internal Use Only
Nokia Institute of Technology
Big Data
Umnovoparadigmadearmazenagemdedados
Your natural partner to develop innovative
solutions
Wellington Chevreuil
Nokia Internal Use Only
AgendaAgendaAgendaAgenda
• Big Data
• Banco de Dados Relacional
• Resumo
• O preço da integridade e consistência
• NoSQL
• Not Only SQL
• Principais SGBDs NoSQL
• NoSQL x SGBD Relacional
• Não existe bala de prata
• Cenários de uso
• Questionamentos
Nokia Internal Use Only
Nokia Institute of Technology
Big Data
SurgimentoeAscenção
• Popularização da Internet
• Novos servicos oferecidos
• Buscadores de conteúdo
• Redes Sociais
• Comércio eletrônico (cauda longa)
• Evolução da capacidade de armazenamento
• Toda atividade do usuário é logada
• Processar e analisar todos esses dados?
• O que fazer com essa informação?
• Recomendações
• Publicidade direcionada
• Busca de páginas
• Como manter e recuperar esses dados?
Nokia Internal Use Only
Nokia Institute of Technology
Banco de Dados Relacional
Resumo
• Proposto no início dos anos 70
• Amplamente usado
• Conceitos principais
• Tabelas
• Relacionamentos
• Transaçõs ACID
• Normalização
• Índices
• Orientado a registros
• Alta Consistência e Integridade de Dados
• Ideal para armazenagem e processamento de dados “on-line”
• Perfeito para conjunto de dados limitados
Nokia Internal Use Only
Nokia Institute of Technology
Banco de Dados Relacional
Opreçodaintegridadee
consistência
Nokia Internal Use Only
Nokia Institute of Technology
NoSQL
NotOnlySQL
• Proposta para tratar “Big Data”
• Difere do modelo relacional na arquitetura de persistência
• Diversos modelos, não apenas orientado a linha (registro)
• “Desnormalização” de dados => Maior redundância
• Modelo focado em reduzir as limitações de escalabilidade
do modelo relacional
• Fraco suporte a transações
• Possível ausência de índices secundários
• Geralmente não oferecem esquemas fixos, o domínio
evolui com a aplicação
• Menor Consistência, favorecendo disponibilidade e
escalabilidade (Teorema de CAP)
Nokia Internal Use Only
Nokia Institute of Technology
NoSQL
NotOnlySQL
• NoSQL = Todo modelo de persistência não relacional
• Nada de novo: Soluções de persistência não relacional existem desde os
anos 80. Ex: Berkeley DB, Coherence, Orientado a Objetos
• Implementações NoSQL divergem em diferentes níveis:
• Modelo de Dados
• Modelo de Persistência
• Modelo de Consistência
• Modelo Físico
• Desempenho
• Índices secundários
• Tratamento de falha
• Compactação
• Balanceamento
• Operações atômicas
• Locks
Nokia Internal Use Only
Nokia Institute of Technology
NoSQL
NotOnlySQL
• Modelo de Dados
• Chave/Valor
• Semi-estruturado
• Orientado a coluna
• Orientado a documento
• Modelo de Persistência
• Em Memória
• Persistente
• Modelo de Consistência
• Fraco, implementado parcialmente
• Ausente
• Impactos no desempenho
Nokia Internal Use Only
Nokia Institute of Technology
NoSQL
NotOnlySQL
• Modelo Físico
• Distribuído ou não?
• Impactos em escalabilidade
• Desempenho
• Diferença entre leitura e escrita
• Diferentes tipos de leitura
• Índices secundários
• Nenhum
• Fraco suporte
• Tratamento de falha (fail over)
• Total tolerância
• Disponibilidade
• Escalabilidade
Nokia Internal Use Only
Nokia Institute of Technology
NoSQL
NotOnlySQL
• Compactação
• Suporta?
• Qual o método?
• Plugável?
• Balanceamento
• Operações atômicas
• Difícil de atingir em ambientes distribuídos
• Diferentes abordagens
• Locks
• Modelo permite deadlocks?
Nokia Internal Use Only
Nokia Institute of Technology
NoSQL
NotOnlySQL
• Compactação
• Suporta?
• Qual o método?
• Plugável?
• Balanceamento
• Operações atômicas
• Difícil de atingir em ambientes distribuídos
• Diferentes abordagens
• Locks
• Modelo permite deadlocks?
Nokia Internal Use Only
Nokia Institute of Technology
NoSQL
PrincipaisSGBDs
SGBD Modelo de Dados Modelo de Persistência
MongoDB Orientado a Documentos Persistente (FS)
Cassandra Híbrido entre Chave/Valor, orientado a
registro e orientado a coluna
Persistente (FS)
Voldemort Chave/Valor Persistente (FS)
Redis Chave/Valor Em memória
HBase Orientado a Colunas Persistente (Hadoop)
DynamoDB Tabular Persistente (Amazon S3)
BigTable Chave/valor multi-dimensional Persistente (GFS)
Memcached Tabular Em memória
Nokia Internal Use Only
Nokia Institute of Technology
NoSQL x SGBD Relacional
Nãoexiste“baladeprata”
• SGBD Relacional
• Consistência e integridade
• Normalização para evitar dados redundantes
• Linguagem padronizada de consulta (SQL)
• NoSQL
• Escalabilidade
• Tolerância a falhas
• Modelo de consistência fraco
Nokia Internal Use Only
Nokia Institute of Technology
NoSQL x SGBD Relacional
Cenáriosdeuso
• Cenário 1 – Processamento de pagamento:
• Registra o pagamento do usuário, subtrai o valor pago do total
disponível em sua conta corrente, adiciona o valor pago à
conta do destinatário, confirma a operação;
• Cenário 2 – Recomendação de novos itens para compra:
• Em um sistema de e-commerce com dezenas de milhões de
usuários, identificar similaridade entre esses usuários,
identificar quais itens foram compradaos por quais pessoas,
selecionar itens comprados por perfis semelhantes e oferecer
esses itens aos usuários com os mesmos perfis, que ainda não
o compraram.
Nokia Internal Use Only
ReferênciasReferênciasReferênciasReferências
• Hbase, the Definitive Guide (Lars George) – O’Reilly
• http://en.wikipedia.org/wiki/NoSQL
• Codd’s 12 rules, http://en.wikipedia.org/wiki/Codds_12_rules
• Towards Robust Distributed Systems, Eric Brewer -
http://www.cs.berkeley.edu/~brewer/cs262b-2004/PODC-keynote.pdf
• You Can’t Sacrifice Partition Tolerance, Coda Hale - http://codahale.com/you-cant-
sacrifice-partition-tolerance/
• NoSQL, Conceitos e Evolução (José Ramos e Adriana Nascimento) – MundoJ,
edição 51
• http://www.mongodb.org/
• http://www.memcached.org/
• http://aws.amazon.com/dynamodb/
• http://en.wikipedia.org/wiki/Apache_Cassandra
• http://en.wikipedia.org/wiki/Voldemort_(distributed_data_store)
Nokia Internal Use Only
QuestionamentosQuestionamentosQuestionamentosQuestionamentos

Mais conteúdo relacionado

Semelhante a I nd t_bigdata(1)

Bancos de dados NoSQL - Redis e MongoDB
Bancos de dados NoSQL - Redis e MongoDBBancos de dados NoSQL - Redis e MongoDB
Bancos de dados NoSQL - Redis e MongoDBPaulo Bischof
 
Minicurso Epoca mongoDB
Minicurso Epoca mongoDBMinicurso Epoca mongoDB
Minicurso Epoca mongoDBLelyBarros
 
FireDAC para BigDATA: Teradata e MongoDB
FireDAC para BigDATA: Teradata e MongoDBFireDAC para BigDATA: Teradata e MongoDB
FireDAC para BigDATA: Teradata e MongoDBAlan Glei
 
Bancos de dados no sql – uma nova abordagem
Bancos de dados no sql – uma nova abordagemBancos de dados no sql – uma nova abordagem
Bancos de dados no sql – uma nova abordagemJoão Gabriel Lima
 
NoSQL no Microsoft Azure - Global Azure Bootcamp 2017
NoSQL no Microsoft Azure - Global Azure Bootcamp 2017NoSQL no Microsoft Azure - Global Azure Bootcamp 2017
NoSQL no Microsoft Azure - Global Azure Bootcamp 2017Renato Groff
 
Padrões de Design para MapReduce
Padrões de Design para MapReducePadrões de Design para MapReduce
Padrões de Design para MapReduceKarla Okada
 
Big Data, NoSQL e In Memory Databases
Big Data, NoSQL e In Memory DatabasesBig Data, NoSQL e In Memory Databases
Big Data, NoSQL e In Memory DatabasesCaio Louro
 
Banco de Dados NoSQL - Disciplina: Sistemas Distribuídos
Banco de Dados NoSQL - Disciplina: Sistemas DistribuídosBanco de Dados NoSQL - Disciplina: Sistemas Distribuídos
Banco de Dados NoSQL - Disciplina: Sistemas DistribuídosJoão Helis Bernardo
 
NoSQL na nuvem com o Azure Cosmos DB - MVPConf 2018
NoSQL na nuvem com o Azure Cosmos DB - MVPConf 2018NoSQL na nuvem com o Azure Cosmos DB - MVPConf 2018
NoSQL na nuvem com o Azure Cosmos DB - MVPConf 2018Renato Groff
 
NoSQL para Desenvolvedores .NET - Developers-SP - Setembro-2017
NoSQL para Desenvolvedores .NET - Developers-SP - Setembro-2017NoSQL para Desenvolvedores .NET - Developers-SP - Setembro-2017
NoSQL para Desenvolvedores .NET - Developers-SP - Setembro-2017Renato Groff
 
Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Thiago de Azeredo
 
Apresentação Modelo de Gestão de dados para sistemas Colaborativos
Apresentação Modelo de Gestão de dados para sistemas ColaborativosApresentação Modelo de Gestão de dados para sistemas Colaborativos
Apresentação Modelo de Gestão de dados para sistemas ColaborativosMozart Dornelles Claret
 
Azure Cosmos DB para Desenvolvedores - From Zero to Hero - Março-2018
Azure Cosmos DB para Desenvolvedores - From Zero to Hero - Março-2018Azure Cosmos DB para Desenvolvedores - From Zero to Hero - Março-2018
Azure Cosmos DB para Desenvolvedores - From Zero to Hero - Março-2018Renato Groffe
 

Semelhante a I nd t_bigdata(1) (20)

Introdução ao NoSQL
Introdução ao NoSQLIntrodução ao NoSQL
Introdução ao NoSQL
 
Web Scale Data Management
Web Scale Data ManagementWeb Scale Data Management
Web Scale Data Management
 
Bancos de dados NoSQL - Redis e MongoDB
Bancos de dados NoSQL - Redis e MongoDBBancos de dados NoSQL - Redis e MongoDB
Bancos de dados NoSQL - Redis e MongoDB
 
Minicurso Epoca mongoDB
Minicurso Epoca mongoDBMinicurso Epoca mongoDB
Minicurso Epoca mongoDB
 
Banco de dados nas nuvens - aula 2
Banco de dados nas nuvens - aula 2Banco de dados nas nuvens - aula 2
Banco de dados nas nuvens - aula 2
 
FireDAC para BigDATA: Teradata e MongoDB
FireDAC para BigDATA: Teradata e MongoDBFireDAC para BigDATA: Teradata e MongoDB
FireDAC para BigDATA: Teradata e MongoDB
 
Bancos de dados no sql – uma nova abordagem
Bancos de dados no sql – uma nova abordagemBancos de dados no sql – uma nova abordagem
Bancos de dados no sql – uma nova abordagem
 
NoSql e NewSql
NoSql e NewSqlNoSql e NewSql
NoSql e NewSql
 
NoSQL no Microsoft Azure - Global Azure Bootcamp 2017
NoSQL no Microsoft Azure - Global Azure Bootcamp 2017NoSQL no Microsoft Azure - Global Azure Bootcamp 2017
NoSQL no Microsoft Azure - Global Azure Bootcamp 2017
 
Padrões de Design para MapReduce
Padrões de Design para MapReducePadrões de Design para MapReduce
Padrões de Design para MapReduce
 
Big Data, NoSQL e In Memory Databases
Big Data, NoSQL e In Memory DatabasesBig Data, NoSQL e In Memory Databases
Big Data, NoSQL e In Memory Databases
 
Artigo Nosql
Artigo NosqlArtigo Nosql
Artigo Nosql
 
Banco de Dados NoSQL - Disciplina: Sistemas Distribuídos
Banco de Dados NoSQL - Disciplina: Sistemas DistribuídosBanco de Dados NoSQL - Disciplina: Sistemas Distribuídos
Banco de Dados NoSQL - Disciplina: Sistemas Distribuídos
 
NoSQL na nuvem com o Azure Cosmos DB - MVPConf 2018
NoSQL na nuvem com o Azure Cosmos DB - MVPConf 2018NoSQL na nuvem com o Azure Cosmos DB - MVPConf 2018
NoSQL na nuvem com o Azure Cosmos DB - MVPConf 2018
 
NoSQL para Desenvolvedores .NET - Developers-SP - Setembro-2017
NoSQL para Desenvolvedores .NET - Developers-SP - Setembro-2017NoSQL para Desenvolvedores .NET - Developers-SP - Setembro-2017
NoSQL para Desenvolvedores .NET - Developers-SP - Setembro-2017
 
Sem limites com NoSQL
Sem limites com NoSQLSem limites com NoSQL
Sem limites com NoSQL
 
Mongo db
Mongo dbMongo db
Mongo db
 
Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)
 
Apresentação Modelo de Gestão de dados para sistemas Colaborativos
Apresentação Modelo de Gestão de dados para sistemas ColaborativosApresentação Modelo de Gestão de dados para sistemas Colaborativos
Apresentação Modelo de Gestão de dados para sistemas Colaborativos
 
Azure Cosmos DB para Desenvolvedores - From Zero to Hero - Março-2018
Azure Cosmos DB para Desenvolvedores - From Zero to Hero - Março-2018Azure Cosmos DB para Desenvolvedores - From Zero to Hero - Março-2018
Azure Cosmos DB para Desenvolvedores - From Zero to Hero - Março-2018
 

Mais de wchevreuil

Cloudera Enabling Native Integration of NoSQL HBase with Cloud Providers.pdf
Cloudera Enabling Native Integration of NoSQL HBase with Cloud Providers.pdfCloudera Enabling Native Integration of NoSQL HBase with Cloud Providers.pdf
Cloudera Enabling Native Integration of NoSQL HBase with Cloud Providers.pdfwchevreuil
 
HBase System Tables / Metadata Info
HBase System Tables / Metadata InfoHBase System Tables / Metadata Info
HBase System Tables / Metadata Infowchevreuil
 
HDFS client write/read implementation details
HDFS client write/read implementation detailsHDFS client write/read implementation details
HDFS client write/read implementation detailswchevreuil
 
HBase tales from the trenches
HBase tales from the trenchesHBase tales from the trenches
HBase tales from the trencheswchevreuil
 
Hbasecon2019 hbck2 (1)
Hbasecon2019 hbck2 (1)Hbasecon2019 hbck2 (1)
Hbasecon2019 hbck2 (1)wchevreuil
 
Web hdfs and httpfs
Web hdfs and httpfsWeb hdfs and httpfs
Web hdfs and httpfswchevreuil
 
HBase replication
HBase replicationHBase replication
HBase replicationwchevreuil
 

Mais de wchevreuil (8)

Cloudera Enabling Native Integration of NoSQL HBase with Cloud Providers.pdf
Cloudera Enabling Native Integration of NoSQL HBase with Cloud Providers.pdfCloudera Enabling Native Integration of NoSQL HBase with Cloud Providers.pdf
Cloudera Enabling Native Integration of NoSQL HBase with Cloud Providers.pdf
 
HBase System Tables / Metadata Info
HBase System Tables / Metadata InfoHBase System Tables / Metadata Info
HBase System Tables / Metadata Info
 
HDFS client write/read implementation details
HDFS client write/read implementation detailsHDFS client write/read implementation details
HDFS client write/read implementation details
 
HBase RITs
HBase RITsHBase RITs
HBase RITs
 
HBase tales from the trenches
HBase tales from the trenchesHBase tales from the trenches
HBase tales from the trenches
 
Hbasecon2019 hbck2 (1)
Hbasecon2019 hbck2 (1)Hbasecon2019 hbck2 (1)
Hbasecon2019 hbck2 (1)
 
Web hdfs and httpfs
Web hdfs and httpfsWeb hdfs and httpfs
Web hdfs and httpfs
 
HBase replication
HBase replicationHBase replication
HBase replication
 

I nd t_bigdata(1)

  • 1. Nokia Internal Use Only Nokia Institute of Technology Big Data Umnovoparadigmadearmazenagemdedados Your natural partner to develop innovative solutions Wellington Chevreuil
  • 2. Nokia Internal Use Only AgendaAgendaAgendaAgenda • Big Data • Banco de Dados Relacional • Resumo • O preço da integridade e consistência • NoSQL • Not Only SQL • Principais SGBDs NoSQL • NoSQL x SGBD Relacional • Não existe bala de prata • Cenários de uso • Questionamentos
  • 3. Nokia Internal Use Only Nokia Institute of Technology Big Data SurgimentoeAscenção • Popularização da Internet • Novos servicos oferecidos • Buscadores de conteúdo • Redes Sociais • Comércio eletrônico (cauda longa) • Evolução da capacidade de armazenamento • Toda atividade do usuário é logada • Processar e analisar todos esses dados? • O que fazer com essa informação? • Recomendações • Publicidade direcionada • Busca de páginas • Como manter e recuperar esses dados?
  • 4. Nokia Internal Use Only Nokia Institute of Technology Banco de Dados Relacional Resumo • Proposto no início dos anos 70 • Amplamente usado • Conceitos principais • Tabelas • Relacionamentos • Transaçõs ACID • Normalização • Índices • Orientado a registros • Alta Consistência e Integridade de Dados • Ideal para armazenagem e processamento de dados “on-line” • Perfeito para conjunto de dados limitados
  • 5. Nokia Internal Use Only Nokia Institute of Technology Banco de Dados Relacional Opreçodaintegridadee consistência
  • 6. Nokia Internal Use Only Nokia Institute of Technology NoSQL NotOnlySQL • Proposta para tratar “Big Data” • Difere do modelo relacional na arquitetura de persistência • Diversos modelos, não apenas orientado a linha (registro) • “Desnormalização” de dados => Maior redundância • Modelo focado em reduzir as limitações de escalabilidade do modelo relacional • Fraco suporte a transações • Possível ausência de índices secundários • Geralmente não oferecem esquemas fixos, o domínio evolui com a aplicação • Menor Consistência, favorecendo disponibilidade e escalabilidade (Teorema de CAP)
  • 7. Nokia Internal Use Only Nokia Institute of Technology NoSQL NotOnlySQL • NoSQL = Todo modelo de persistência não relacional • Nada de novo: Soluções de persistência não relacional existem desde os anos 80. Ex: Berkeley DB, Coherence, Orientado a Objetos • Implementações NoSQL divergem em diferentes níveis: • Modelo de Dados • Modelo de Persistência • Modelo de Consistência • Modelo Físico • Desempenho • Índices secundários • Tratamento de falha • Compactação • Balanceamento • Operações atômicas • Locks
  • 8. Nokia Internal Use Only Nokia Institute of Technology NoSQL NotOnlySQL • Modelo de Dados • Chave/Valor • Semi-estruturado • Orientado a coluna • Orientado a documento • Modelo de Persistência • Em Memória • Persistente • Modelo de Consistência • Fraco, implementado parcialmente • Ausente • Impactos no desempenho
  • 9. Nokia Internal Use Only Nokia Institute of Technology NoSQL NotOnlySQL • Modelo Físico • Distribuído ou não? • Impactos em escalabilidade • Desempenho • Diferença entre leitura e escrita • Diferentes tipos de leitura • Índices secundários • Nenhum • Fraco suporte • Tratamento de falha (fail over) • Total tolerância • Disponibilidade • Escalabilidade
  • 10. Nokia Internal Use Only Nokia Institute of Technology NoSQL NotOnlySQL • Compactação • Suporta? • Qual o método? • Plugável? • Balanceamento • Operações atômicas • Difícil de atingir em ambientes distribuídos • Diferentes abordagens • Locks • Modelo permite deadlocks?
  • 11. Nokia Internal Use Only Nokia Institute of Technology NoSQL NotOnlySQL • Compactação • Suporta? • Qual o método? • Plugável? • Balanceamento • Operações atômicas • Difícil de atingir em ambientes distribuídos • Diferentes abordagens • Locks • Modelo permite deadlocks?
  • 12. Nokia Internal Use Only Nokia Institute of Technology NoSQL PrincipaisSGBDs SGBD Modelo de Dados Modelo de Persistência MongoDB Orientado a Documentos Persistente (FS) Cassandra Híbrido entre Chave/Valor, orientado a registro e orientado a coluna Persistente (FS) Voldemort Chave/Valor Persistente (FS) Redis Chave/Valor Em memória HBase Orientado a Colunas Persistente (Hadoop) DynamoDB Tabular Persistente (Amazon S3) BigTable Chave/valor multi-dimensional Persistente (GFS) Memcached Tabular Em memória
  • 13. Nokia Internal Use Only Nokia Institute of Technology NoSQL x SGBD Relacional Nãoexiste“baladeprata” • SGBD Relacional • Consistência e integridade • Normalização para evitar dados redundantes • Linguagem padronizada de consulta (SQL) • NoSQL • Escalabilidade • Tolerância a falhas • Modelo de consistência fraco
  • 14. Nokia Internal Use Only Nokia Institute of Technology NoSQL x SGBD Relacional Cenáriosdeuso • Cenário 1 – Processamento de pagamento: • Registra o pagamento do usuário, subtrai o valor pago do total disponível em sua conta corrente, adiciona o valor pago à conta do destinatário, confirma a operação; • Cenário 2 – Recomendação de novos itens para compra: • Em um sistema de e-commerce com dezenas de milhões de usuários, identificar similaridade entre esses usuários, identificar quais itens foram compradaos por quais pessoas, selecionar itens comprados por perfis semelhantes e oferecer esses itens aos usuários com os mesmos perfis, que ainda não o compraram.
  • 15. Nokia Internal Use Only ReferênciasReferênciasReferênciasReferências • Hbase, the Definitive Guide (Lars George) – O’Reilly • http://en.wikipedia.org/wiki/NoSQL • Codd’s 12 rules, http://en.wikipedia.org/wiki/Codds_12_rules • Towards Robust Distributed Systems, Eric Brewer - http://www.cs.berkeley.edu/~brewer/cs262b-2004/PODC-keynote.pdf • You Can’t Sacrifice Partition Tolerance, Coda Hale - http://codahale.com/you-cant- sacrifice-partition-tolerance/ • NoSQL, Conceitos e Evolução (José Ramos e Adriana Nascimento) – MundoJ, edição 51 • http://www.mongodb.org/ • http://www.memcached.org/ • http://aws.amazon.com/dynamodb/ • http://en.wikipedia.org/wiki/Apache_Cassandra • http://en.wikipedia.org/wiki/Voldemort_(distributed_data_store)
  • 16. Nokia Internal Use Only QuestionamentosQuestionamentosQuestionamentosQuestionamentos