SlideShare uma empresa Scribd logo
1 de 30
BIG DATA:
Do Conceito à Prática

http://Checchia.NET

Daniel Checchia
Consultor de Tecnologia
daniel@checchia.net
Daniel Checchia…. Quem??
• +30 anos em Tecnologia
• Passagem por todos os grandes e-Commerce nacionais
(americanas.com, shoptime.com, submarino.com, pontofrio.com),
empresas de internet (imovelweb.com, zap.com.br) e startups
(psafe.com, sitepx.com).
• Especializado em Arquitetura Corporativa, Infraestrutura, segurança
e Cloud Computing.
• “T-Rex” evoluído 

2
O que eu faço….
 Planejamento Estratégico TI
 Arquitetura Corporativa de TI
 Consultoria Estratégica
 Mentoring para Startups
 CTO Virtual ou On Demand
 Hands on

 Lavo
 Passo
 Cozinho....
3
Big data é como sexo no colegial: “Ninguém faz, mas todo
mundo diz que faz. Então todos pensam que alguém está
fazendo e dizem que fazem também”
Jay Kidd, CTO da NetApp

4
Alguns Projetos BigData
[2011] Psafe.com (Lockbox):
• 480 Servidores (64Gb RAM, 32Tb SATA)
• Distribuídos em 3 DCs
• 16 Racks por DC
• 10 Servidores por Rack
• Hadoop HDFS

[2013] SitePX (ElasticSearch):
• +5.000.000 Documentos
• Distribuídos em 10 instâncias AWS (Auto-Scalling)
• Resultados de busca em 0.4 Segundos
5
“enquadrando” bigdata
6
Os 5 'Vs' do Big Data
• Volume (volume)
• Velocidade (velocity)
• Variedade (variety)
• Veracidade (veracity)
• Valor (value)

7
Premissas para BigData
• Lidar com volumes extremamente grandes de dados
• Mais variados tipos
• Distribuição de processamento
• Elasticidade
• Escalabilidade

8
Bancos Relacionais (ACID)
• Atomicidade: toda transação deve ser atômica, isto é, só pode ser
considerada efetivada se executada completamente;
• Consistência: todas as regras aplicadas ao banco de dados devem
ser seguidas;
• Isolamento: nenhuma transação pode interferir em outra que esteja
em andamento ao mesmo tempo;
• Durabilidade: uma vez que a transação esteja concluída, os dados
consequentes não podem ser perdidos.
Problema: Muito restritivo para uma solução de Big
Data. A elasticidade, por exemplo, pode ser
inviabilizada pela atomicidade e pela consistência.
9
Categorias NoSQL
• Orientado a documentos (MongoDB, CouchDB)
• Bancos de dados chave/valor (DynamoDB, Redis)
• Bancos de dados de grafos (Neo4j)
• Etc

10
Soluções em bigdata
11
Hadoop
• Mantido pela Apache Foundation
• Open Source
• Desenvolvido para Processamento e análise de grandes volumes
de Dados
• Maiores Colaboradores:
•

Facebook

•

Google

•

Yahoo!

•

IBM

12
Ecosistema Hadoop

13
Arquitetura Hadoop

14
Hadoop Cluster

15
“Particionamento”

16
Alta Disponibilidade

17
Bigdata na Prática
18
Sobre o Splunk
O Splunk é um mecanismo para os dados de máquina. Ele
coleta, indexa e aproveita os dados de máquina gerados
por todos os seus sistemas e infraestrutura de TI, sejam
eles físicos, virtuais ou em nuvem.

19
Logstash
• O Logstash é um sistema para gerenciamento e
agregação de logs.
• Com ele, podemos coletar logs, aplicar filtros e
tratar as mensagens e armazenar para uso
posterior, como visualização, estatística e
alertas.
• Você consegue agregar logs de diferentes
máquinas e aplicações em um ponto central e
ver diversas informações relacionadas através
de uma interface Web.

20
ElasticSearch
•

Servidor de buscas distribuído

•

Baseado em REST

•

Open Source

•

Baseado no Apache Lucene

•

Programado em Java (1 Jar)

•

Pode manter sua base local e Distribuída
ou armazenar no Hadoop (Nosso Caso)
21
Kibana
•

Kibana é um frontend HTML / JS

•

Desenvolvido para criação de dashboards
para seus dados

•

Integração total com Logstash, Apache
Flume, Fluentd e outros

•

Análise em tempo real do fluxo de dados

•

Altamente escalável

22
Kibana Exemplos

23
Kibana Exemplos

24
Kibana Exemplos

25
Kibana Exemplos

26
Kibana Exemplos

27
Kibana Exemplos

28
Demo online Kibana

http://demo.kibana.org/#/dashboard

29
Obrigado!!

Daniel Checchia
daniel@checchia.net
@checchia

Skype: daniel.checchia
(11) 3010-0140

30

Mais conteúdo relacionado

Mais procurados

Hadoop - Mãos à massa! Qcon2014
Hadoop - Mãos à massa! Qcon2014Hadoop - Mãos à massa! Qcon2014
Hadoop - Mãos à massa! Qcon2014Thiago Santiago
 
Big Data - O que é o hadoop, map reduce, hdfs e hive
Big Data - O que é o hadoop, map reduce, hdfs e hiveBig Data - O que é o hadoop, map reduce, hdfs e hive
Big Data - O que é o hadoop, map reduce, hdfs e hiveFlavio Fonte, PMP, ITIL
 
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaPalestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaMarcio Junior Vieira
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATALeonardo Dias
 
Bigdata - Leandro Wanderley
Bigdata - Leandro WanderleyBigdata - Leandro Wanderley
Bigdata - Leandro WanderleyLeandro Couto
 
Arquiteturas, Tecnologias e Desafios para Análise de BigData
Arquiteturas, Tecnologias e Desafios para Análise de BigDataArquiteturas, Tecnologias e Desafios para Análise de BigData
Arquiteturas, Tecnologias e Desafios para Análise de BigDataSandro Andrade
 
Hadoop - Primeiros passos
Hadoop - Primeiros passosHadoop - Primeiros passos
Hadoop - Primeiros passosSensedia
 
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivrePalestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivreAmbiente Livre
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharepccdias
 
Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre Ambiente Livre
 
Explorando os principais implementadores hadoop e o papel que eles exercem no...
Explorando os principais implementadores hadoop e o papel que eles exercem no...Explorando os principais implementadores hadoop e o papel que eles exercem no...
Explorando os principais implementadores hadoop e o papel que eles exercem no...José Renato Pequeno
 
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Ambiente Livre
 
Pentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesPentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesAmbiente Livre
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoAmbiente Livre
 

Mais procurados (20)

Hadoop - Mãos à massa! Qcon2014
Hadoop - Mãos à massa! Qcon2014Hadoop - Mãos à massa! Qcon2014
Hadoop - Mãos à massa! Qcon2014
 
Treinamento hadoop - dia4
Treinamento hadoop - dia4Treinamento hadoop - dia4
Treinamento hadoop - dia4
 
Big Data - O que é o hadoop, map reduce, hdfs e hive
Big Data - O que é o hadoop, map reduce, hdfs e hiveBig Data - O que é o hadoop, map reduce, hdfs e hive
Big Data - O que é o hadoop, map reduce, hdfs e hive
 
Data Lakes com Hadoop e Spark: Agile Analytics na prática
Data Lakes com Hadoop e Spark: Agile Analytics na práticaData Lakes com Hadoop e Spark: Agile Analytics na prática
Data Lakes com Hadoop e Spark: Agile Analytics na prática
 
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaPalestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
 
Treinamento Hadoop - dia2
Treinamento Hadoop - dia2Treinamento Hadoop - dia2
Treinamento Hadoop - dia2
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATA
 
Proposta de arquitetura Hadoop
Proposta de arquitetura HadoopProposta de arquitetura Hadoop
Proposta de arquitetura Hadoop
 
Big Data
Big DataBig Data
Big Data
 
Bigdata - Leandro Wanderley
Bigdata - Leandro WanderleyBigdata - Leandro Wanderley
Bigdata - Leandro Wanderley
 
Arquiteturas, Tecnologias e Desafios para Análise de BigData
Arquiteturas, Tecnologias e Desafios para Análise de BigDataArquiteturas, Tecnologias e Desafios para Análise de BigData
Arquiteturas, Tecnologias e Desafios para Análise de BigData
 
Hadoop - Primeiros passos
Hadoop - Primeiros passosHadoop - Primeiros passos
Hadoop - Primeiros passos
 
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivrePalestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
 
Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre
 
Explorando os principais implementadores hadoop e o papel que eles exercem no...
Explorando os principais implementadores hadoop e o papel que eles exercem no...Explorando os principais implementadores hadoop e o papel que eles exercem no...
Explorando os principais implementadores hadoop e o papel que eles exercem no...
 
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
 
Pentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesPentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data Lakes
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
 
Seminário Hadoop
Seminário HadoopSeminário Hadoop
Seminário Hadoop
 

Destaque

BigData: O que faço com isso?
BigData: O que faço com isso?BigData: O que faço com isso?
BigData: O que faço com isso?Diego Nogare
 
Bigdata e NoSQL: buzzwords da teoria à prática
Bigdata e NoSQL: buzzwords da teoria à práticaBigdata e NoSQL: buzzwords da teoria à prática
Bigdata e NoSQL: buzzwords da teoria à práticaFabíola Fernandes
 
Fintechs: Inovação ou Revolução do Sistema Bancário | TDC POA 2016 - Trilha F...
Fintechs: Inovação ou Revolução do Sistema Bancário | TDC POA 2016 - Trilha F...Fintechs: Inovação ou Revolução do Sistema Bancário | TDC POA 2016 - Trilha F...
Fintechs: Inovação ou Revolução do Sistema Bancário | TDC POA 2016 - Trilha F...André Bueno
 
TDC2016POA | Trilha Empreendedorismo - Empreendendo da ideia ao desinvestimento
TDC2016POA | Trilha Empreendedorismo - Empreendendo da ideia ao desinvestimentoTDC2016POA | Trilha Empreendedorismo - Empreendendo da ideia ao desinvestimento
TDC2016POA | Trilha Empreendedorismo - Empreendendo da ideia ao desinvestimentotdc-globalcode
 
TDC2016POA | Trilha Education - Jogos na Educação, onde estamos errando?
TDC2016POA | Trilha Education -  Jogos na Educação, onde estamos errando?TDC2016POA | Trilha Education -  Jogos na Educação, onde estamos errando?
TDC2016POA | Trilha Education - Jogos na Educação, onde estamos errando?tdc-globalcode
 
TDC2016POA | Trilha Education - Robótica Livre nas escolas públicas do RS: a ...
TDC2016POA | Trilha Education - Robótica Livre nas escolas públicas do RS: a ...TDC2016POA | Trilha Education - Robótica Livre nas escolas públicas do RS: a ...
TDC2016POA | Trilha Education - Robótica Livre nas escolas públicas do RS: a ...tdc-globalcode
 
TDC2016POA | Trilha Education - Aprendizagem baseada em projetos: Uma experi...
TDC2016POA | Trilha Education -  Aprendizagem baseada em projetos: Uma experi...TDC2016POA | Trilha Education -  Aprendizagem baseada em projetos: Uma experi...
TDC2016POA | Trilha Education - Aprendizagem baseada em projetos: Uma experi...tdc-globalcode
 
TDC2016POA | Trilha Empreendedorismo - Manual Prático do Empreendedorismo
TDC2016POA | Trilha Empreendedorismo - Manual Prático do EmpreendedorismoTDC2016POA | Trilha Empreendedorismo - Manual Prático do Empreendedorismo
TDC2016POA | Trilha Empreendedorismo - Manual Prático do Empreendedorismotdc-globalcode
 
TDC2016POA | Trilha Education - Design Thinking na Educação: Como aplicar no...
TDC2016POA | Trilha Education -  Design Thinking na Educação: Como aplicar no...TDC2016POA | Trilha Education -  Design Thinking na Educação: Como aplicar no...
TDC2016POA | Trilha Education - Design Thinking na Educação: Como aplicar no...tdc-globalcode
 
TDC2016POA | Trilha Empreendedorismo - Tirando idéias do Papel - Quase um Fuc...
TDC2016POA | Trilha Empreendedorismo - Tirando idéias do Papel - Quase um Fuc...TDC2016POA | Trilha Empreendedorismo - Tirando idéias do Papel - Quase um Fuc...
TDC2016POA | Trilha Empreendedorismo - Tirando idéias do Papel - Quase um Fuc...tdc-globalcode
 
TDC2016POA | Trilha Empreendedorismo - Faça mais, reclame menos.
TDC2016POA | Trilha Empreendedorismo - Faça mais, reclame menos.TDC2016POA | Trilha Empreendedorismo - Faça mais, reclame menos.
TDC2016POA | Trilha Empreendedorismo - Faça mais, reclame menos.tdc-globalcode
 
TDC2016POA | Trilha Education - Gamificação, realidade aumentada, youtube o ...
TDC2016POA | Trilha Education -  Gamificação, realidade aumentada, youtube o ...TDC2016POA | Trilha Education -  Gamificação, realidade aumentada, youtube o ...
TDC2016POA | Trilha Education - Gamificação, realidade aumentada, youtube o ...tdc-globalcode
 
TDC2016 | Trilha PHP - Xdebug: Seus problemas acabaram!
TDC2016 | Trilha PHP - Xdebug: Seus problemas acabaram!TDC2016 | Trilha PHP - Xdebug: Seus problemas acabaram!
TDC2016 | Trilha PHP - Xdebug: Seus problemas acabaram!tdc-globalcode
 
TDC2016POA | Trilha Infraestrutura - Chatops na prática: Aumentando o desempe...
TDC2016POA | Trilha Infraestrutura - Chatops na prática: Aumentando o desempe...TDC2016POA | Trilha Infraestrutura - Chatops na prática: Aumentando o desempe...
TDC2016POA | Trilha Infraestrutura - Chatops na prática: Aumentando o desempe...tdc-globalcode
 
TDC2016POA | Trilha Infraestrutura - Infra Ágil: Por onde começar?
TDC2016POA |  Trilha Infraestrutura -  Infra Ágil: Por onde começar?TDC2016POA |  Trilha Infraestrutura -  Infra Ágil: Por onde começar?
TDC2016POA | Trilha Infraestrutura - Infra Ágil: Por onde começar?tdc-globalcode
 
TDC2016POA | Trilha IoT - Como gerenciar a complexidade de um mundo conectado
TDC2016POA | Trilha IoT - Como gerenciar a complexidade de um mundo conectadoTDC2016POA | Trilha IoT - Como gerenciar a complexidade de um mundo conectado
TDC2016POA | Trilha IoT - Como gerenciar a complexidade de um mundo conectadotdc-globalcode
 
TDC2016POA | Trilha IoT - Controlando AR Drone com PHP
TDC2016POA | Trilha IoT -  Controlando AR Drone com PHPTDC2016POA | Trilha IoT -  Controlando AR Drone com PHP
TDC2016POA | Trilha IoT - Controlando AR Drone com PHPtdc-globalcode
 
TDC2016POA | Trilha Infraestrutura - Garantindo a qualidade de sua infraestr...
TDC2016POA | Trilha Infraestrutura -  Garantindo a qualidade de sua infraestr...TDC2016POA | Trilha Infraestrutura -  Garantindo a qualidade de sua infraestr...
TDC2016POA | Trilha Infraestrutura - Garantindo a qualidade de sua infraestr...tdc-globalcode
 
Palestra "Ionic Framework 2 - O que vem por aí?" TDC 2016
Palestra "Ionic Framework 2 - O que vem por aí?" TDC 2016Palestra "Ionic Framework 2 - O que vem por aí?" TDC 2016
Palestra "Ionic Framework 2 - O que vem por aí?" TDC 2016Tatiane Aguirres Nogueira
 

Destaque (20)

BigData: O que faço com isso?
BigData: O que faço com isso?BigData: O que faço com isso?
BigData: O que faço com isso?
 
Bigdata e NoSQL: buzzwords da teoria à prática
Bigdata e NoSQL: buzzwords da teoria à práticaBigdata e NoSQL: buzzwords da teoria à prática
Bigdata e NoSQL: buzzwords da teoria à prática
 
Fintechs: Inovação ou Revolução do Sistema Bancário | TDC POA 2016 - Trilha F...
Fintechs: Inovação ou Revolução do Sistema Bancário | TDC POA 2016 - Trilha F...Fintechs: Inovação ou Revolução do Sistema Bancário | TDC POA 2016 - Trilha F...
Fintechs: Inovação ou Revolução do Sistema Bancário | TDC POA 2016 - Trilha F...
 
TDC2016POA | Trilha Empreendedorismo - Empreendendo da ideia ao desinvestimento
TDC2016POA | Trilha Empreendedorismo - Empreendendo da ideia ao desinvestimentoTDC2016POA | Trilha Empreendedorismo - Empreendendo da ideia ao desinvestimento
TDC2016POA | Trilha Empreendedorismo - Empreendendo da ideia ao desinvestimento
 
TDC2016POA | Trilha Education - Jogos na Educação, onde estamos errando?
TDC2016POA | Trilha Education -  Jogos na Educação, onde estamos errando?TDC2016POA | Trilha Education -  Jogos na Educação, onde estamos errando?
TDC2016POA | Trilha Education - Jogos na Educação, onde estamos errando?
 
TDC2016POA | Trilha Education - Robótica Livre nas escolas públicas do RS: a ...
TDC2016POA | Trilha Education - Robótica Livre nas escolas públicas do RS: a ...TDC2016POA | Trilha Education - Robótica Livre nas escolas públicas do RS: a ...
TDC2016POA | Trilha Education - Robótica Livre nas escolas públicas do RS: a ...
 
TDC2016POA | Trilha Education - Aprendizagem baseada em projetos: Uma experi...
TDC2016POA | Trilha Education -  Aprendizagem baseada em projetos: Uma experi...TDC2016POA | Trilha Education -  Aprendizagem baseada em projetos: Uma experi...
TDC2016POA | Trilha Education - Aprendizagem baseada em projetos: Uma experi...
 
TDC2016POA | Trilha Empreendedorismo - Manual Prático do Empreendedorismo
TDC2016POA | Trilha Empreendedorismo - Manual Prático do EmpreendedorismoTDC2016POA | Trilha Empreendedorismo - Manual Prático do Empreendedorismo
TDC2016POA | Trilha Empreendedorismo - Manual Prático do Empreendedorismo
 
TDC2016POA | Trilha Education - Design Thinking na Educação: Como aplicar no...
TDC2016POA | Trilha Education -  Design Thinking na Educação: Como aplicar no...TDC2016POA | Trilha Education -  Design Thinking na Educação: Como aplicar no...
TDC2016POA | Trilha Education - Design Thinking na Educação: Como aplicar no...
 
TDC2016POA | Trilha Empreendedorismo - Tirando idéias do Papel - Quase um Fuc...
TDC2016POA | Trilha Empreendedorismo - Tirando idéias do Papel - Quase um Fuc...TDC2016POA | Trilha Empreendedorismo - Tirando idéias do Papel - Quase um Fuc...
TDC2016POA | Trilha Empreendedorismo - Tirando idéias do Papel - Quase um Fuc...
 
TDC2016POA | Trilha Empreendedorismo - Faça mais, reclame menos.
TDC2016POA | Trilha Empreendedorismo - Faça mais, reclame menos.TDC2016POA | Trilha Empreendedorismo - Faça mais, reclame menos.
TDC2016POA | Trilha Empreendedorismo - Faça mais, reclame menos.
 
TDC2016POA | Trilha Education - Gamificação, realidade aumentada, youtube o ...
TDC2016POA | Trilha Education -  Gamificação, realidade aumentada, youtube o ...TDC2016POA | Trilha Education -  Gamificação, realidade aumentada, youtube o ...
TDC2016POA | Trilha Education - Gamificação, realidade aumentada, youtube o ...
 
Carthage ou cocoapods
Carthage ou cocoapodsCarthage ou cocoapods
Carthage ou cocoapods
 
TDC2016 | Trilha PHP - Xdebug: Seus problemas acabaram!
TDC2016 | Trilha PHP - Xdebug: Seus problemas acabaram!TDC2016 | Trilha PHP - Xdebug: Seus problemas acabaram!
TDC2016 | Trilha PHP - Xdebug: Seus problemas acabaram!
 
TDC2016POA | Trilha Infraestrutura - Chatops na prática: Aumentando o desempe...
TDC2016POA | Trilha Infraestrutura - Chatops na prática: Aumentando o desempe...TDC2016POA | Trilha Infraestrutura - Chatops na prática: Aumentando o desempe...
TDC2016POA | Trilha Infraestrutura - Chatops na prática: Aumentando o desempe...
 
TDC2016POA | Trilha Infraestrutura - Infra Ágil: Por onde começar?
TDC2016POA |  Trilha Infraestrutura -  Infra Ágil: Por onde começar?TDC2016POA |  Trilha Infraestrutura -  Infra Ágil: Por onde começar?
TDC2016POA | Trilha Infraestrutura - Infra Ágil: Por onde começar?
 
TDC2016POA | Trilha IoT - Como gerenciar a complexidade de um mundo conectado
TDC2016POA | Trilha IoT - Como gerenciar a complexidade de um mundo conectadoTDC2016POA | Trilha IoT - Como gerenciar a complexidade de um mundo conectado
TDC2016POA | Trilha IoT - Como gerenciar a complexidade de um mundo conectado
 
TDC2016POA | Trilha IoT - Controlando AR Drone com PHP
TDC2016POA | Trilha IoT -  Controlando AR Drone com PHPTDC2016POA | Trilha IoT -  Controlando AR Drone com PHP
TDC2016POA | Trilha IoT - Controlando AR Drone com PHP
 
TDC2016POA | Trilha Infraestrutura - Garantindo a qualidade de sua infraestr...
TDC2016POA | Trilha Infraestrutura -  Garantindo a qualidade de sua infraestr...TDC2016POA | Trilha Infraestrutura -  Garantindo a qualidade de sua infraestr...
TDC2016POA | Trilha Infraestrutura - Garantindo a qualidade de sua infraestr...
 
Palestra "Ionic Framework 2 - O que vem por aí?" TDC 2016
Palestra "Ionic Framework 2 - O que vem por aí?" TDC 2016Palestra "Ionic Framework 2 - O que vem por aí?" TDC 2016
Palestra "Ionic Framework 2 - O que vem por aí?" TDC 2016
 

Semelhante a BIGDATA: Da teoria à Pratica

Pentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesPentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesAmbiente Livre
 
Palestra Big Data SCTI
Palestra Big Data SCTIPalestra Big Data SCTI
Palestra Big Data SCTIBruna Pereira
 
Big Data Week São Paulo 2017
Big Data Week São Paulo 2017 Big Data Week São Paulo 2017
Big Data Week São Paulo 2017 Thiago Santiago
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoAmbiente Livre
 
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.  Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics. Ambiente Livre
 
TDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosTDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosAmbiente Livre
 
TDC2016SP - Trilha BigData
TDC2016SP - Trilha BigDataTDC2016SP - Trilha BigData
TDC2016SP - Trilha BigDatatdc-globalcode
 
Big Data: O que é? e por onde começar?
Big Data: O que é? e por onde começar?Big Data: O que é? e por onde começar?
Big Data: O que é? e por onde começar?Paulo Ricardo Santos
 
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...Vinícius Barros
 
BigData & Hadoop - Technology Latinoware 2016
BigData & Hadoop - Technology Latinoware 2016BigData & Hadoop - Technology Latinoware 2016
BigData & Hadoop - Technology Latinoware 2016Thiago Santiago
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dadosElton Meira
 

Semelhante a BIGDATA: Da teoria à Pratica (20)

Pentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesPentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data Lakes
 
Palestra Big Data SCTI
Palestra Big Data SCTIPalestra Big Data SCTI
Palestra Big Data SCTI
 
Big Data Week São Paulo 2017
Big Data Week São Paulo 2017 Big Data Week São Paulo 2017
Big Data Week São Paulo 2017
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
 
BigData
BigDataBigData
BigData
 
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.  Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
 
Big Data Latinoware 2014
Big Data Latinoware 2014Big Data Latinoware 2014
Big Data Latinoware 2014
 
Big Data
Big DataBig Data
Big Data
 
TDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosTDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativos
 
Big Data - Conceitos Básicos
Big Data - Conceitos BásicosBig Data - Conceitos Básicos
Big Data - Conceitos Básicos
 
TDC2016SP - Trilha BigData
TDC2016SP - Trilha BigDataTDC2016SP - Trilha BigData
TDC2016SP - Trilha BigData
 
Big Data: O que é? e por onde começar?
Big Data: O que é? e por onde começar?Big Data: O que é? e por onde começar?
Big Data: O que é? e por onde começar?
 
Big Data, JVM e Redes Sociais
Big Data, JVM e Redes SociaisBig Data, JVM e Redes Sociais
Big Data, JVM e Redes Sociais
 
Big Data
Big DataBig Data
Big Data
 
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...
Indústria 4.0: como a IoT e Big Data mudarão a forma como lidamos com a tecno...
 
BigData & Hadoop - Technology Latinoware 2016
BigData & Hadoop - Technology Latinoware 2016BigData & Hadoop - Technology Latinoware 2016
BigData & Hadoop - Technology Latinoware 2016
 
Bigadata casese opotunidades
Bigadata casese opotunidadesBigadata casese opotunidades
Bigadata casese opotunidades
 
Aula BigData.pptx
Aula BigData.pptxAula BigData.pptx
Aula BigData.pptx
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dados
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 

Mais de Daniel Checchia

Melhores práticas para Arquitetura em Cloud Computing
Melhores práticas para Arquitetura em Cloud ComputingMelhores práticas para Arquitetura em Cloud Computing
Melhores práticas para Arquitetura em Cloud ComputingDaniel Checchia
 
Federal cloud-computing-strategy
Federal cloud-computing-strategyFederal cloud-computing-strategy
Federal cloud-computing-strategyDaniel Checchia
 
Best Practices for Acquiring IT as a Service
Best Practices for Acquiring IT as a ServiceBest Practices for Acquiring IT as a Service
Best Practices for Acquiring IT as a ServiceDaniel Checchia
 
Políticas de Segurança: Verdade ou Mito?
Políticas de Segurança: Verdade ou Mito?Políticas de Segurança: Verdade ou Mito?
Políticas de Segurança: Verdade ou Mito?Daniel Checchia
 
IDM - Gereciamento de Identidades Corporativa
IDM - Gereciamento de Identidades CorporativaIDM - Gereciamento de Identidades Corporativa
IDM - Gereciamento de Identidades CorporativaDaniel Checchia
 
Monitoramento pro-ativo de Serviços
Monitoramento pro-ativo de ServiçosMonitoramento pro-ativo de Serviços
Monitoramento pro-ativo de ServiçosDaniel Checchia
 
Projeto de Backup com Bacula
Projeto de Backup com BaculaProjeto de Backup com Bacula
Projeto de Backup com BaculaDaniel Checchia
 

Mais de Daniel Checchia (10)

Tirando leite de pedra
Tirando leite de pedraTirando leite de pedra
Tirando leite de pedra
 
Projeto Calico Jack
Projeto Calico JackProjeto Calico Jack
Projeto Calico Jack
 
Melhores práticas para Arquitetura em Cloud Computing
Melhores práticas para Arquitetura em Cloud ComputingMelhores práticas para Arquitetura em Cloud Computing
Melhores práticas para Arquitetura em Cloud Computing
 
Federal cloud-computing-strategy
Federal cloud-computing-strategyFederal cloud-computing-strategy
Federal cloud-computing-strategy
 
Best Practices for Acquiring IT as a Service
Best Practices for Acquiring IT as a ServiceBest Practices for Acquiring IT as a Service
Best Practices for Acquiring IT as a Service
 
The google file system
The google file systemThe google file system
The google file system
 
Políticas de Segurança: Verdade ou Mito?
Políticas de Segurança: Verdade ou Mito?Políticas de Segurança: Verdade ou Mito?
Políticas de Segurança: Verdade ou Mito?
 
IDM - Gereciamento de Identidades Corporativa
IDM - Gereciamento de Identidades CorporativaIDM - Gereciamento de Identidades Corporativa
IDM - Gereciamento de Identidades Corporativa
 
Monitoramento pro-ativo de Serviços
Monitoramento pro-ativo de ServiçosMonitoramento pro-ativo de Serviços
Monitoramento pro-ativo de Serviços
 
Projeto de Backup com Bacula
Projeto de Backup com BaculaProjeto de Backup com Bacula
Projeto de Backup com Bacula
 

BIGDATA: Da teoria à Pratica

  • 1. BIG DATA: Do Conceito à Prática http://Checchia.NET Daniel Checchia Consultor de Tecnologia daniel@checchia.net
  • 2. Daniel Checchia…. Quem?? • +30 anos em Tecnologia • Passagem por todos os grandes e-Commerce nacionais (americanas.com, shoptime.com, submarino.com, pontofrio.com), empresas de internet (imovelweb.com, zap.com.br) e startups (psafe.com, sitepx.com). • Especializado em Arquitetura Corporativa, Infraestrutura, segurança e Cloud Computing. • “T-Rex” evoluído  2
  • 3. O que eu faço….  Planejamento Estratégico TI  Arquitetura Corporativa de TI  Consultoria Estratégica  Mentoring para Startups  CTO Virtual ou On Demand  Hands on  Lavo  Passo  Cozinho.... 3
  • 4. Big data é como sexo no colegial: “Ninguém faz, mas todo mundo diz que faz. Então todos pensam que alguém está fazendo e dizem que fazem também” Jay Kidd, CTO da NetApp 4
  • 5. Alguns Projetos BigData [2011] Psafe.com (Lockbox): • 480 Servidores (64Gb RAM, 32Tb SATA) • Distribuídos em 3 DCs • 16 Racks por DC • 10 Servidores por Rack • Hadoop HDFS [2013] SitePX (ElasticSearch): • +5.000.000 Documentos • Distribuídos em 10 instâncias AWS (Auto-Scalling) • Resultados de busca em 0.4 Segundos 5
  • 7. Os 5 'Vs' do Big Data • Volume (volume) • Velocidade (velocity) • Variedade (variety) • Veracidade (veracity) • Valor (value) 7
  • 8. Premissas para BigData • Lidar com volumes extremamente grandes de dados • Mais variados tipos • Distribuição de processamento • Elasticidade • Escalabilidade 8
  • 9. Bancos Relacionais (ACID) • Atomicidade: toda transação deve ser atômica, isto é, só pode ser considerada efetivada se executada completamente; • Consistência: todas as regras aplicadas ao banco de dados devem ser seguidas; • Isolamento: nenhuma transação pode interferir em outra que esteja em andamento ao mesmo tempo; • Durabilidade: uma vez que a transação esteja concluída, os dados consequentes não podem ser perdidos. Problema: Muito restritivo para uma solução de Big Data. A elasticidade, por exemplo, pode ser inviabilizada pela atomicidade e pela consistência. 9
  • 10. Categorias NoSQL • Orientado a documentos (MongoDB, CouchDB) • Bancos de dados chave/valor (DynamoDB, Redis) • Bancos de dados de grafos (Neo4j) • Etc 10
  • 12. Hadoop • Mantido pela Apache Foundation • Open Source • Desenvolvido para Processamento e análise de grandes volumes de Dados • Maiores Colaboradores: • Facebook • Google • Yahoo! • IBM 12
  • 19. Sobre o Splunk O Splunk é um mecanismo para os dados de máquina. Ele coleta, indexa e aproveita os dados de máquina gerados por todos os seus sistemas e infraestrutura de TI, sejam eles físicos, virtuais ou em nuvem. 19
  • 20. Logstash • O Logstash é um sistema para gerenciamento e agregação de logs. • Com ele, podemos coletar logs, aplicar filtros e tratar as mensagens e armazenar para uso posterior, como visualização, estatística e alertas. • Você consegue agregar logs de diferentes máquinas e aplicações em um ponto central e ver diversas informações relacionadas através de uma interface Web. 20
  • 21. ElasticSearch • Servidor de buscas distribuído • Baseado em REST • Open Source • Baseado no Apache Lucene • Programado em Java (1 Jar) • Pode manter sua base local e Distribuída ou armazenar no Hadoop (Nosso Caso) 21
  • 22. Kibana • Kibana é um frontend HTML / JS • Desenvolvido para criação de dashboards para seus dados • Integração total com Logstash, Apache Flume, Fluentd e outros • Análise em tempo real do fluxo de dados • Altamente escalável 22