SlideShare ist ein Scribd-Unternehmen logo
1 von 42
Downloaden Sie, um offline zu lesen
BIG DATA
Seus problemas estão apenas começando
Thiago Gonzaga
Engenheiro de Software - Aurea Software
Agenda
• No principio era o verbo
• O que é Big Data?
• Estatísticas sobre Big Data
• Soluções para Big Data
• Oportunidades na Area de Big Data
Quién soy jo?
• Bacharel em ciência da computação pela UNESP
• Desenvolvedor desde 2004, em Java desde 2007
• Evangelista Java, palestrante e entusiasta de tecnologias
livres e Open Source.
• Coordenador de Eventos do Grupo de Usuários Java.
• Engenheiro de Software na Aurea
No princípio era o verbo…
Dados
• “Informação” não processada
• Fatos
• Números
• Afirmações
• Sem significado
• Pode ser texto, video, imagem
Informação
• Conteúdo útil
• Relevante
• Possui significado
• Processo, estudo, ensaio a partir de dados
Falemos sobre
Big Data
Você já deve ter ouvido falar:
“Big Data é a solução do
seu problema…”
O MAIOR PROBLEMA
DE TI DA ATUALIDADE
Vamos a lógica
Dados, dados, muitos
dados
• Com o aumento de quantidade de dados
• aumenta custos de processamento, logo mais gastos em
infraestrutura
• armazenamento de dados não é infinito, logo mais gastos com
armazenamento e backup
• Grande volume de dados aumenta consumo de banda de
entrada e saída, ou seja, mais gastos…
• tornar a informação disponível requer mais gastos
• Orçamento não é infinito e geralmente é bem curto
Gastos,
gastos…
… e mais gastos
Resumindo…
O que é big data?
• Do inglês dado grande (literalmente)
• Quando você muitos dados
• uma porrada de dados
• uma caralhada de dados
• ou seja…
• DADOS PRA CA!@#$%ˆ&*
Thiago não pode
escrever isso no slide…
Então escreve ai:
“Big Data é um termo para
descrever um problema onde
o fluxo de entrada de dados
é maior que a capacidade de
processa-los”
Vamos ver algumas
estatísticas
Boeing 787 produz meio
terabyte de dados por vôo
Fonte: http://www.computerworlduk.com/news/data/boeing-787s-
create-half-terabyte-of-data-per-flight-says-virgin-atlantic-3433595/
Se há problema e
demanda precisa de
uma solução
Solução para BigData
• Armazenamento
• Processamento
• Análise
Solução para BigData
• Armazenamento:
• HDFS (Hadoop Distributed File System)
• Banco de dados não estruturado (não relacional)
• MongoDB
• Cassandra
• Neo4j
Solução para BigData
• Processamento:
• Hadoop MapReduce
• Apache Lucene
• Solr
• Elasticsearch (especialmente pra texto)
Solução para BigData
• Análise de dados:
• Pentaho
• Kibana
• Graylog
Curiosidade:
Hadoop, Lucene, Solr,
elasticsearch entre
outras soluções Big Data
Pra onde eu vou
• Engenheiro/Arquiteto de Informação
• Cientista de dados
• Analista de dados
• Designer de BI
• Analista de BI
• Arquiteto de Cloud
• Segurança da Informação
Leituras interessantes
• Uma visão universal sobre dados: 

http://www.emc.com/leadership/digital-universe
• Apache Hadoop: http://hadoop.apache.org/
• Apache Lucene: http://lucene.apache.org
• Apache Solr: http://lucene.apache.org/solr/
• elasticsearch: https://www.elastic.co/products/elasticsearch
• Kibana: https://www.elastic.co/products/kibana
• Graylog: https://www.graylog.org/
• Pentaho: http://www.pentaho.com/
• Panorama de Big Data no Brasil: https://www.ibm.com/developerworks/community/blogs/bigdata/
entry/entrevista_com_cezar_taurion_o_estagio_atual_do_big_data_no_brasil
• Você realmente sabe o que é Big Data: https://www.ibm.com/developerworks/community/blogs/
ctaurion/entry/voce_realmente_sabe_o_que_e_big_data
Projetos do Java Noroeste
• Encontros regulares
• Incentivo a contribuição da comunidade (Programa de treinamento para
futuros palestrantes) (call 4 papers: http://bit.ly/javanoroeste-call-for-papers)
• Slack (convite: javanoroeste-slack.herokuapp.com.br)
• Novo Logo (votação: bit.ly/pesquisa-logo-javanoroeste)
• Novo Site
• Banco de currículos
• Sistema de gerador de certificado
• Entre outros
Obrigado!!!
Thiago Gonzaga
Engenheiro de Software - Aurea Software
@thiguetta

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (20)

Palestra Introdução a Big Data
Palestra Introdução a Big DataPalestra Introdução a Big Data
Palestra Introdução a Big Data
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATA
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e Mercado
 
Ativando Inteligência com Big Data
Ativando Inteligência com Big DataAtivando Inteligência com Big Data
Ativando Inteligência com Big Data
 
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big Data
Mini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big DataMini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big Data
Mini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big Data
 
Big Data, o que é isso?
Big Data, o que é isso?Big Data, o que é isso?
Big Data, o que é isso?
 
Diálogos entre cientistas de dados e cientistas sociais
Diálogos entre cientistas de dados e cientistas sociais Diálogos entre cientistas de dados e cientistas sociais
Diálogos entre cientistas de dados e cientistas sociais
 
Big Data
Big DataBig Data
Big Data
 
Hadoop Day - MeetUp - O poder da Informação
Hadoop Day - MeetUp - O poder da InformaçãoHadoop Day - MeetUp - O poder da Informação
Hadoop Day - MeetUp - O poder da Informação
 
Big data
Big dataBig data
Big data
 
Big Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaBig Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e Tecnologia
 
TDC2016POA | Trilha BigData - Google BigQuery: Estudo de Caso Globo.com
TDC2016POA | Trilha BigData - Google BigQuery: Estudo de Caso Globo.comTDC2016POA | Trilha BigData - Google BigQuery: Estudo de Caso Globo.com
TDC2016POA | Trilha BigData - Google BigQuery: Estudo de Caso Globo.com
 
O que é Data Science?
O que é Data Science?O que é Data Science?
O que é Data Science?
 
Big data Workshop
Big data WorkshopBig data Workshop
Big data Workshop
 
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
 
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaPalestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
 
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
 
Big Data
Big DataBig Data
Big Data
 

Ähnlich wie Big Data: Seus problemas estão apenas começando

Ähnlich wie Big Data: Seus problemas estão apenas começando (20)

Big Data
Big DataBig Data
Big Data
 
Pentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesPentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data Lakes
 
Big data
Big dataBig data
Big data
 
Big Data, NoSQL e In Memory Databases
Big Data, NoSQL e In Memory DatabasesBig Data, NoSQL e In Memory Databases
Big Data, NoSQL e In Memory Databases
 
Aula BigData.pptx
Aula BigData.pptxAula BigData.pptx
Aula BigData.pptx
 
BIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaBIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à Pratica
 
aula1 - Bigdata.pdf
aula1 - Bigdata.pdfaula1 - Bigdata.pdf
aula1 - Bigdata.pdf
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
 
Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...
 
Hackathon Inmetrics e Fiap: Desafios do Big Data
Hackathon Inmetrics e Fiap: Desafios do Big DataHackathon Inmetrics e Fiap: Desafios do Big Data
Hackathon Inmetrics e Fiap: Desafios do Big Data
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dados
 
Big Data Latinoware 2014
Big Data Latinoware 2014Big Data Latinoware 2014
Big Data Latinoware 2014
 
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivrePalestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
 
Big Data, JVM e Redes Sociais
Big Data, JVM e Redes SociaisBig Data, JVM e Redes Sociais
Big Data, JVM e Redes Sociais
 
Workshop / Meetup: Visão geral sobre Big Data
Workshop / Meetup: Visão geral sobre Big DataWorkshop / Meetup: Visão geral sobre Big Data
Workshop / Meetup: Visão geral sobre Big Data
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinoware
 
Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?
 
Palestra Big Data SCTI
Palestra Big Data SCTIPalestra Big Data SCTI
Palestra Big Data SCTI
 
Bigadata casese opotunidades
Bigadata casese opotunidadesBigadata casese opotunidades
Bigadata casese opotunidades
 

Mehr von Thiago Gonzaga (8)

Software Livre
Software LivreSoftware Livre
Software Livre
 
Keynote Abertura 20 Dias de Java - Javanoroeste
Keynote Abertura 20 Dias de Java - JavanoroesteKeynote Abertura 20 Dias de Java - Javanoroeste
Keynote Abertura 20 Dias de Java - Javanoroeste
 
Java 8 e futuro
Java 8 e futuroJava 8 e futuro
Java 8 e futuro
 
Design patterns
Design patternsDesign patterns
Design patterns
 
Concurrency 1.0: Concorrência em Ambientes Corporativos
Concurrency 1.0: Concorrência em Ambientes CorporativosConcurrency 1.0: Concorrência em Ambientes Corporativos
Concurrency 1.0: Concorrência em Ambientes Corporativos
 
Virtualização e cloud computing
Virtualização e cloud computingVirtualização e cloud computing
Virtualização e cloud computing
 
Compweek
CompweekCompweek
Compweek
 
Introdução a Tecnologia Java
Introdução a Tecnologia JavaIntrodução a Tecnologia Java
Introdução a Tecnologia Java
 

Big Data: Seus problemas estão apenas começando

  • 1. BIG DATA Seus problemas estão apenas começando Thiago Gonzaga Engenheiro de Software - Aurea Software
  • 2. Agenda • No principio era o verbo • O que é Big Data? • Estatísticas sobre Big Data • Soluções para Big Data • Oportunidades na Area de Big Data
  • 3. Quién soy jo? • Bacharel em ciência da computação pela UNESP • Desenvolvedor desde 2004, em Java desde 2007 • Evangelista Java, palestrante e entusiasta de tecnologias livres e Open Source. • Coordenador de Eventos do Grupo de Usuários Java. • Engenheiro de Software na Aurea
  • 4. No princípio era o verbo…
  • 5.
  • 6. Dados • “Informação” não processada • Fatos • Números • Afirmações • Sem significado • Pode ser texto, video, imagem
  • 7. Informação • Conteúdo útil • Relevante • Possui significado • Processo, estudo, ensaio a partir de dados
  • 8.
  • 10. Você já deve ter ouvido falar: “Big Data é a solução do seu problema…”
  • 11.
  • 12. O MAIOR PROBLEMA DE TI DA ATUALIDADE
  • 13.
  • 15. Dados, dados, muitos dados • Com o aumento de quantidade de dados • aumenta custos de processamento, logo mais gastos em infraestrutura • armazenamento de dados não é infinito, logo mais gastos com armazenamento e backup • Grande volume de dados aumenta consumo de banda de entrada e saída, ou seja, mais gastos… • tornar a informação disponível requer mais gastos • Orçamento não é infinito e geralmente é bem curto
  • 18. … e mais gastos
  • 20. O que é big data? • Do inglês dado grande (literalmente) • Quando você muitos dados • uma porrada de dados • uma caralhada de dados • ou seja… • DADOS PRA CA!@#$%ˆ&*
  • 21.
  • 22. Thiago não pode escrever isso no slide… Então escreve ai:
  • 23. “Big Data é um termo para descrever um problema onde o fluxo de entrada de dados é maior que a capacidade de processa-los”
  • 24.
  • 26. Boeing 787 produz meio terabyte de dados por vôo Fonte: http://www.computerworlduk.com/news/data/boeing-787s- create-half-terabyte-of-data-per-flight-says-virgin-atlantic-3433595/
  • 27.
  • 28. Se há problema e demanda precisa de uma solução
  • 29. Solução para BigData • Armazenamento • Processamento • Análise
  • 30. Solução para BigData • Armazenamento: • HDFS (Hadoop Distributed File System) • Banco de dados não estruturado (não relacional) • MongoDB • Cassandra • Neo4j
  • 31. Solução para BigData • Processamento: • Hadoop MapReduce • Apache Lucene • Solr • Elasticsearch (especialmente pra texto)
  • 32. Solução para BigData • Análise de dados: • Pentaho • Kibana • Graylog
  • 33. Curiosidade: Hadoop, Lucene, Solr, elasticsearch entre outras soluções Big Data
  • 34.
  • 35.
  • 36. Pra onde eu vou • Engenheiro/Arquiteto de Informação • Cientista de dados • Analista de dados • Designer de BI • Analista de BI • Arquiteto de Cloud • Segurança da Informação
  • 37.
  • 38.
  • 39. Leituras interessantes • Uma visão universal sobre dados: 
 http://www.emc.com/leadership/digital-universe • Apache Hadoop: http://hadoop.apache.org/ • Apache Lucene: http://lucene.apache.org • Apache Solr: http://lucene.apache.org/solr/ • elasticsearch: https://www.elastic.co/products/elasticsearch • Kibana: https://www.elastic.co/products/kibana • Graylog: https://www.graylog.org/ • Pentaho: http://www.pentaho.com/ • Panorama de Big Data no Brasil: https://www.ibm.com/developerworks/community/blogs/bigdata/ entry/entrevista_com_cezar_taurion_o_estagio_atual_do_big_data_no_brasil • Você realmente sabe o que é Big Data: https://www.ibm.com/developerworks/community/blogs/ ctaurion/entry/voce_realmente_sabe_o_que_e_big_data
  • 40. Projetos do Java Noroeste • Encontros regulares • Incentivo a contribuição da comunidade (Programa de treinamento para futuros palestrantes) (call 4 papers: http://bit.ly/javanoroeste-call-for-papers) • Slack (convite: javanoroeste-slack.herokuapp.com.br) • Novo Logo (votação: bit.ly/pesquisa-logo-javanoroeste) • Novo Site • Banco de currículos • Sistema de gerador de certificado • Entre outros
  • 41.
  • 42. Obrigado!!! Thiago Gonzaga Engenheiro de Software - Aurea Software @thiguetta