SlideShare ist ein Scribd-Unternehmen logo
1 von 53
Big data
1
Introdução
O que é Big Data
Modelo DIKW
4 V´s
7 V´s
Buzzword e Gartner Hypecycle
Big Data – Hard e Soft Skills
Carreiras
Arquiteturas Big Data
Casos de Uso
Conteúdo disponível Big Data e Analytics
AGENDA
2
Edgar – Who am I ?
CTO | Data Architect | Researcher | Digital Mkteer | d.thinker | DevOps |
Cloud Products SME | Serial Entrepreneur
3
Big Data – O que é ?
4
BIG
5
DATA = DADOS
6
D I K W – Modelo
7
DIK – U - W – Outro exemplo
8
DIKW e outros modelos
9
D de DADO
FATOS DISCRETOS SOBRE UM DETERMINADO EVENTO
EXEMPLOS:
- DATA E HORA NA QUAL UM DETERMINADO INCIDENTE FOI
REGISTRADO
-LOG DE SISTEMAS
10
I de INFORMAÇÃO
PROVEM DA INTERPRETAÇÃO,
QUANTIFICAÇÃO E CONTEXTUALIZAÇÃO
DOS DADOS
EXEMPLOS:
- TEMPO MÉDIA ENTRE A OCORRENCIA DE
DOIS INCIDENTES
- A CADA 5 MIN SÃO GERADOS 25 LOG DE
SISTEMA
11
K de KNOWLEDGE
EXPERIÊNCIAS, IDÉIAS, INSIGHTS, VALORES, ANÁLISES INDIVIDUAIS E
MULTI-DIMENSIONAIS
EXEMPLO: O TEMPO MÉDIO DE
RESOLUÇÃO DE INCIDENTES DE
PRIORIDADE 2 AUMENTOU EM
15% APÓS O DEPLOY DO NOVO
RELEASE.
12
W de WISDOM
FAZER USO DO CONHECIMENTO PARA CRIAR VALOR ATRAVÉS DE
DECISÕES CORRETAS E SUPORTADAS POR INFORMAÇÕES
EXEMPLO: FOI IDENTIFICADO
AUMENTO NO TEMPO MÉDIO
DE RESOLUÇÃO DE INCIDENTES
COM PRIORIDADE 2 DEVIDO O
BAIXO NÍVEL DE
DOCUMENTAÇÃO
OPERACIONAL.
13
BIG DATA -> ++ WISDOM
OPERAÇÕES:
• Determinar a causa raiz de falhas, problemas e defeitos em near real-time;
MARKETING:
• Gerar cupons no ponto de venda com base em hábitos de compra dos clientes;
• Recomendar produtos relacionados entre sí, através do espelhamento de perfis
de consumo e ticket médio.
FINANCEIROS:
• Recalcular carteiras de risco inteiras, em questão de minutos;
• Detectar comportamentos fraudulentos antes que eles afetem sua organização.
14
4 V´s do Bigdata
TIP: Embora o termo "big data" é relativamente novo. Foi cunhado no
início dos anos 2000 proveniente do ato de recolher e armazenar
grandes quantidades de informações para eventual análise.
15
Dilbert e o Big Data
16
4 V’s tornaram-se pouco para definir big data
e no momento são 7 v’s...
• Pois é, O big data é complexo. Chegou digital, complexo, “atropelando” e
disruptivo e representou um desafio às tecnologias existentes
• Verificou-se que nem todos os tipos de dados considerados BIG, possuiam os
principais atributos – Volume, Variedade, Velocidade e Veracidade.
• Algumas dimensões somente ganham significado em volume: variedade e
veracidade. E mais recentemente novas considerações “V´s” foram
adicionadas ao processo de análise: Valor, Visibilidade, Variabilidade.
• Em resumo: devem ser levados em consideração todas as características
possíveis, relevantes, “que explicam” (Segundo os estatísticos) e ainda
haverá dúvidas sobre o que está sendo observado.
17
Volume
• Volume é o que é: muitos dados. Imagens, meta-dados, contextos,
tags, geo, stream.
18
Variedade
• Variedade diz respeito aos vários formatos em que o
dado é gerado, muitas vezes não está numa única
forma (perfeitamente estruturada em colunas), pode
conter imagens, mensagens e-mail, planilhas,
conversas de mídia social e mídia streaming.
Atualmente, não existe um "one-size -fits-all" para
abordagem universal.
19
Velocidade
• Velocidade - Pode ser interpretada de duas maneiras,
necessidade de armazenamento rápida (ingestão) ou
a manutenção de dados que são “sensíveis” ao tempo
(é um metadado = timestamp). Um exemplo é a
definição de perfis em tempo real de anúncios de
exibição na internet personalizadas de acordo com
seu padrão de uso.
20
Veracidade
•Veracidade – conforme os fatos, padronizado
com precisão e exatidão.
– Será que precisamos de um corretor
ortográfico para obter a consistência dos dados ?
Big Data – Veracidade = Inferências incorretas
estão sendo consideradas ?
21
Validade
•Validade - O dado interpretado deve fazer
sentido, ter uma lógica ou fato resultante de
uma inferência sustentável.
Um dos erros mais comuns é confundir
correlação com causa.
Volume - Validity = Worthlesness?
22
Valor
•Valor - o que importa, o que vale, o motivo pelo
qual o dado é “consumido”– provavelmente o
mais relevantes às organizações.
Dados entrando e saindo por si só não
representam necessariamente valor.
Big Data – transações = Dados + Valor?
23
Visibilidade
• Visibilidade - é a capacidade de ver ou ser visto. Dados
de fontes diversas precisam ser vinculadas através de
processos, métodos e tecnologias.
Dados estratégicos geram visões críticas e podem
permanecem disponíveis, mas não necessariamente
visíveis à todos.
Big Data – visibilidade = Buraco Negro?
24
Variabilidade
• Variabilidade - Além da velocidade e variedade de dados
cada vez maiores, os fluxos de dados podem ser altamente
inconsistentes com picos periódicos/sazonalidade.
Diariamente, picos de dados sazonais ou picos gerados com
base em eventos podem ser um desafio de gerenciar. Ainda
mais quando falamos de dados não estruturados.
Big Data + Social Media = Espelhamento digital ?
25
Buzzwords
26
Data Science – Analytics & Insigths
• Hoje em dia podemos dizer que é uma
metodologia. Consiste em aplicar
simultaneamente técnicas de Estatística,
Programação e Mineração de Dados a um
conjunto de dados, com o intuito de descobrir
padrões significativos, não triviais.
27
GartnerHypeCycle
28
E na prática – o que eu preciso saber ?
É importante lembrar que o valor principal de big data não vem dos
dados em sua forma bruta, mas do processamento e análise destes
dados, insights e ações (produtos e serviços) que surgem desta análise.
As mudanças bruscas nas tecnologias e abordagens gerenciais de big
data são precursores das mudanças dramáticas que vivenciaremos nas
em organizações inovadoras em nos respectivos produtos e serviços.
Interpretação de texto do Thomas H. Davenport em Big Data em Grandes Empresas
29
Data Jobs Hard and Soft Skills
HARD SKILLS
• Estatística
• Data Mining
• Machine Learning
• R ou Python
• Data Visualization
• Data Warehouse / Architecture
• Programação / Algorítimos
SOFT SKILLS
• Curiosidade
• Narrativa / Storytelling
• Generalista
• Conhecimentos de mercado
• Associação de Problemas
• Resolução de Problemas
30
Skills by Job Role Simplified with... A vai...
31
32
33
34
35
36
37
38
39
40
Maturidade Organiz. em Análise de Dados
41
Arquiteturas Big Data
em Cloud
42
Elastic Products
43
Pivotal
44
Microsoft
45
Hortonworks
46
Oracle vision
47
New DW – Big data - Oracle
48
Big Data – Complexity
49
Big Data – AWS use cases references
On-Demand Big
Data Analytics
Data
Warehousing
50
Big Data – AWS use cases references
Event-driven
(ETL)
Smart
Applications
Clickstream
Analysis
51
Conteúdos Disponíves
52
Métricas, métricas, visualizações sem fim...
53

Weitere ähnliche Inhalte

Was ist angesagt?

Tendências de inovações para a tecnologia de big data
Tendências de inovações para a tecnologia de big dataTendências de inovações para a tecnologia de big data
Tendências de inovações para a tecnologia de big data
cictec
 

Was ist angesagt? (20)

Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big data
 
ROI e Valor Econômico da Virtualização de Dados
ROI e Valor Econômico da Virtualização de DadosROI e Valor Econômico da Virtualização de Dados
ROI e Valor Econômico da Virtualização de Dados
 
Tendências de inovações para a tecnologia de big data
Tendências de inovações para a tecnologia de big dataTendências de inovações para a tecnologia de big data
Tendências de inovações para a tecnologia de big data
 
Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data Analytics
 
Business Intelligence, a evolução e o futuro.
Business Intelligence, a evolução e o futuro.Business Intelligence, a evolução e o futuro.
Business Intelligence, a evolução e o futuro.
 
Big Data: Desafios e Oportunidades
Big Data: Desafios e OportunidadesBig Data: Desafios e Oportunidades
Big Data: Desafios e Oportunidades
 
Big data: Descoberta de conhecimento em ambientes de big data e computação na...
Big data: Descoberta de conhecimento em ambientes de big data e computação na...Big data: Descoberta de conhecimento em ambientes de big data e computação na...
Big data: Descoberta de conhecimento em ambientes de big data e computação na...
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dados
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine Learning
 
1º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 13
1º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 131º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 13
1º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 13
 
Um novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud Computing
Um novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud ComputingUm novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud Computing
Um novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud Computing
 
Palestra Business Intelligence
Palestra Business IntelligencePalestra Business Intelligence
Palestra Business Intelligence
 
O que é Data Science?
O que é Data Science?O que é Data Science?
O que é Data Science?
 
Guia sobre análise de dados e aprendizado de máquina para CIO.
Guia sobre análise de dados e aprendizado de máquina para CIO.Guia sobre análise de dados e aprendizado de máquina para CIO.
Guia sobre análise de dados e aprendizado de máquina para CIO.
 
Media Analytics
Media AnalyticsMedia Analytics
Media Analytics
 
Tansformação Digital
Tansformação DigitalTansformação Digital
Tansformação Digital
 
BigData
BigDataBigData
BigData
 
Uma nova organização para Big Data
Uma nova organização para Big DataUma nova organização para Big Data
Uma nova organização para Big Data
 
Data mesh-pt
Data mesh-ptData mesh-pt
Data mesh-pt
 

Andere mochten auch

2012 08 14 ASR 5a Conferencia Qualidade Software Palestra Censo Assespro Q…
2012 08 14 ASR 5a Conferencia Qualidade Software Palestra Censo Assespro Q…2012 08 14 ASR 5a Conferencia Qualidade Software Palestra Censo Assespro Q…
2012 08 14 ASR 5a Conferencia Qualidade Software Palestra Censo Assespro Q…
Roberto C. Mayer
 
ειδικη θεματικη ΣΧ έτος 2012-2013 Η γεωργίαχτες και σήμερα
ειδικη θεματικη ΣΧ έτος 2012-2013 Η γεωργίαχτες και σήμερα ειδικη θεματικη ΣΧ έτος 2012-2013 Η γεωργίαχτες και σήμερα
ειδικη θεματικη ΣΧ έτος 2012-2013 Η γεωργίαχτες και σήμερα
sintos65
 

Andere mochten auch (19)

Big Data
Big DataBig Data
Big Data
 
Muscle Media Magazine - January 2016 Edition - ARMAGEDDON
Muscle Media Magazine - January 2016 Edition - ARMAGEDDON Muscle Media Magazine - January 2016 Edition - ARMAGEDDON
Muscle Media Magazine - January 2016 Edition - ARMAGEDDON
 
FCTA-UNP: Desarrollo emprendedor, un estudio de las posibilidades de inversió...
FCTA-UNP: Desarrollo emprendedor, un estudio de las posibilidades de inversió...FCTA-UNP: Desarrollo emprendedor, un estudio de las posibilidades de inversió...
FCTA-UNP: Desarrollo emprendedor, un estudio de las posibilidades de inversió...
 
2020 Spring Conference 2014 - Engines of Future Growth
2020 Spring Conference 2014 - Engines of Future Growth2020 Spring Conference 2014 - Engines of Future Growth
2020 Spring Conference 2014 - Engines of Future Growth
 
Jewellery Design
Jewellery DesignJewellery Design
Jewellery Design
 
2012 08 14 ASR 5a Conferencia Qualidade Software Palestra Censo Assespro Q…
2012 08 14 ASR 5a Conferencia Qualidade Software Palestra Censo Assespro Q…2012 08 14 ASR 5a Conferencia Qualidade Software Palestra Censo Assespro Q…
2012 08 14 ASR 5a Conferencia Qualidade Software Palestra Censo Assespro Q…
 
20120524 sixsigmapalestrarobertomayer
20120524 sixsigmapalestrarobertomayer20120524 sixsigmapalestrarobertomayer
20120524 sixsigmapalestrarobertomayer
 
Instagram Tutuorials
Instagram TutuorialsInstagram Tutuorials
Instagram Tutuorials
 
ειδικη θεματικη ΣΧ έτος 2012-2013 Η γεωργίαχτες και σήμερα
ειδικη θεματικη ΣΧ έτος 2012-2013 Η γεωργίαχτες και σήμερα ειδικη θεματικη ΣΧ έτος 2012-2013 Η γεωργίαχτες και σήμερα
ειδικη θεματικη ΣΧ έτος 2012-2013 Η γεωργίαχτες και σήμερα
 
Το Υλικό του Υπολογιστή
Το Υλικό του ΥπολογιστήΤο Υλικό του Υπολογιστή
Το Υλικό του Υπολογιστή
 
Assessment scheme - c&c presentation
Assessment scheme - c&c presentationAssessment scheme - c&c presentation
Assessment scheme - c&c presentation
 
FCTA-UNP: Violencia Intrafamiliar, Recuento de datos estadísticos registrados...
FCTA-UNP: Violencia Intrafamiliar, Recuento de datos estadísticos registrados...FCTA-UNP: Violencia Intrafamiliar, Recuento de datos estadísticos registrados...
FCTA-UNP: Violencia Intrafamiliar, Recuento de datos estadísticos registrados...
 
Bigdata - Leandro Wanderley
Bigdata - Leandro WanderleyBigdata - Leandro Wanderley
Bigdata - Leandro Wanderley
 
FCTA-UNP: Pertinencia social de la Universidad Nacional de Pilar desde la per...
FCTA-UNP: Pertinencia social de la Universidad Nacional de Pilar desde la per...FCTA-UNP: Pertinencia social de la Universidad Nacional de Pilar desde la per...
FCTA-UNP: Pertinencia social de la Universidad Nacional de Pilar desde la per...
 
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
 
Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados Massivos
 
Big data apresentacao
Big data apresentacaoBig data apresentacao
Big data apresentacao
 
Big Data
Big DataBig Data
Big Data
 
Big data Instituto Big Data Brasil Crie
Big data Instituto Big Data Brasil CrieBig data Instituto Big Data Brasil Crie
Big data Instituto Big Data Brasil Crie
 

Ähnlich wie BIG data

Seminário Big Data, 19/05/2014 - Apresentação Afonso Coelho
Seminário Big Data, 19/05/2014 - Apresentação Afonso CoelhoSeminário Big Data, 19/05/2014 - Apresentação Afonso Coelho
Seminário Big Data, 19/05/2014 - Apresentação Afonso Coelho
FecomercioSP
 
1a Web Aula - Gestão de Tecnologia da Informação.pdf
1a Web Aula - Gestão de Tecnologia da Informação.pdf1a Web Aula - Gestão de Tecnologia da Informação.pdf
1a Web Aula - Gestão de Tecnologia da Informação.pdf
Dimas Francisco
 

Ähnlich wie BIG data (20)

Big Data e profissionais da informação
Big Data e profissionais da informaçãoBig Data e profissionais da informação
Big Data e profissionais da informação
 
Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?
 
Digital Summit Brasil 2016 - Tech Trends + Cyber Security
Digital Summit Brasil 2016 - Tech Trends + Cyber SecurityDigital Summit Brasil 2016 - Tech Trends + Cyber Security
Digital Summit Brasil 2016 - Tech Trends + Cyber Security
 
Big data
Big dataBig data
Big data
 
Wiseminer Data Blending, Data Preparation & Analytics
Wiseminer Data Blending, Data Preparation & AnalyticsWiseminer Data Blending, Data Preparation & Analytics
Wiseminer Data Blending, Data Preparation & Analytics
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e Mercado
 
Data Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dadosData Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dados
 
BigData-Hekima-Ebook.pdf
BigData-Hekima-Ebook.pdfBigData-Hekima-Ebook.pdf
BigData-Hekima-Ebook.pdf
 
Seminário Big Data, 19/05/2014 - Apresentação Afonso Coelho
Seminário Big Data, 19/05/2014 - Apresentação Afonso CoelhoSeminário Big Data, 19/05/2014 - Apresentação Afonso Coelho
Seminário Big Data, 19/05/2014 - Apresentação Afonso Coelho
 
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
 
Data Management: 5 tendências para alcançar a mudança
Data Management: 5 tendências para alcançar a mudançaData Management: 5 tendências para alcançar a mudança
Data Management: 5 tendências para alcançar a mudança
 
1a Web Aula - Gestão de Tecnologia da Informação.pdf
1a Web Aula - Gestão de Tecnologia da Informação.pdf1a Web Aula - Gestão de Tecnologia da Informação.pdf
1a Web Aula - Gestão de Tecnologia da Informação.pdf
 
BRA_WEBINAR_DESIGN_DRIVEN_DATA SCIENCE.pptx
BRA_WEBINAR_DESIGN_DRIVEN_DATA SCIENCE.pptxBRA_WEBINAR_DESIGN_DRIVEN_DATA SCIENCE.pptx
BRA_WEBINAR_DESIGN_DRIVEN_DATA SCIENCE.pptx
 
Arquitetando seus dados na prática para a LGPD - Alessandra Martins
Arquitetando seus dados na prática para a LGPD - Alessandra MartinsArquitetando seus dados na prática para a LGPD - Alessandra Martins
Arquitetando seus dados na prática para a LGPD - Alessandra Martins
 
Big data
Big dataBig data
Big data
 
Aws summit 2015 - big data
Aws summit   2015 - big dataAws summit   2015 - big data
Aws summit 2015 - big data
 
Cultura de dados: por que kpis garantem a saúde do seu negócio
Cultura de dados: por que kpis garantem a saúde do seu negócioCultura de dados: por que kpis garantem a saúde do seu negócio
Cultura de dados: por que kpis garantem a saúde do seu negócio
 
Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?
 
9 motivos para aprender small data
9 motivos para aprender small data9 motivos para aprender small data
9 motivos para aprender small data
 
Você está preparado para o GDPR?
Você está preparado para o GDPR?Você está preparado para o GDPR?
Você está preparado para o GDPR?
 

BIG data

  • 2. Introdução O que é Big Data Modelo DIKW 4 V´s 7 V´s Buzzword e Gartner Hypecycle Big Data – Hard e Soft Skills Carreiras Arquiteturas Big Data Casos de Uso Conteúdo disponível Big Data e Analytics AGENDA 2
  • 3. Edgar – Who am I ? CTO | Data Architect | Researcher | Digital Mkteer | d.thinker | DevOps | Cloud Products SME | Serial Entrepreneur 3
  • 4. Big Data – O que é ? 4
  • 7. D I K W – Modelo 7
  • 8. DIK – U - W – Outro exemplo 8
  • 9. DIKW e outros modelos 9
  • 10. D de DADO FATOS DISCRETOS SOBRE UM DETERMINADO EVENTO EXEMPLOS: - DATA E HORA NA QUAL UM DETERMINADO INCIDENTE FOI REGISTRADO -LOG DE SISTEMAS 10
  • 11. I de INFORMAÇÃO PROVEM DA INTERPRETAÇÃO, QUANTIFICAÇÃO E CONTEXTUALIZAÇÃO DOS DADOS EXEMPLOS: - TEMPO MÉDIA ENTRE A OCORRENCIA DE DOIS INCIDENTES - A CADA 5 MIN SÃO GERADOS 25 LOG DE SISTEMA 11
  • 12. K de KNOWLEDGE EXPERIÊNCIAS, IDÉIAS, INSIGHTS, VALORES, ANÁLISES INDIVIDUAIS E MULTI-DIMENSIONAIS EXEMPLO: O TEMPO MÉDIO DE RESOLUÇÃO DE INCIDENTES DE PRIORIDADE 2 AUMENTOU EM 15% APÓS O DEPLOY DO NOVO RELEASE. 12
  • 13. W de WISDOM FAZER USO DO CONHECIMENTO PARA CRIAR VALOR ATRAVÉS DE DECISÕES CORRETAS E SUPORTADAS POR INFORMAÇÕES EXEMPLO: FOI IDENTIFICADO AUMENTO NO TEMPO MÉDIO DE RESOLUÇÃO DE INCIDENTES COM PRIORIDADE 2 DEVIDO O BAIXO NÍVEL DE DOCUMENTAÇÃO OPERACIONAL. 13
  • 14. BIG DATA -> ++ WISDOM OPERAÇÕES: • Determinar a causa raiz de falhas, problemas e defeitos em near real-time; MARKETING: • Gerar cupons no ponto de venda com base em hábitos de compra dos clientes; • Recomendar produtos relacionados entre sí, através do espelhamento de perfis de consumo e ticket médio. FINANCEIROS: • Recalcular carteiras de risco inteiras, em questão de minutos; • Detectar comportamentos fraudulentos antes que eles afetem sua organização. 14
  • 15. 4 V´s do Bigdata TIP: Embora o termo "big data" é relativamente novo. Foi cunhado no início dos anos 2000 proveniente do ato de recolher e armazenar grandes quantidades de informações para eventual análise. 15
  • 16. Dilbert e o Big Data 16
  • 17. 4 V’s tornaram-se pouco para definir big data e no momento são 7 v’s... • Pois é, O big data é complexo. Chegou digital, complexo, “atropelando” e disruptivo e representou um desafio às tecnologias existentes • Verificou-se que nem todos os tipos de dados considerados BIG, possuiam os principais atributos – Volume, Variedade, Velocidade e Veracidade. • Algumas dimensões somente ganham significado em volume: variedade e veracidade. E mais recentemente novas considerações “V´s” foram adicionadas ao processo de análise: Valor, Visibilidade, Variabilidade. • Em resumo: devem ser levados em consideração todas as características possíveis, relevantes, “que explicam” (Segundo os estatísticos) e ainda haverá dúvidas sobre o que está sendo observado. 17
  • 18. Volume • Volume é o que é: muitos dados. Imagens, meta-dados, contextos, tags, geo, stream. 18
  • 19. Variedade • Variedade diz respeito aos vários formatos em que o dado é gerado, muitas vezes não está numa única forma (perfeitamente estruturada em colunas), pode conter imagens, mensagens e-mail, planilhas, conversas de mídia social e mídia streaming. Atualmente, não existe um "one-size -fits-all" para abordagem universal. 19
  • 20. Velocidade • Velocidade - Pode ser interpretada de duas maneiras, necessidade de armazenamento rápida (ingestão) ou a manutenção de dados que são “sensíveis” ao tempo (é um metadado = timestamp). Um exemplo é a definição de perfis em tempo real de anúncios de exibição na internet personalizadas de acordo com seu padrão de uso. 20
  • 21. Veracidade •Veracidade – conforme os fatos, padronizado com precisão e exatidão. – Será que precisamos de um corretor ortográfico para obter a consistência dos dados ? Big Data – Veracidade = Inferências incorretas estão sendo consideradas ? 21
  • 22. Validade •Validade - O dado interpretado deve fazer sentido, ter uma lógica ou fato resultante de uma inferência sustentável. Um dos erros mais comuns é confundir correlação com causa. Volume - Validity = Worthlesness? 22
  • 23. Valor •Valor - o que importa, o que vale, o motivo pelo qual o dado é “consumido”– provavelmente o mais relevantes às organizações. Dados entrando e saindo por si só não representam necessariamente valor. Big Data – transações = Dados + Valor? 23
  • 24. Visibilidade • Visibilidade - é a capacidade de ver ou ser visto. Dados de fontes diversas precisam ser vinculadas através de processos, métodos e tecnologias. Dados estratégicos geram visões críticas e podem permanecem disponíveis, mas não necessariamente visíveis à todos. Big Data – visibilidade = Buraco Negro? 24
  • 25. Variabilidade • Variabilidade - Além da velocidade e variedade de dados cada vez maiores, os fluxos de dados podem ser altamente inconsistentes com picos periódicos/sazonalidade. Diariamente, picos de dados sazonais ou picos gerados com base em eventos podem ser um desafio de gerenciar. Ainda mais quando falamos de dados não estruturados. Big Data + Social Media = Espelhamento digital ? 25
  • 27. Data Science – Analytics & Insigths • Hoje em dia podemos dizer que é uma metodologia. Consiste em aplicar simultaneamente técnicas de Estatística, Programação e Mineração de Dados a um conjunto de dados, com o intuito de descobrir padrões significativos, não triviais. 27
  • 29. E na prática – o que eu preciso saber ? É importante lembrar que o valor principal de big data não vem dos dados em sua forma bruta, mas do processamento e análise destes dados, insights e ações (produtos e serviços) que surgem desta análise. As mudanças bruscas nas tecnologias e abordagens gerenciais de big data são precursores das mudanças dramáticas que vivenciaremos nas em organizações inovadoras em nos respectivos produtos e serviços. Interpretação de texto do Thomas H. Davenport em Big Data em Grandes Empresas 29
  • 30. Data Jobs Hard and Soft Skills HARD SKILLS • Estatística • Data Mining • Machine Learning • R ou Python • Data Visualization • Data Warehouse / Architecture • Programação / Algorítimos SOFT SKILLS • Curiosidade • Narrativa / Storytelling • Generalista • Conhecimentos de mercado • Associação de Problemas • Resolução de Problemas 30
  • 31. Skills by Job Role Simplified with... A vai... 31
  • 32. 32
  • 33. 33
  • 34. 34
  • 35. 35
  • 36. 36
  • 37. 37
  • 38. 38
  • 39. 39
  • 40. 40
  • 41. Maturidade Organiz. em Análise de Dados 41
  • 48. New DW – Big data - Oracle 48
  • 49. Big Data – Complexity 49
  • 50. Big Data – AWS use cases references On-Demand Big Data Analytics Data Warehousing 50
  • 51. Big Data – AWS use cases references Event-driven (ETL) Smart Applications Clickstream Analysis 51

Hinweis der Redaktion

  1. Speech: Apesar de estarmos alguns anos na era do Conhecimento nossa cabeça ainda está na Era Industrial. Algumas pessoas ainda questionam se realmente estamos nessa ERA e eu trouxe alguns fatos para provar para vocês que sim. "Daqui a cinco anos você estará bem próximo de ser a mesma pessoa que é hoje, exceto por duas coisas: os livros que ler e as pessoas de quem se aproximar." (Charles Jones)
  2. Alguns cursos online disponíveis. Existem tracks completos de data Science, analytics, módulos gratuitos