O documento discute a profissão de cientista de dados e se ela será a profissão do futuro. Apresenta as habilidades necessárias para o cargo, como conhecimentos em TI, estatística e negócios. Também discute as diferenças entre análise de dados tradicional e ciência de dados, e prevê uma escassez futura destes profissionais.
1. Será Mesmo o Cientista de
Dados a Profissão do Futuro?
2. Mauricio C. Purificação
Empreendedor, consultor, palestrante, instrutor e especialista no
desenvolvimento de soluções de Business Intelligence, Data Warehousing e
Business Analytics;
Sócio-Diretor da OxenTI - Soluções em Tecnologia da Informação;
Analista de Business Intelligence (BI) – Cárdio Pulmonar da Bahia;
MBA em Administração/Gestão de Negócios - Universidade Salvador (UNIFACS);
Bacharel em Ciência da Computação - Universidade Federal da Bahia (UFBA);
Pesquisador nas áreas de Business Intelligence, Business Analytics, Big Data,
Métodos Ágeis e Bancos de Dados Evolutivos.
http://lattes.cnpq.br/3312807554334758
3. Business Intelligence?
“BI é o uso da informação que permite às organizações melhor
decidir, medir, gerir e otimizar o desempenho para ganhar
eficiência e benefício financeiro.”
Instituto Gartner
4. Business Intelligence?
BI é um processo. Existem técnicas, tecnologias e software para
BI, mas BI é um processo que envolve métodos, técnicas,
tecnologias, pessoas, informações, fontes de informações,
métricas, ferramentas, etc.
5. Business Intelligence?
O objetivo do processo de BI é ajudar pessoas e organizações a
encontrarem causas e não só apresentar informações, como
fazem sistemas gerenciais. A busca por causas passa por analisar
dados, talvez grandes quantidades, à procura de padrões,
modelos ou repetições.
14. Novos Padrões de Armazenamento de
Dados
2009
Redis Initial Release
2004 2006 2007 2008 2009 2011 2012 2013 2014
2007
MongoDB Started,
Neo4J Initial Release
2004
Google’s Map Reduce
Paper
Published
2012
Google Spanner Paper
Published
1998
1998
NoSQL coined
2006
Hadoop
Started
2008
Apache Hbase,
Apache Cassandra
15. Big Data
“Big Data é como sexo na adolescência: todo mundo fala, ninguém
realmente sabe como fazer, todo mundo pensa que todo mundo está
fazendo, então todo mundo diz que está fazendo.
Dan Ariely, Duke University
16.
17.
18.
19. Big Data
Big Data são dados que excedem o
armazenamento, o processamento e
a capacidade dos sistemas
convencionais:
Volume de dados muito grande
Dados são gerados rapidamente
Dados não se encaixam nas estruturas
de arquiteturas de sistemas atuais
Além disso, para obter valor a partir
desses dados, é preciso mudar a
forma de analisá-los.
34. Ciência de Dados
A ciência de dados difere das
análises estatísticas e da
ciência da computação em seu
método aplicado aos dados
coletados usando princípios
científicos.
Esta é a diferença entre ser
capaz de explicar o que os
dados significam agora e
prever o que os dados podem
representar no futuro.
35. Ciência de Dados
A análise de dados tradicional têm
sido implantada para explicar
tendências a partir de questões
bem-formuladas e da modelagem
dos dados.
A ciência de dados está
procurando descobrir
conhecimento demandável a partir
de uma quantidade grande e
pesada de dados que podem ser
usadas para tomar decisões e fazer
previsões.
36.
37.
38.
39.
40. O Cientista de Dados
Este profissional deve possuir
qualificações na área de TI para
que consiga acessar e processar
o dado de forma eficiente e em
tempo hábil, capacidades
matemáticas para entender as
implicações dos modelos
utilizados e de negócio para que
possa traduzir tudo isso em
relatórios que possibilitem
decisões assertivas.
41. O Cientista de Dados
A profissão demanda
tipicamente cinco tipos
diferentes de tarefa: limpeza de
dados, perguntas frequentes,
análise a partir do uso de dados
estatísticos e modelos de
machine learning, resultados
visualizados e a melhoria de
modelos e algoritmos para
melhores rendimentos e
resultados e execução.
42. O Cientista de Dados
Hoje a maioria das ações de BI
envolvem dados armazenados
em data warehouse ao longo
do tempo e apenas
conseguem visualizar
retrospectivas através dos
gráficos e dashboards
desenvolvidos pelos analistas
de BI.
Chegar a análises preditivas é
um passo que não se dá de um
dia para o outro.
45. E o Futuro?
Nos próximos anos viveremos uma
escassez destes profissionais, não
só no Brasil, mas no mundo todo.
Esta escassez ao mesmo tempo
em que abre muitas perspectivas
profissionais para os que
abraçarem a função, também
atuará como um entrave, pois
dificultará às empresas usarem Big
Data com eficiência.