O documento discute os conceitos de Big Data, Inteligência Artificial e Aprendizado de Máquina. Apresenta as principais ferramentas e técnicas dessas áreas, incluindo redes neurais profundas, clustering, regressão linear e florestas aleatórias. Também aborda a importância dessas tecnologias para a tomada de decisão estratégica e geração de conhecimento a partir de dados.
2. SOBRE
Data Scientist na Epitack
Professor
Pesquisador em aprendizagem de
máquina e análise de dados
Doutorando em Mineração de dados e
Inteligência Artificial
9. MINERAÇÃO DE DADOS
A transformação de grandes quantidades de dados em padrões e
regras:
Direcionada e Não Direcionada
Direcionada: tentamos prever um ponto de dados em particular
◦ Ex.: preço de venda de uma casa baseado em informações sobre
outras casas à venda no bairro
Não direcionada:
◦ Tentamos criar grupos de dados, ou achar padrões em dados
existentes
10. “O objetivo da mineração de dados é criar um
modelo que possa melhorar o modo pelo qual
interpretamos nossos dados existentes e
futuros.
13. Uma nova tecnologia
Uma nova técnica
Um novo processo
Uma nova abordagem
Um novo campo do conhecimento
Uma revolução
14. O QUE É BIG DATA?
Desde antes do surgimento do conceito, já éramos capazes de
trabalhar com grandes volumes de dados.
Trabalhar por amostragem era a solução mais comum
Tratamento de dados => correção ou informação valiosa
Técnicas e ferramentas para lidar com o grande volume de dados
provenientes de diversas fontes.
15. AGORA TEMOS MAIS NECESSIDADES
Volume
Velocidade
Variedade
Variabilidade
Complexidade
BIG
DATA
28. O aprendizado de máquina (ML — Machine Learning) é
um subcampo da inteligência artificial dedicado ao
desenvolvimento de algoritmos e técnicas que
permitam ao computador aprender a partir do
reconhecimento de padrões.
APRENDIZAGEM DE MÁQUINA
31. 1. Deep Neural Networks
2. Bayes Classifier Algorithm
3. K Means Clustering Algorithm
4. Support Vector Machine Algorithm
5. Linear Regression
6. Logistic Regression
7. Artificial Neural Networks
8. Random Forests
9. Decision Trees
10. Nearest Neighbours
Alguns dos principais modelos de ML
33. Vida
Como a IA irá afetar nossa realidade?
Negócio
Como a IA irá mudar nossos negócios?
Sociedade
Quais impactos a IA irá causar
em nossa força de trabalho?
35. ANI - Artificial Narrow Intelligence
- Especializada em uma única área, resolvendo problemas específicos
AGI - Artificial General Intelligence
- Especializada em diversas áreas, geralmente atual como assistentes
pessoais e sistemas de apoio ao usuário
7 Habilidades:
1. Razão 2. Plano 3. Resolver problemas 4. Pensar de forma abstrata 5.
Compreender idéias complexas 6. Aprender rapidamente 7. Aprender
com a experiência
ASI - Artificial Super Intelligence
- Mais inteligente do que os seres humanos em todos os sentidos
3 tipos de Inteligência Artificial
44. 97,35%
Our method reaches an
accuracy of 97.35% on
the Labeled Faces in the
Wild (LFW) dataset,
reducing the error of
the current state of the
art by more than 27%,
closely approaching
human-level
performance.
DeepFace
https://research.fb.com/publications/deepface-closing-the-gap-to-human-level-performance-in-face-
verification/
55. BIG DATA STORYTELLING
➤ É uma forma de construir histórias com base em dados
➤ Contar histórias é, desde sempre, uma forma excelente de
transmitir experiências, sensações e pensamentos.
➤ Compreender ações e comportamentos para traçar estratégias
que possam persuadir e instigar mudanças em um público-
alvo
➤ Ponto chave: Visualização adequada da informação
➤ Criar histórias envolventes e apresentações visualmente
interessantes é o caminho para tornar os números algo mais
“concreto”
56. BIG DATA STORYTELLING
➤ Grande parte dessas oportunidades é perdida por conta da
falta de contextualização dos dados coletados
➤ Não basta coletar e armazenar dados para poder desenvolver
narrativas que contem a história de uma empresa ou produto.
É preciso igualmente contextualizar esses dados para que o
conteúdo se torne relevante
➤ Para obter sucesso utilizando Big Data Storytelling, analistas
com expertise precisam estar alocados no processo de
desenvolvimento
63. COMBATE À CORRUPÇÃO
Um grupo de jornalistas, cientistas de
dados, estatísticos se reuniu para
combater a corrupção através da análise
dos dados públicos sobre gastos dos
parlamentares, entregando relatórios
quinzenais para a realização de
denúncias junto aos órgão competentes
para a restituição dos valores.
https://github.com/datasciencebr/
serenata-de-amor
Irio Musskopf
Data Science Brigadehttps://goo.gl/RtpO7N
64. ROBÔS E PLANEJAMENTO
A Rosie (https://github.com/datasciencebr/
rosie) digere os dados, aplica modelos
matemáticos. E aprende com os exemplos.
Hoje a Rosie está aplicando regras dos limites de
uso da CEAP. Em um dia foram identificados 157
notas que extrapolam os limites legais.
O Jarbas ( https://github.com/datasciencebr/
jarbas) recolhe os dados e apresentará as notas
da CEAP com um índice de suspeita de
corrupção e seus motivos.
Para as ferramentas mais comuns a várias analises,
foi criado a “caixa de ferramentas comuns” —
https://github.com/datasciencebr/serenata-
toolbox que permite o reaproveitamento de código
entre diversos pesquisadores.
https://goo.gl/RtpO7N
70. COMO APRENDER DATA SCIENCE DE GRAÇA NAS MELHORES UNIVERSIDADES DO MUNDO
Open Source Society
Álgebra Linear
Cálculo de Variáveis Únicas
Cálculo de Variáveis Múltiplas
Python
Probabilidade e Estatística em R
Introdução a Data Science
Machine Learning
https://goo.gl/PD2AQ8