TDC 2015 - Conceitos e Práticas no Desenvolvimento de Sistemas Preditivos

Wagner Luiz Cambruzzi
Wagner Luiz CambruzziGerente de Projetos | Big Data | Mineração de Dados Educacionais na GVDASA um GVDASA
Globalcode – Open4education
Trilha BigData
Conceitos e Práticas no
Desenvolvimento de Sistemas
Preditivos
Rodrigo de Moraes e Wagner Luiz Cambruzzi
Mestres em Computação Aplicada
Globalcode – Open4education
Conceitos
Sistemas Preditivos
Globalcode – Open4education
Sistemas Preditivos
O que é:
Um sistema preditivo é um sistema capaz de analisar
dados e definir um modelo matemático da relação
existente entre os dados de fatos prévios a
determinados acontecimentos.
Como:
Através da aplicação de técnicas de Mineração de
Dados e de Aprendizado de Máquina.
Globalcode – Open4education
Mineração de Dados
Processo de Descoberta do Conhecimento
Processo VS. Etapa
Objetivo: Extração de conhecimento não trivial através
da análise e processamento de dados referentes a fatos
ocorridos no passado
Globalcode – Open4education
Mineração de Dados
Tipos de aprendizado de máquina
Supervisionado
Não supervisionado
Globalcode – Open4education
Mineração de Dados
Tipos de aprendizado de máquina
Supervisionado
Aprendizado sobre dados históricos cujo o resultado de
interesse é conhecido
Não supervisionado
Identificação de padrões semelhantes existentes nos
dados, sem informação prévia de qualquer relação entre
eles
Globalcode – Open4education
Mineração de Dados
Principais objetivos de técnicas de Mineração de
Dados
Regressão / Estimação
Globalcode – Open4education
Mineração de Dados
Principais objetivos de técnicas de Mineração de
Dados
Regressão / Estimação
Objetivo: Estimar o valor de alguma variável baseado na
observação de outras variáveis
Exemplo: Estimar o valor de mercado de uma casa baseado em
sua metragem, número de quartos, número de banheiros e etc...
Globalcode – Open4education
Mineração de Dados
Principais objetivos de técnicas de Mineração de
Dados
Regressão / Estimação
Agrupamento / Clustering
Globalcode – Open4education
Mineração de Dados
Principais objetivos de técnicas de Mineração de
Dados
Regressão / Estimação
Agrupamento / Clustering
Objetivo: Encontrar agrupamentos de amostras de dados com
base na semelhança dos valores de variáveis
Exemplo: Identificação de diferentes perfis de consumidores,
Categorias de documentos textuais...
Globalcode – Open4education
Mineração de Dados
Principais objetivos de técnicas de Mineração de
Dados
Regressão / Estimação
Agrupamento / Clustering
Regras de Associação
Globalcode – Open4education
Mineração de Dados
Principais objetivos de técnicas de Mineração de
Dados
Regressão / Estimação
Agrupamento / Clustering
Regras de Associação
Objetivo: Identificação de concorrência de valores de variáveis
Exemplo: Correlação entre itens em compras, identificação de
padrões de escrita...
Globalcode – Open4education
Mineração de Dados
Principais objetivos de técnicas de Mineração de
Dados
Regressão / Estimação
Agrupamento / Clustering
Regras de Associação
Detecção de anomalias
Globalcode – Open4education
Mineração de Dados
Principais objetivos de técnicas de Mineração de
Dados
Regressão / Estimação
Agrupamento / Clustering
Regras de Associação
Detecção de anomalias
Objetivo: Identificação de situações/comportamentos fora do
padrão
Exemplo: Fraudes em movimentações bancárias / utilização de
cartões de créditos
Globalcode – Open4education
Mineração de Dados
Principais objetivos de técnicas de Mineração de
Dados
Regressão / Estimação
Agrupamento / Clustering
Regras de Associação
Detecção de anomalias
Classificação/Predição
Globalcode – Open4education
Mineração de Dados
Principais objetivos de técnicas de Mineração de
Dados
Regressão / Estimação
Agrupamento / Clustering
Regras de Associação
Detecção de anomalias
Classificação/Predição
Objetivo: Identificação de padrões nos dados capazes de
distinguir diferentes grupos de amostras
Exemplo: Classificação de documentos, Classificação de
polaridade de sentimentos, sucesso ou insucesso acadêmico
Globalcode – Open4education
Classificadores
Naïve Bayes
Fonte: https://computersciencesource.wordpress.com/2010/01/28/year-2-machine-learning-naive-bayes-classifier/
Globalcode – Open4education
Classificadores
Decision Trees (Árvores de Decisão)
Globalcode – Open4education
Classificadores
Decision Trees
Fonte: http://web.tecnico.ulisboa.pt/ana.freitas/bioinformatics.ath.cx/bioinformatics.ath.cx/indexf23d.html?id=199
Globalcode – Open4education
Support Vector Machines (SVM)
Classificadores
Globalcode – Open4education
Support Vector Machines (SVM)
Classificadores
Fonte: http://www.eric-kim.net/eric-kim-net/posts/1/kernel_trick.html
Globalcode – Open4education
Support Vector Machines (SVM)
Fonte: https://www.youtube.com/watch?v=3liCbRZPrZA
Classificadores
Globalcode – Open4education
Support Vector Machines (SVM)
Classificadores
Fonte: http://www.eric-kim.net/eric-kim-net/posts/1/kernel_trick.html
Globalcode – Open4education
Classificadores
Artificial Neural Networks (ANNs)
Globalcode – Open4education
Classificadores
Artificial Neural Networks (ANNs)
Globalcode – Open4education
Séries temporais
Dados que variam “continuamente” no tempo e
que cada um dos valores apresenta certa
dependência em relação aos valores do passado
Exemplos:
Mercado Financeiro
Consumo de energia elétrica
Temperatura
Umidade
Globalcode – Open4education
Séries temporais
Globalcode – Open4education
Os problemas dos dados
Formato do dado / Armazenamento / Integridade
Compatibilidade de histórico
Alterações e migrações de sistemas
Metodologia de definição de variáveis
Existências de poucos dados (amostras) sobre o
problema
Existência de dados supervisionados
Critérios de definição de classes
Desbalanceamento entre classes
Globalcode – Open4education
Estudo de caso de um
sistema preditivo
Globalcode – Open4education
Contexto
Globalcode – Open4education
Perfil da Empresa
• 28 anos de atuação;
• Especialista em Sistema de Gestão Educacional;
• Atuação exclusiva no segmento educacional;
• 700+ clientes no Brasil;
• 130+ colaboradores.
Globalcode – Open4education
Como nasceu o projeto?
• Unidade de Novos Negócios;
• Problema da evasão em IES;
• Projeto RHAE do CNPQ;
• Grupo de Pesquisa e Mestrados;
• Validação da Ideia;
• Produto.
Globalcode – Open4education
O que é o GVwise?
Uma solução que atua na gestão da
retenção de alunos.
Globalcode – Open4education
Dados?
Eventos
Professores e
Tutores
AdministrativoCoordenações
2. Instituição de Ensino
Ambiente Virtual
de Aprendizagem
3. Dados
Atendimento
1. Estudantes
Globalcode – Open4education
1 - Mapeamento de
indicadores
2 - Geração e validação de
padrões
3 - Predição e emissão de
alertas
4 - Avaliação e realização
de ações
Como funciona?
Globalcode – Open4education
1 - Mapeamento de
indicadores
2 - Geração e validação de
padrões
3 - Predição e emissão de
alertas
4 - Avaliação e realização
de ações
1 – Mapeamento de indicadores
AVEA, ERP, CRM, ...
Indicadores
Exploração dos dados
Como funciona?
Globalcode – Open4education
1 - Mapeamento de
indicadores
2 - Geração e validação de
padrões
3 - Predição e emissão de
alertas
4 - Avaliação e realização
de ações
Como funciona?
Globalcode – Open4education
1 - Mapeamento de
indicadores
2 - Geração e validação de
padrões
3 - Predição e emissão de
alertas
4 - Avaliação e realização
de ações
Como funciona?
Globalcode – Open4education
1 - Mapeamento de
indicadores
2 - Geração e validação de
padrões
3 - Predição e emissão de
alertas
4 - Avaliação e realização
de ações
2 - Geração e validação de padrões
Definição de perfis
Indicadores de estudantes
(histórico)
Aprovados
Reprovados
Evadidos
Identificação dos grupos deinteresse
Mineração dedados e
identificação depadrões
Como funciona?
Globalcode – Open4education
1 - Mapeamento de
indicadores
2 - Geração e validação de
padrões
3 - Predição e emissão de
alertas
4 - Avaliação e realização
de ações
Como funciona?
Globalcode – Open4education
1 - Mapeamento de
indicadores
2 - Geração e validação de
padrões
3 - Predição e emissão de
alertas
4 - Avaliação e realização
de ações
Como funciona?
Globalcode – Open4education
1 - Mapeamento de
indicadores
2 - Geração e validação de
padrões
3 - Predição e emissão de
alertas
4 - Avaliação e realização
de ações
3 - Predição e emissão de alertas
Módulo de
encaminhamentos
Estudantes classificados conforme o
risco
Classificação ou prediçãoIndicadores de estudantes
(atuais)
Central de Atendimento
Ações automáticas
Equipe de Retenção
Como funciona?
Globalcode – Open4education
1 - Mapeamento de
indicadores
2 - Geração e validação de
padrões
3 - Predição e emissão de
alertas
4 - Avaliação e realização
de ações
Como funciona?
Globalcode – Open4education
1 - Mapeamento de
indicadores
2 - Geração e validação de
padrões
3 - Predição e emissão de
alertas
4 - Avaliação e realização
de ações
Como funciona?
Globalcode – Open4education
1 - Mapeamento de
indicadores
2 - Geração e validação de
padrões
3 - Predição e emissão de
alertas
4 - Avaliação e realização
de ações
4 - Avaliação e realização de ações
Analise dos estudantes em
risco Realização deações
Aumento da Permanência
Gerência do Processo
Como funciona?
Globalcode – Open4education
1 - Mapeamento de
indicadores
2 - Geração e validação de
padrões
3 - Predição e emissão de
alertas
4 - Avaliação e realização
de ações
Como funciona?
Globalcode – Open4education
1 - Mapeamento de
indicadores
2 - Geração e validação de
padrões
3 - Predição e emissão de
alertas
4 - Avaliação e realização
de ações
Como funciona?
Globalcode – Open4education
1 - Mapeamento de
indicadores
2 - Geração e validação de
padrões
3 - Predição e emissão de
alertas
4 - Avaliação e realização
de ações
Como funciona?
Globalcode – Open4education
Como entregamos?
 Interface de acompanhamento de uma turma
Globalcode – Open4education
Como entregamos?
 Interface de acompanhamento de uma turma
Globalcode – Open4education
 Interface de indicadores de um estudante
Como entregamos?
Globalcode – Open4education
 Interface de acompanhamento gráfico de indicadores do estudante
Como entregamos?
Globalcode – Open4education
 Cadastro de ações
Como entregamos?
Globalcode – Open4education
 Histórico de ações
Como entregamos?
Globalcode – Open4education
Resultados de Predição
0,00%
20,00%
40,00%
60,00%
80,00%
100,00%
Módulo 2 Módulo 3 Módulo 4 Módulo 5 Módulo 6 Módulo 7
Geral
Evadidos
Não Evadidos
Globalcode – Open4education
 Aprovados: melhoria de 18%
 Evadidos: melhoria de 25%
Resultados de Retenção
Globalcode – Open4education
Obrigado!
Rodrigo de Moraes – rmoraes@gvwise.com.br
Wagner Cambruzzi – wcambruzzi@gvwise.com.br
1 von 57

Recomendados

TDC 2015 Big Data - Modelos Preditivos von
TDC 2015 Big Data - Modelos PreditivosTDC 2015 Big Data - Modelos Preditivos
TDC 2015 Big Data - Modelos PreditivosRodrigo Moraes
605 views57 Folien
FIC 2015 - BIG DATA - Os desafios do GVwise ao entregar predição e promover p... von
FIC 2015 - BIG DATA - Os desafios do GVwise ao entregar predição e promover p...FIC 2015 - BIG DATA - Os desafios do GVwise ao entregar predição e promover p...
FIC 2015 - BIG DATA - Os desafios do GVwise ao entregar predição e promover p...Wagner Luiz Cambruzzi
339 views50 Folien
Home page conventions von
Home page conventionsHome page conventions
Home page conventionsGraceFowkesASMedia
120 views8 Folien
Syslöjd rm von
Syslöjd rmSyslöjd rm
Syslöjd rmCecilia Holgersson
134 views9 Folien
Experiencia en el colegio von
Experiencia en el colegioExperiencia en el colegio
Experiencia en el colegiosantiagocb
73 views3 Folien
Romani 5 von
Romani 5Romani 5
Romani 5Tomislavladan
34 views1 Folie

Más contenido relacionado

Destacado

Кадровые стратегии в условиях кризиса von
Кадровые стратегии в условиях кризисаКадровые стратегии в условиях кризиса
Кадровые стратегии в условиях кризисаAnton Chaplygin
323 views18 Folien
21 kelebihan WordPress wajib diketahui untuk blog anda von
21 kelebihan WordPress wajib diketahui untuk blog anda21 kelebihan WordPress wajib diketahui untuk blog anda
21 kelebihan WordPress wajib diketahui untuk blog andaMuhammad Iqbal Putra
197 views22 Folien
Informatica todo grupo 7 von
Informatica todo grupo 7Informatica todo grupo 7
Informatica todo grupo 7aimeleon6
152 views22 Folien
Circuito electrico von
Circuito electricoCircuito electrico
Circuito electricoGabriel Sotov
5.9K views15 Folien
Fiche de données de sécurité France Liquide de Frein Valeo LHM+ référence 402412 von
Fiche de données de sécurité France Liquide de Frein Valeo LHM+ référence 402412Fiche de données de sécurité France Liquide de Frein Valeo LHM+ référence 402412
Fiche de données de sécurité France Liquide de Frein Valeo LHM+ référence 402412Hugo Vallet
1.3K views10 Folien
Tribo-Systems Introduction von
Tribo-Systems IntroductionTribo-Systems Introduction
Tribo-Systems IntroductionXavier Borras
780 views17 Folien

Destacado(17)

Кадровые стратегии в условиях кризиса von Anton Chaplygin
Кадровые стратегии в условиях кризисаКадровые стратегии в условиях кризиса
Кадровые стратегии в условиях кризиса
Anton Chaplygin323 views
21 kelebihan WordPress wajib diketahui untuk blog anda von Muhammad Iqbal Putra
21 kelebihan WordPress wajib diketahui untuk blog anda21 kelebihan WordPress wajib diketahui untuk blog anda
21 kelebihan WordPress wajib diketahui untuk blog anda
Informatica todo grupo 7 von aimeleon6
Informatica todo grupo 7Informatica todo grupo 7
Informatica todo grupo 7
aimeleon6152 views
Fiche de données de sécurité France Liquide de Frein Valeo LHM+ référence 402412 von Hugo Vallet
Fiche de données de sécurité France Liquide de Frein Valeo LHM+ référence 402412Fiche de données de sécurité France Liquide de Frein Valeo LHM+ référence 402412
Fiche de données de sécurité France Liquide de Frein Valeo LHM+ référence 402412
Hugo Vallet1.3K views
Tribo-Systems Introduction von Xavier Borras
Tribo-Systems IntroductionTribo-Systems Introduction
Tribo-Systems Introduction
Xavier Borras780 views
The 21ST Century Special Education Teacher von MaryAlyssaBotin
The 21ST Century Special Education TeacherThe 21ST Century Special Education Teacher
The 21ST Century Special Education Teacher
MaryAlyssaBotin2.9K views
Socratic Philosopher; Plato von Firrini Saldo
Socratic Philosopher; PlatoSocratic Philosopher; Plato
Socratic Philosopher; Plato
Firrini Saldo1.1K views
Perda Kabupaten Nunukan tentang Pedagang Kaki Lima von Arifuddin Ali
Perda Kabupaten Nunukan tentang Pedagang Kaki LimaPerda Kabupaten Nunukan tentang Pedagang Kaki Lima
Perda Kabupaten Nunukan tentang Pedagang Kaki Lima
Arifuddin Ali1.5K views
Magnum Wiper blade catalogue 2016-2017 953271 von Hugo Vallet
Magnum Wiper blade catalogue 2016-2017 953271Magnum Wiper blade catalogue 2016-2017 953271
Magnum Wiper blade catalogue 2016-2017 953271
Hugo Vallet75.7K views
23 февраля 12 группа von mgw-rassilki
23 февраля 12 группа23 февраля 12 группа
23 февраля 12 группа
mgw-rassilki172 views

Similar a TDC 2015 - Conceitos e Práticas no Desenvolvimento de Sistemas Preditivos

Tdc2015 bigdata-mpias-final-pdf von
Tdc2015 bigdata-mpias-final-pdfTdc2015 bigdata-mpias-final-pdf
Tdc2015 bigdata-mpias-final-pdfMinistry of Data
845 views32 Folien
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 von
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Marcos Vinicius Fidelis
1.9K views44 Folien
Learning Analytics: utilizando Data Science para melhorar a educação von
Learning Analytics: utilizando Data Science para melhorar a educaçãoLearning Analytics: utilizando Data Science para melhorar a educação
Learning Analytics: utilizando Data Science para melhorar a educaçãoMatheus Braun Magrin
758 views35 Folien
Construindo Chatbots com Design Thinking e framework i*: um método estruturado von
Construindo Chatbots com Design Thinking e framework i*: um método estruturadoConstruindo Chatbots com Design Thinking e framework i*: um método estruturado
Construindo Chatbots com Design Thinking e framework i*: um método estruturadoMeire Helen Batista Dias
35 views29 Folien
TDC2018SP | Trilha ChatBots - Construindo Chatbots com Design Thinking e fram... von
TDC2018SP | Trilha ChatBots - Construindo Chatbots com Design Thinking e fram...TDC2018SP | Trilha ChatBots - Construindo Chatbots com Design Thinking e fram...
TDC2018SP | Trilha ChatBots - Construindo Chatbots com Design Thinking e fram...tdc-globalcode
230 views29 Folien
Monitoramento Online e Coleta de Dados para Pesquisa Acadêmica von
Monitoramento Online e Coleta de Dados para Pesquisa AcadêmicaMonitoramento Online e Coleta de Dados para Pesquisa Acadêmica
Monitoramento Online e Coleta de Dados para Pesquisa AcadêmicaPaperCliQ Comunicação
3.8K views86 Folien

Similar a TDC 2015 - Conceitos e Práticas no Desenvolvimento de Sistemas Preditivos(20)

Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 von Marcos Vinicius Fidelis
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Learning Analytics: utilizando Data Science para melhorar a educação von Matheus Braun Magrin
Learning Analytics: utilizando Data Science para melhorar a educaçãoLearning Analytics: utilizando Data Science para melhorar a educação
Learning Analytics: utilizando Data Science para melhorar a educação
Construindo Chatbots com Design Thinking e framework i*: um método estruturado von Meire Helen Batista Dias
Construindo Chatbots com Design Thinking e framework i*: um método estruturadoConstruindo Chatbots com Design Thinking e framework i*: um método estruturado
Construindo Chatbots com Design Thinking e framework i*: um método estruturado
TDC2018SP | Trilha ChatBots - Construindo Chatbots com Design Thinking e fram... von tdc-globalcode
TDC2018SP | Trilha ChatBots - Construindo Chatbots com Design Thinking e fram...TDC2018SP | Trilha ChatBots - Construindo Chatbots com Design Thinking e fram...
TDC2018SP | Trilha ChatBots - Construindo Chatbots com Design Thinking e fram...
tdc-globalcode230 views
Monitoramento Online e Coleta de Dados para Pesquisa Acadêmica von PaperCliQ Comunicação
Monitoramento Online e Coleta de Dados para Pesquisa AcadêmicaMonitoramento Online e Coleta de Dados para Pesquisa Acadêmica
Monitoramento Online e Coleta de Dados para Pesquisa Acadêmica
TDC2018FLN | Trilha Gestao de Produtos - Gestão de produtos data-driven. Como... von tdc-globalcode
TDC2018FLN | Trilha Gestao de Produtos - Gestão de produtos data-driven. Como...TDC2018FLN | Trilha Gestao de Produtos - Gestão de produtos data-driven. Como...
TDC2018FLN | Trilha Gestao de Produtos - Gestão de produtos data-driven. Como...
tdc-globalcode307 views
TDC2016SP - Colocando modelos de Machine Learning em produção. von tdc-globalcode
TDC2016SP - Colocando modelos de Machine Learning em produção.TDC2016SP - Colocando modelos de Machine Learning em produção.
TDC2016SP - Colocando modelos de Machine Learning em produção.
tdc-globalcode2K views
Análise de aderência de práticas ágeis na cultura de startups de software: o ... von Marvin Ferreira
Análise de aderência de práticas ágeis na cultura de startups de software: o ...Análise de aderência de práticas ágeis na cultura de startups de software: o ...
Análise de aderência de práticas ágeis na cultura de startups de software: o ...
Marvin Ferreira86 views
TDC2018SP | Trilha Analise de Negocios - Web analytics para Negocios von tdc-globalcode
TDC2018SP | Trilha Analise de Negocios - Web analytics para NegociosTDC2018SP | Trilha Analise de Negocios - Web analytics para Negocios
TDC2018SP | Trilha Analise de Negocios - Web analytics para Negocios
tdc-globalcode125 views
Usando mind maps no planejamento de testes - TDC 2015 von Gabriel Oliveira
Usando mind maps no planejamento de testes - TDC 2015Usando mind maps no planejamento de testes - TDC 2015
Usando mind maps no planejamento de testes - TDC 2015
Gabriel Oliveira1.9K views
TDC2018SP | Trilha BigData - Big Data Governance - Como estabelecer uma Gover... von tdc-globalcode
TDC2018SP | Trilha BigData - Big Data Governance - Como estabelecer uma Gover...TDC2018SP | Trilha BigData - Big Data Governance - Como estabelecer uma Gover...
TDC2018SP | Trilha BigData - Big Data Governance - Como estabelecer uma Gover...
tdc-globalcode217 views
LGPD | FASE-2: ORGANIZAÇÃO | JORNADA DE ADEQUAÇÃO | SGPD - SISTEMA DE GESTÃO... von Wellington Monaco
LGPD | FASE-2: ORGANIZAÇÃO | JORNADA DE ADEQUAÇÃO |  SGPD - SISTEMA DE GESTÃO...LGPD | FASE-2: ORGANIZAÇÃO | JORNADA DE ADEQUAÇÃO |  SGPD - SISTEMA DE GESTÃO...
LGPD | FASE-2: ORGANIZAÇÃO | JORNADA DE ADEQUAÇÃO | SGPD - SISTEMA DE GESTÃO...
Wellington Monaco355 views
Aula 04 Sistema de Informação - Processo e Requisitos de Sistemas von Daniel Brandão
Aula 04 Sistema de Informação - Processo e Requisitos de SistemasAula 04 Sistema de Informação - Processo e Requisitos de Sistemas
Aula 04 Sistema de Informação - Processo e Requisitos de Sistemas
Daniel Brandão5.4K views
TDC2017 | São Paulo - Trilha Análise de Negócios How we figured out we had a ... von tdc-globalcode
TDC2017 | São Paulo - Trilha Análise de Negócios How we figured out we had a ...TDC2017 | São Paulo - Trilha Análise de Negócios How we figured out we had a ...
TDC2017 | São Paulo - Trilha Análise de Negócios How we figured out we had a ...
tdc-globalcode192 views

TDC 2015 - Conceitos e Práticas no Desenvolvimento de Sistemas Preditivos

  • 1. Globalcode – Open4education Trilha BigData Conceitos e Práticas no Desenvolvimento de Sistemas Preditivos Rodrigo de Moraes e Wagner Luiz Cambruzzi Mestres em Computação Aplicada
  • 3. Globalcode – Open4education Sistemas Preditivos O que é: Um sistema preditivo é um sistema capaz de analisar dados e definir um modelo matemático da relação existente entre os dados de fatos prévios a determinados acontecimentos. Como: Através da aplicação de técnicas de Mineração de Dados e de Aprendizado de Máquina.
  • 4. Globalcode – Open4education Mineração de Dados Processo de Descoberta do Conhecimento Processo VS. Etapa Objetivo: Extração de conhecimento não trivial através da análise e processamento de dados referentes a fatos ocorridos no passado
  • 5. Globalcode – Open4education Mineração de Dados Tipos de aprendizado de máquina Supervisionado Não supervisionado
  • 6. Globalcode – Open4education Mineração de Dados Tipos de aprendizado de máquina Supervisionado Aprendizado sobre dados históricos cujo o resultado de interesse é conhecido Não supervisionado Identificação de padrões semelhantes existentes nos dados, sem informação prévia de qualquer relação entre eles
  • 7. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação
  • 8. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Objetivo: Estimar o valor de alguma variável baseado na observação de outras variáveis Exemplo: Estimar o valor de mercado de uma casa baseado em sua metragem, número de quartos, número de banheiros e etc...
  • 9. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Agrupamento / Clustering
  • 10. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Agrupamento / Clustering Objetivo: Encontrar agrupamentos de amostras de dados com base na semelhança dos valores de variáveis Exemplo: Identificação de diferentes perfis de consumidores, Categorias de documentos textuais...
  • 11. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Agrupamento / Clustering Regras de Associação
  • 12. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Agrupamento / Clustering Regras de Associação Objetivo: Identificação de concorrência de valores de variáveis Exemplo: Correlação entre itens em compras, identificação de padrões de escrita...
  • 13. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Agrupamento / Clustering Regras de Associação Detecção de anomalias
  • 14. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Agrupamento / Clustering Regras de Associação Detecção de anomalias Objetivo: Identificação de situações/comportamentos fora do padrão Exemplo: Fraudes em movimentações bancárias / utilização de cartões de créditos
  • 15. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Agrupamento / Clustering Regras de Associação Detecção de anomalias Classificação/Predição
  • 16. Globalcode – Open4education Mineração de Dados Principais objetivos de técnicas de Mineração de Dados Regressão / Estimação Agrupamento / Clustering Regras de Associação Detecção de anomalias Classificação/Predição Objetivo: Identificação de padrões nos dados capazes de distinguir diferentes grupos de amostras Exemplo: Classificação de documentos, Classificação de polaridade de sentimentos, sucesso ou insucesso acadêmico
  • 17. Globalcode – Open4education Classificadores Naïve Bayes Fonte: https://computersciencesource.wordpress.com/2010/01/28/year-2-machine-learning-naive-bayes-classifier/
  • 19. Globalcode – Open4education Classificadores Decision Trees Fonte: http://web.tecnico.ulisboa.pt/ana.freitas/bioinformatics.ath.cx/bioinformatics.ath.cx/indexf23d.html?id=199
  • 20. Globalcode – Open4education Support Vector Machines (SVM) Classificadores
  • 21. Globalcode – Open4education Support Vector Machines (SVM) Classificadores Fonte: http://www.eric-kim.net/eric-kim-net/posts/1/kernel_trick.html
  • 22. Globalcode – Open4education Support Vector Machines (SVM) Fonte: https://www.youtube.com/watch?v=3liCbRZPrZA Classificadores
  • 23. Globalcode – Open4education Support Vector Machines (SVM) Classificadores Fonte: http://www.eric-kim.net/eric-kim-net/posts/1/kernel_trick.html
  • 26. Globalcode – Open4education Séries temporais Dados que variam “continuamente” no tempo e que cada um dos valores apresenta certa dependência em relação aos valores do passado Exemplos: Mercado Financeiro Consumo de energia elétrica Temperatura Umidade
  • 28. Globalcode – Open4education Os problemas dos dados Formato do dado / Armazenamento / Integridade Compatibilidade de histórico Alterações e migrações de sistemas Metodologia de definição de variáveis Existências de poucos dados (amostras) sobre o problema Existência de dados supervisionados Critérios de definição de classes Desbalanceamento entre classes
  • 29. Globalcode – Open4education Estudo de caso de um sistema preditivo
  • 31. Globalcode – Open4education Perfil da Empresa • 28 anos de atuação; • Especialista em Sistema de Gestão Educacional; • Atuação exclusiva no segmento educacional; • 700+ clientes no Brasil; • 130+ colaboradores.
  • 32. Globalcode – Open4education Como nasceu o projeto? • Unidade de Novos Negócios; • Problema da evasão em IES; • Projeto RHAE do CNPQ; • Grupo de Pesquisa e Mestrados; • Validação da Ideia; • Produto.
  • 33. Globalcode – Open4education O que é o GVwise? Uma solução que atua na gestão da retenção de alunos.
  • 34. Globalcode – Open4education Dados? Eventos Professores e Tutores AdministrativoCoordenações 2. Instituição de Ensino Ambiente Virtual de Aprendizagem 3. Dados Atendimento 1. Estudantes
  • 35. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  • 36. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações 1 – Mapeamento de indicadores AVEA, ERP, CRM, ... Indicadores Exploração dos dados Como funciona?
  • 37. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  • 38. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  • 39. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações 2 - Geração e validação de padrões Definição de perfis Indicadores de estudantes (histórico) Aprovados Reprovados Evadidos Identificação dos grupos deinteresse Mineração dedados e identificação depadrões Como funciona?
  • 40. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  • 41. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  • 42. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações 3 - Predição e emissão de alertas Módulo de encaminhamentos Estudantes classificados conforme o risco Classificação ou prediçãoIndicadores de estudantes (atuais) Central de Atendimento Ações automáticas Equipe de Retenção Como funciona?
  • 43. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  • 44. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  • 45. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações 4 - Avaliação e realização de ações Analise dos estudantes em risco Realização deações Aumento da Permanência Gerência do Processo Como funciona?
  • 46. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  • 47. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  • 48. Globalcode – Open4education 1 - Mapeamento de indicadores 2 - Geração e validação de padrões 3 - Predição e emissão de alertas 4 - Avaliação e realização de ações Como funciona?
  • 49. Globalcode – Open4education Como entregamos?  Interface de acompanhamento de uma turma
  • 50. Globalcode – Open4education Como entregamos?  Interface de acompanhamento de uma turma
  • 51. Globalcode – Open4education  Interface de indicadores de um estudante Como entregamos?
  • 52. Globalcode – Open4education  Interface de acompanhamento gráfico de indicadores do estudante Como entregamos?
  • 53. Globalcode – Open4education  Cadastro de ações Como entregamos?
  • 54. Globalcode – Open4education  Histórico de ações Como entregamos?
  • 55. Globalcode – Open4education Resultados de Predição 0,00% 20,00% 40,00% 60,00% 80,00% 100,00% Módulo 2 Módulo 3 Módulo 4 Módulo 5 Módulo 6 Módulo 7 Geral Evadidos Não Evadidos
  • 56. Globalcode – Open4education  Aprovados: melhoria de 18%  Evadidos: melhoria de 25% Resultados de Retenção
  • 57. Globalcode – Open4education Obrigado! Rodrigo de Moraes – rmoraes@gvwise.com.br Wagner Cambruzzi – wcambruzzi@gvwise.com.br