Uso de mineração nos dados do moodle para predição e combate à evasão
1. Uso de mineração nos dados do
Moodle para predição e
combate à evasão
Rodrigo de Moraes
Analista de negócios e cientista de dados - GVDASA
Mestre em Computação Aplicada - UNISINOS
2. Uso de mineração nos dados do Moodle
para predição e combate à evasão
GVwise Student
Usuário: moodlemoot2015
Senha: 123456
3. GVDASA: Perfil da empresa
• Localizada no TECNOSINOS (São Leopoldo)
• 28 anos de atuação
• Especialista em Sistema de Gestão Educacional
• Atuação exclusiva no segmento educacional
• Aproximadamente 700 clientes no Brasil
• Mais de 130 colaboradores
5. Evasão
• ~40% dos alunos de IES públicas não completam o curso (Agência
Senado, 2014)
• ~30% dos alunos de IES privadas não completam o curso (Agência
Senado, 2014)
• Evasão de cursos totalmente EaD ~19% (CENSO ABED, 2013)
• Evasão de cursos semipresenciais ~15% (CENSO ABED, 2013)
• As perdas financeiras podem chegar a R$ 9 bilhões (NOGUEIRA, 2011)
6. Por que predizer a evasão?
• Possibilidade de realizar ações proativas e não apenas reativas
• Identificação individual de estudantes em risco
• Trabalho focado
• Ações personalizadas e, portanto, mais eficientes
Adaptado de Simpson, 2013
𝑅 = 𝐼𝑃𝑅 + 𝐴𝑃 + 𝐸𝐶𝐶 + 𝑆𝐸
R = Retenção
IPR = Identificação precoce de risco
AP = Ações proativas
ECC = Escolha Correta do Curso
SE = Suporte Externo (Família, colegas...)
7. Mineração de Dados
• Desde 1962 (Tukey, 1962)
• Processo de descoberta de conhecimento em base de dados (1996)
• Utilização de dados históricos para a descoberta de padrões
• Processo vs. técnicas
Processo de descoberta do conhecimento em base de dados, adaptado de Fayyad et al. 1996
8. Mineração de Dados Educacionais (MDE)
• Mineração de Dados + Dados Educacionais
• Desde 1995, “popularização” nos anos 2000
• Principais aplicações:
• Modelagem de comportamento de estudantes
• Realização de tarefas (associação)
• Otimização de ações (automatizadas ou recomendação)
• Associações com currículo, disciplinas e professores
10. MDE para Predição de Evasão (IES)
Rivergram, adaptado de Simpson, 2013
• Onde está a evasão???
Inscrições do
Processo
Seletivo
Realização do
Processo
Seletivo
Divulgação de
Resultados
RematrículasAulasMatrículas
11. Etapas para a Predição de Evasão
• Unificação de dados (ERP, AVA, Biblioteca, Governo, Acesso e etc.)
• Análise do cenário da IE
• Definição do nível de evasão que será trabalhado
• Identificação dos dados mais relevantes
• Modelagem dos dados
• Temporal
• Tipo
• Representação
12. Etapas para a Predição de Evasão
• Aplicação (treinamento) de técnicas de mineração de dados
• Validação e consolidação do modelo preditivo
• Classificação / Indicação
• Atualização do modelo
13. Dicas para a construção do modelo preditivo
• Analise os dados e gaste tempo com isso
• Defina qual é o objetivo do modelo e deixe isso claro a todos os envolvidos
• Analise separadamente os diversos contextos existentes dentro da IE
• Certifique-se que os dados históricos são suficientes para se alcançar um
grau de generalização satisfatório do modelo preditivo
• Esteja atento às mudanças que envolvem o registro de dados
• Versões das fontes de dados
• Ferramentas utilizadas na IE
• Desenvolva/utilize técnicas para qualificar os dados
19. O que fazer com a predição de evasão?
• Montar uma equipe de permanência
• Elaborar um plano de ações para cada situação de risco
• Disseminar a cultura de combate a evasão na IE
• Utilizar um ambiente/ferramenta focada na gestão da evasão
• Avaliar constantemente os resultados de reversão de evasão
• Monitorar o uso das ferramentas disponíveis
20.
21. GVwise: Integração de dados
Extração
Base de Dados
do Moodle
Base Staging
do Moodle
Transformação Base ODS
Consolidação
Data Warehouse
ETL do Moodle
23. GVwise: Processo de Mineração de Dados
• Para cada contexto há um processo de mineração diferente
• O pré-processamento dos dados é realizado dentro do processo de ETL
• Os mesmo passos são adotados para dados históricos e atuais
Seleção de
contexto
Transformação
Treinamento
Avaliação de
resultados
Consolidação do
modelo
Classificação de
dados atuais
25. Estudo de caso: cenário
• Cursos EaD de uma IES
• Histórico do Moodle desde 2010 (atualmente Moodle 2.5)
• LOGs históricos: ~ 89 milhões
• Média LOGs diários: ~ 225 mil
• Disciplinas bimestrais (9 semanas)
• Predição de evasão na disciplina
• Predição semanal a partir da 2ª semana
32. Estudo de caso: Mobile
• Projeto desde 2013
• Motivação: qualificação dos LOGs
• Registro de LOG semelhante ao Moodle WEB
• Gestão de conteúdos baixados (off-line)
• Agregação de recursos sem vínculo com o
Moodle
GVwise Student
Usuário: moodlemoot2015
Senha: 123456
33. Estudo de caso: Mobile
GVwise Student / Usuário: moodlemoot2015 / Senha: 123456
34. Estudo de caso: Mobile
GVwise Student / Usuário: moodlemoot2015 / Senha: 123456
36. Resultados: Reversão de Evasão
Aprovados: melhoria de até 18%
Reversão: melhoria de até 25%
37. Conclusões
• Modelos preditivos baseados em históricos de dados tendem a
ter melhores resultados
• A modelagem dos dados é a etapa mais importante do processo,
sendo responsável por mais de 70% do sucesso do modelo e
reversão
• Dependendo das técnicas utilizadas, o modelo pode ser sensível a
mudanças nos cursos e materiais
• Deve-se medir o custo-benefício da modelagem adotada
• O modelo preditivo sozinho não é nada, é preciso ação!
38. Referências
• AGÊNCIA SENADO. Despreparo de alunos leva a evasão nos cursos superiores, alerta Cristovam. Disponível em:
<http://www12.senado.leg.br/noticias/materias/2014/09/10/cristovam-buarque-evasao-no-ensino-superior>. Acesso em: 28 abr.
2015.
• ABED – ASSOCIAÇÃO BRASILEIRA DE EDUCAÇÃO A DISTANCIA. Censo EaD.br: relatório analítico da aprendizagem a distância no Brasil
2013. Disponível em: <http://www.abed.org.br/censoead2013/CENSO_EAD_2013_PORTUGUES.pdf>. Acesso em: 28 abr. 2015.
• EDUCATIONAL data mining. In: Wikipédia: a enciclopédia livre. Disponível em:
<http://en.wikipedia.org/w/index.php?title=Educational_data_mining&oldid=649550795> Acesso em: 28 abr. 2015.
• FAYYAD, U. M.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data mining to knowledge discovery: an overview. In: Advances in Knowledge
Discovery and Data Mining. [s.l: s.n.]. v. 17p. 1–34.
• GRELLER, W.; DRACHSLER, H. Translating Learning into Numbers: A Generic Framework for Learning Analytics. Educational Technology
& Society, p. 42–57, 2012.
• NOGUEIRA, F. País perde R$ 9 bilhões com evasão no ensino superior, diz pesquisador. Disponível em:
<http://g1.globo.com/educacao/noticia/2011/02/pais-perde-r-9-bilhoes-com-evasao-no-ensino-superior-diz-pesquisador.html>. Acesso
em: 28 abr. 2015.
• PEÑA-AYALA, A. Educational data mining: A survey and a data mining-based analysis of recent Works. Expert Systems with
Applications, 2014.
• PRESS, G. A Very Short History Of Data Science. Disponível em: <http://www.forbes.com/sites/gilpress/2013/05/28/a-very-short-
history-of-data-science>. Acesso em: 28 abr. 2015.
• ROMERO, C.; VENTURA, S. Educational data mining: A survey from 1995 to 2005. Expert Systems with Applications, v. 33, n. 1, p. 135–
146, jul. 2007.
• SIMPSON, O. Supporting students for success in online and distance education. [s.l.] Routledge, 2012.
42. Resumo:
4 - Avaliação e realização de ações
Analise dos estudantes em
risco Realização deações
Aumento da Permanência
Gerência do Processo
3 - Predição e emissão de alertas
Emissão de alertas
personalizados
Estudantes classificados conforme o
risco
Classificação ou prediçãoIndicadores de estudantes
(atuais)
2 - Geração e validação de padrões
Definição de perfis
Indicadores de estudantes
(histórico)
Aprovados
Reprovados
Evadidos
Identificação dos grupos deinteresse
Mineração dedados e
identificação depadrões
1 – Mapeamento de indicadores
AVEA, ERP, CRM, ...
Indicadores
Exploração dos dados