Diese Präsentation wurde erfolgreich gemeldet.
Die SlideShare-Präsentation wird heruntergeladen. ×

Mineração de Dados Educacionais - potencialidades e desafios

Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Nächste SlideShare
Técnicas de data mining
Técnicas de data mining
Wird geladen in …3
×

Hier ansehen

1 von 17 Anzeige
Anzeige

Weitere Verwandte Inhalte

Aktuellste (20)

Anzeige

Mineração de Dados Educacionais - potencialidades e desafios

  1. 1. Potencialidades e desafios Anatália Saraiva Martins Ramos Professora Titular da UFRN Programa de Pós-graduação em Administração
  2. 2. A Mineração de Dados (MD) é usada para transformar grandes volumes de dados em informações significativas para o planejamento, a gestão e a tomada de decisão nas mais diversas áreas de conhecimento.
  3. 3. Medicina •Ex: prever paciente com maior probabilidade de contrair uma doença específica, com base nos dados históricos dos pacientes Telecomunicações •Ex: identificar fraudes em ligações telefônicas, dentre um enorme número de ligações efetuadas pelos clientes Mercado financeiro •Ex: prever as ações que estarão em alta na bolsa de valores, em função do histórico de preços das ações e valores de índices financeiros Abordaremos, a seguir, aplicações de MD na área de Educação
  4. 4. Fonte: http://www.educationaldatamining.org/proceedings A base da MDE é composta de modelos, tarefas, métodos e algoritmos usados para explorar conjuntos de dados de larga escala de ambientes educacionais com objetivo de descobrir padrões descritivos e predições que forneçam informações sobre o contexto em que os alunos aprendem os quais ajudem a compreender e melhorar o ensino e a aprendizagem.
  5. 5.  Esse campo de conhecimento teve início em 2005 com o Workshop ‘Educational Data Mining’ em Pittsburg, como evento satélite da 20th National Conference on Artificial Intelligence (AAAI-05)  Outros workshops seguiram-se e uma Conferência anual exclusiva para MDE foi criada em 2008, em Montreal  Em 2009, foi criado um periódico específico: Journal of Educational Data Mining, mantido pela EDM Society  Há livros publicados, por ex: “Data mining in E- learning”e “Handbook of Educational Data Mining” MD E A MDE faz parte do campo da Analítica de Aprendizagem (Learning Analytics) como um dos seus métodos, ao lado da Aprendizagem de máquina e da Análise estatística.
  6. 6. Educação offline • Análises em dados de desempenho/comportamento do aluno, currículo etc Aprendizado eletrônico (e-learning) e Sistema de Gestão da Aprendizagem (LMS) • Análises de dados armazenados em ambientes virtuais de aprendizagem, como Moodle ou Blackboard, ou de MOOCs. Sistemas Tutores Inteligentes e Sistemas Hipermídias Adaptativos • Aplicados sobre dados de sistemas que se adaptam a cada estudante, aos cursos e aos modelos de usuário etc. [Romero, Ventura, 2010]
  7. 7. https://www.cmu.edu/datalab/getting-started/what-is-edm.html
  8. 8. Predição *Classificação *Regressão *Estimação de densidade Agrupamento (clustering) Outras tarefas: • Destilação de dados (para facilitar decisões humanas) • Descobertas com modelos Relações *Regras de associação *Correlações *Padrões sequenciais *Causas
  9. 9. INSTITUIÇÃO APRENDIZ IMEDIATO ADIADOHora de usar os dados Locus de controle e autoridade Ex: sistemas adaptativos; tutoria automática; intervenções de ensino síncrona Ex: sistemas de intervenção; sistema de alerta precoce de retenção; intervenções de ensino assíncrona mudanças de nível institucional Ex: feedback em testes online Ex: apresentação de dados individuais ou agregados para reflexão Powell, 2012
  10. 10.  Alunos  Auto-reflexão, comparações de coortes, aprendizagem automatizada etc  Professores  Retenção, progressão, satisfação/experiência dos alunos etc.  Desenvolvedores de curso  Design para o sucesso; avaliação, conteúdo, estratégias de ensino etc  Dirigentes  Retenção, progressão, eficiência, controle interno de indicadores do MEC, INEP, Capes etc  Pesquisadores  Pedagogia, modelos, teoria etc. A MDE não fornece respostas para os PORQUÊS, mas oferece pistas que podem ser validadas por análises qualitativas.
  11. 11.  Que alunos preferem qual sequência de assuntos para que eles possam aprender mais efetivamente?  Que ações do aluno indicam satisfação e engajamento com o curso EaD?  Quais são as melhores características de cursos online em termos de atingir uma aprendizagem mais efetiva?  Que ações dos alunos estão associadas com um melhor aprendizado e maior desempenho acadêmico?  Como os alunos aprendem?  Como desenvolver sistemas educacionais mais eficazes?  Que abordagem instrucional (ex. aprendizagem individual ou colaborativa) proporciona melhores benefícios educacionais ao aluno?  Qual a matéria de maior impacto?  Quem mais interage?  Qual perfil de quem mais colabora?  O que fazem quando estão logados no site?  O que foi mais útil / efetivo na aquisição de novas competências?
  12. 12.  Prever o desempenho e comportamento futuro da aprendizagem do aluno e propor modelos pedagógicos que melhor se alinhem com esse comportamento  Encontrar sequência de instruções ótimas e adaptadas para cada aluno  Melhorar a satisfação do aluno, diplomação, retenção e diminuir a evasão de curso e abandono de disciplina  Verificar se o aluno está desmotivado, confuso ou com problema e, assim, personalizar o ambiente e os métodos de ensino para oferecer melhores condições de aprendizagem.
  13. 13.  Integração com Dados Abertos  Personalização da Aprendizagem  Infraestrutura para Mineração de Dados Educacionais  Integrando MDE e Internet das Coisas (IoT)  Mineração de dados em jogos educacionais, MOOCs e Sistemas Tutores Inteligentes  Integrando MDE e Analítica de Aprendizagem (Learning Analytics)  Mineração de dados na aprendizagem social e colaborativa  Adaptação de técnicas analíticas de recuperação de informação, sistemas de recomendação, análise de redes sociais, mineração de opinião para o domínio educativo  Metodologias que aplicam uma técnica utilizada anteriormente para um novo domínio, ou que reavaliam um conjunto de dados existente com uma nova técnica.
  14. 14.  Complexidade dos comportamentos de aprendizagem  Coletar e integrar todos os dados obtidos de diversas plataformas de aprendizagem e de vários dispositivos  Definir as perguntas se deve fazer aos dados para obter as respostas úteis na mineração dos dados educacionais  Estabelecer a modelagem mais adequada  Desenvolver competências de interpretação e pensamento crítico  Convencer os stakeholders de que poderiam se beneficiar dos resultados obtidos através do uso de técnicas de MDE  Garantir e preservar a privacidade  Fazer análise preditiva com ética  Dispor de conjuntos de dados públicos de referência para MDE
  15. 15.  Baker, R.S. .d., Barnes, Beck, .E. Eds. Educational Data Mining. 1st International Conference on Educational Data Mining, Proceedings. Montreal, Quebec, Canada. June 20-21, 2008.  Beck, J, Proceedings of Association for the Advancement of Artificial Intelligence 2005 workshop on Educational Data Mining, 2005.  Conference Proceedings of International Conference on Educational Data Mining http://www.educationaldatamining.org/proceedings  Fayyad, U.; Piatetsky-Shapiro, G.; Smyth, P.. The KDD process for extracting useful knowledge from volumes of data. Communications of the ACM, v. 39, n. 11, p. 27-34, 1996.  Manhães, L. M. B., Cruz, S.M.S., Zimbrão, G., et. al. Identificação dos Fatores que Influenciam a Evasão em Cursos de Graduação Através de Sistemas Baseados em Mineração de Dados: Uma Abordagem Quantitativa. Anais do VIII Simpósio Brasileiro de Sistemas de Informação (SBSI 2012), pp. 468-479, 2012.  Peña-Ayala, A. Educational data mining: A survey and a data mining-based analysis of recent works. Expert systems with applications, v. 41, n. 4, p. 1432-1462, 2014.  Powell, S. Explaining learning analytics to colleagues https://stephenp.net/2012/04/17/explaining-learning-analytics-to- colleagues/  Rodrigues, R.L; Ramos, J.L.C.; Silva, J.C.S. A literatura brasileira sobre mineração de dados educacionais. 3o. Congresso Brasileiro de Informática na Educação (CBIE), 2014.  Romero, C.; Ventura, S. Data Mining in E-Learning, WIT Press, 2006.  Romero, C.; Ventura, S. Educational data mining: a review of the state of the art. IEEE Transactions on Systems, Man, and Cybernetics, Part C: Applications and Reviews, vol. 40, n. 6, p. 601-618, 2010.  Romero, C.; Ventura, S. Handbook of Educational Data Mining, CRC Press, 2010.  Planilha compartilhada de coleta de dados de artigos em EDM publicados no Brasil: http://bit.ly/mdeBrasil  http://www.educationaldatamining.org/proceedings  http://blog.originlearning.com/understanding-educational-data-mining/  http://www.devmedia.com.br/mineracao-de-dados-educacionais-usando-kdd-parte-2/29142  http://www.slideshare.net/krice100/educational-data-mining-in-program-evaluation-lessons-learned

Hinweis der Redaktion

  • O grande volume de dados gerado pelo uso intensivo de dados vem ultrapassando a capacidade humana de interpretar e compreender tanta informação.
    Isso impulsionou o desenvolvimento do KDD (Knowledge Discovery in Database), que é baseado na busca, análise e interpretação de padrões úteis, retirados de grandes bases de dados.
    A Mineração de Dados (MD) é uma das etapas principais dentro do KDD, originada da Estatística, Inteligência Artificial e Banco de Dados.
    A MD é usada para transformar grandes volumes de dados em informações significativas para o planejamento, a gestão e a tomada de decisão nas mais diversas áreas de conhecimento.
    Mineração de dados é parte de um processo que tem como entrada uma base de dados e como saída um conhecimento [Fayyad et al, 1996]
  • Outras áreas de aplicação: Educação, Marketing, Agronegócios, Indústria, retail sales, bioinformatics, and counter-terrorism.
  • Outras áreas de conhecimento: Visualização
  • Está inerentemente dentro da categoria denominada “Análise de Dados Secundários”

    Methods from the psychometrics literature are often integrated with methods from the machine learning and data mining literatures to achieve this goal.
    For example, in mining data about how students choose to use educational software, it may be worthwhile to simultaneously consider data at the keystroke level, answer level, session level, student level, classroom level, and school level. Issues of time, sequence, and context also play important roles in the study of educational data.

  • Alguns chamam de tarefas da MD – depois escolha de um algoritmo, o qual depende basicamente dos atributos disponíveis.

    Modelos preditivos: (baseado no artigo de Leandro Silva (workshop de 2014)
    Classificação de dados é quando o atributo especial da base de treinamento é formando por uma categoria.
    No contexto de educação, um processo de classificação poderia ser feito para prever se o aluno merece ou não uma bolsa de estudos, se ele está apto para participar de um intercambio, se ele se formará no prazo ou não e etc. Apesar dos exemplos serem com apenas duas classes, a classificação ainda pode ser feita para múltiplas classes.

    Previsão de séries é o nome dado quando o atributo especial é um valor contínuo. No contexto de educação, a previsão poderia ser feita para inferir a nota do aluno em uma disciplina, a nota média do aluno no final do curso, a quantidade de faltas no final de um semestre, dentre outros.

    Análise de agrupamento: a descoberta poderia ser útil para descobrir estilos de aprendizado dos alunos, disciplinas de interesses comuns e muitas outras aplicações

    Regra de associação: alunos aprovados na disciplina A também é aprovado na disciplina B ou aprovado em A e B também é aprovado na disciplina C. Ou então, aluno que acerta uma questão X na prova também acerta a Y e assim por diante

    Descoberta com modelos: este modelo, um determinado aprendiz pode estar em dois contexto: não aprendeu um determinado assunto ou aprendeu este assunto. Há uma probabilidade p(T) de haver uma transição entre o estado de Não-Aprendido para o estado de Aprendido.
    Em ambos os estados, trabalha-se com duas probabilidades:
    ▪ p(G): probabilidade do aprendiz responder corretamente um grupo de questões dado que não aprendeu o conteúdo (por exemplo, o aluno “chutou” a resposta);
    ▪ p(S): probabilidade do aprendiz responder corretamente um grupo de questões dado que aprendeu o conteúdo.
    Adicionalmente, há uma quarta probabilidade, p(L0), que especifica a probabilidade de um aprendiz possuir um conhecimento (um conhecimento prévio, por
    exemplo) no estado de aprendizado de um determinado conteúdo.

    Destilação de dados resume e apresenta os dados de maneira útil, interativa e com apelo visual para favorecer a identificação e classificação de padrões por seres humanos. Um exemplo típico desta técnica são as bem-conhecidas curvas de aprendizagem que mostra que o aprendizado aumenta com a experiência.
  • A predição é um processo que depende de uma janela de tempo. Existem, essencialmente, três janelas de tempo importantes em MDE (Silva, e Silva, 2014) :
    ▪ Exatamente agora ou agora: o estudante está usando o ambiente neste momento ?
    ▪ Futuro próximo: um estudante que usou o ambiente há pouco tempo desenvolveu habilidades para a próxima unidade ?
    ▪ Futuro: qual será a nota do estudante no próximo ENEM/ENADE ?
  • Com a expansão dos cursos EaD e híbridos, as técnicas de mineração de dados servirão para explorar padrões de dados para investigar questões desse tipo.
  • Todo esse processo acontece em um ciclo. Veja como: Imagine um aluno que faz logon no LMS e navega pelo material de aprendizagem, durante o qual ele também interage com os sistemas on-line na forma de cliques e entradas de texto. No back-end, o LMS armazena informações detalhadas sobre o comportamento do aluno em um banco de dados que é usado para prever o desempenho futuro do aluno. Estas previsões e feedback são exibidos em um painel visual que torna a informação fácil de compreender para instrutores e formadores. A próxima vez que o aluno entra em seu LMS, o LMS já conhece seus atributos relacionados à aprendizagem e, portanto, o material de aprendizagem é apresentado com base em seu nível de desempenho e interesse. O papel do treinador é intervir e ajudar quando necessário. Tal sistema tem uma vantagem de duas vias. Por um lado, dá um melhor controle aos alunos, o que é especialmente importante no local de trabalho onde os alunos são adultos, funcionários maduros. Por outro lado, permite que o professor seja um facilitador do aprendizado, para que ele possa contribuir mais para o design de conteúdo inteligente.

    http://blog.originlearning.com/understanding-educational-data-mining/

×