1. O documento apresenta a defesa de proposta de dissertação de mestrado de Nailson Boaz Costa Leite sobre sistemas de recomendação baseados em Linked Open Data.
2. A proposta visa desenvolver um sistema de recomendação que gere listas diversificadas e relevantes utilizando as bases de dados semânticas do Linked Open Data.
3. O modelo proposto utilizará o algoritmo "Topic Diversification" para reordenar as recomendações considerando a taxonomia entre os objetos das bases de dados.
1. Defesa de Proposta de Dissertação
Nailson Boaz Costa Leite
29/05/2014
Nailson Boaz Costa Leite (UFCG)
1
Banca examinadora:
Leandro Balby Marinho (orientador)
Carlos Eduardo Batista (orientador)
Nazareno Andrade
Claudio Campelo
PPGCC/UFCG
Campina Grande – Maio, 2014
2. Explorando a Diversidade em Sistemas de Recomendação baseados em Linked Open Data
Nailson Boaz Costa Leite
29/05/2014
Nailson Boaz Costa Leite (UFCG)
2
PPGCC/UFCG Campina Grande – Maio, 2014
3. Sumário
•Introdução
•Motivação
•Problema Abordado
•Proposta de Solução
•Objetivos
•Relevância
•Cronograma
•Referências
29/05/2014
Nailson Boaz Costa Leite (UFCG)
3
4. Introdução
Linked Data
•Difundir boas práticas para publicar e interligar dados estruturados (RDF);
•Padronizar tecnologias e mecanismos que facilitam o processamento, o compartilhamento, a escalabilidade e o reuso de dados
29/05/2014
Nailson Boaz Costa Leite (UFCG)
4
5. Introdução
4 princípios do Linked Data:
•Use URIs para identificar os objetos
•Use URIs HTTP para acessar o objeto
•Cada objeto possui sua descrição
•As propriedades dos objetos podem ser referenciadas por URIs.
29/05/2014
Nailson Boaz Costa Leite (UFCG)
5
9. Introdução
Linked Open Data Cloud
29/05/2014
Nailson Boaz Costa Leite (UFCG)
9
(Cyganiak, A., 2011)
10. Introdução
Sistemas de Recomendação baseados em LOD
Diversos trabalhos científicos tem utilizado a estrutura e o conteúdo disponível nas bases de dados de LOD para realizar recomendações.
29/05/2014
Nailson Boaz Costa Leite (UFCG)
10
11. Introdução
As bases de dados de LOD oferecem aos SR:
•Descrições para diversos tipos de domínios;
•Taxonomia entre os objetos;
•Cruzamento entre várias bases de dados LOD;
•Facilidade na coleta dos dados;
•Facilita a exploração dos objetos e suas relações;
•Adiciona semântica aos dados.
29/05/2014
Nailson Boaz Costa Leite (UFCG)
11
12. Motivação
“O real valor de uma recomendação está em sugerir objetos que os usuários não descobririam por si mesmos” (Herlocker, 2004)
•Recomendações óbvias
•Recomendações redundantes
•Recomendações populares
29/05/2014
Nailson Boaz Costa Leite (UFCG)
12
14. Motivação
Novas dimensões para avaliação de SR:
•Novidade
•Diversidade
•Seredipidade
29/05/2014
Nailson Boaz Costa Leite (UFCG)
14
15. Motivação
Diversidade em SR:
A diversidade de uma lista de itens recomendados refere-se ao quão diferente cada item é dos demais, de acordo com uma ou mais propriedades.
29/05/2014
Nailson Boaz Costa Leite (UFCG)
15
17. Problema de Negócio
Os usuários estão recebendo muitas recomendações óbvias e redundantes em relação ao que já foi visto anteriormente.
29/05/2014
Nailson Boaz Costa Leite (UFCG)
17
18. Problema Técnico
Gerar listas ranqueadas de recomendações que apresentem diversidade e relevância entre os seus itens.
29/05/2014
Nailson Boaz Costa Leite (UFCG)
18
19. Proposta de Solução
Utilizar as informações semânticas, as propriedades e a taxonomia das bases de dados LOD para solucionar o trade-off entre diversidade e acurácia.
29/05/2014
Nailson Boaz Costa Leite (UFCG)
19
20. Proposta de Solução
•Topic Diversification (Ziegler, 2005)
Algoritmo “guloso” de re-rankeamento que computa a similaridade entre os itens através de sua taxonomia e controla o fator diversidade com uma variável ΘF.
29/05/2014
Nailson Boaz Costa Leite (UFCG)
20
21. Proposta de Solução
29/05/2014
Nailson Boaz Costa Leite (UFCG)
21
(Ziegler, 2005)
22. Proposta de Solução
•Topic Diversification
29/05/2014
Nailson Boaz Costa Leite (UFCG)
22
(Sandoval, S., 2012)
23. Proposta de Solução
Podemos utilizar as complexas taxonomias entre as propriedades dos objetos para reordenar as listas de recomendações através do topic diversification e tentar inferir o valor de ΘF.
29/05/2014
Nailson Boaz Costa Leite (UFCG)
23
24. Objetivos Gerais
Desenvolvimento e avaliação de um SR que utiliza as bases de dados de LOD para realizar recomendações diversas e acuradas.
29/05/2014
Nailson Boaz Costa Leite (UFCG)
24
25. Objetivos Específicos
1.Analisar o conjunto de dados semânticos de LOD em contextos de recomendação (livros, filmes, músicas).
2.Desenvolver um modelo de SR que utilize métodos que exploram o conteúdo extraído das bases de LOD
3.Realizar um estudo comparativo entre a diversidade e acurácia dos modelos propostos
29/05/2014
Nailson Boaz Costa Leite (UFCG)
25
27. Relevância
ESWC 2014 Challenge:
Task 3: Diversity
A tarefa 3 do ESWC foi o desenvolvimento de um SR baseado em conteúdo que leve em consideração a acurácia (F-measure) e a diversidade (intra-list) das recomendações utilizando o conteúdo disponível nas bases de dados de LOD. .
29/05/2014
Nailson Boaz Costa Leite (UFCG)
27
28. Metodologia
•Revisão Sistemática
oAlgoritmos e Métricas de Diversidade
•Estudo das Bases de LOD
•Desenvolvimento de SR baseado em LOD
•Escrita de Artigos
29/05/2014
Nailson Boaz Costa Leite (UFCG)
28
29. Cronograma
Meses
Fase
06/14
07/14
08/14
09/14
10/14
11/14
12/14
01/15
02/15
03/15
04/15
1
X
X
X
2
X
X
X
3
X
4
X
X
X
5
X
X
6
X
X
X
X
X
X
X
29/05/2014
Nailson Boaz Costa Leite (UFCG)
29
31. Referências
(Noia, T. 2012) Tommaso Di Noia, Roberto Mirizzi, Vito Claudio Ostuni, and Davide Romito. Exploiting the web of data in model- based recommender systems.In Proceedings of the sixth ACM conference on Recommender systems, pages 253–256. ACM, 2012.
(Sandoval, S., 2012) Novelty and Diversity Enhancement and Evaluation in Recommender Systems.
(Ziegler, 2005) Cai-Nicolas Ziegler, Sean M McNee, Joseph A Konstan, and Georg Lausen. Improving recommendation lists through topic diversification. In Proceedings of the 14th international conference on World Wide Web, pages 22–32. ACM, 2005.
29/05/2014
Nailson Boaz Costa Leite (UFCG)
31
32. Referências
(Vargas, S., 2011) Saúl Vargas and Pablo Castells. Rank and relevance in novelty and diversity metrics for recommender systems. In Proceedings of the fifth ACM conference on Recommender systems, pages 109–116. ACM, 2011.
(Cyganiak, A., 2011) Anja Jentzsch Richard Cyganiak. Linking open data cloud diagram, 2011.
29/05/2014
Nailson Boaz Costa Leite (UFCG)
32
33. Defesa da Proposta de Dissertação de Mestrado
Nailson Boaz Costa Leite
29/05/2014
Nailson Boaz Costa Leite (UFCG)
33
Banca examinadora:
Leandro Balby Marinho (orientador)
Carlos Eduardo Batista (orientador)
Nazareno Andrade
Claudio Campelo