3. CONTENTS
1. 주제 선정
- 주제 소개
- 주제 선정 배경
2. 데이터
- 데이터 수집
- 데이터 전처리
3. 모델링
- 기존 추천시스템 모델
- 모델 소개
- 모델 실험
4. 웹 구현
- 웹 Architecture
5. 결론
- 활용 방안
- 프로젝트 의의
6. 시연
5. 주
제
선
정
주제 소개
서울 카페 추천 서비스
데
이
터
모
델
링
웹
구
현
결
론
카페 추천
In SEOUL
학습
서울시 내에 존재하는 많은 지하철 역을 중심으로 사용자에게 카페 추천
DATA WEBSITE
6. 주
제
선
정
주제 선정 배경
Why?
데
이
터
모
델
링
웹
구
현
결
론
✓ 서울시 카페와 지하철역
• 수도권에는 지하철이 곳곳에 존재
• BOAZ에는 수도권 대학생들이 참여
• BOAZ 활동 기간 중 다양한 스터디 활동과 컨퍼런스 팀 프로젝트 수행
→ 지하철 역 근처의 카페를 추천해주면 모임 장소를 정하기 수월
✓ 웹 사용자 일반화
• Target : “대중교통”을 주로 이용하는 20대 대학생
7. 주
제
선
정
주제 선정 배경
What’s different?
데
이
터
모
델
링
웹
구
현
결
론
✓ 추천 시스템 알고리즘 결과가 믿을 만한 결과일까?
→ 추천 결과에 어떤 항목이 중요하게 고려되었는지 추천 모델의 학습 가중치를 시각화하여 제공
→ 추천 결과에 대한 사용자의 이해도와 신뢰도 향상
✓ 네이버, 카카오, 구글 3가지 포털사이트의 리뷰를 동시 제공
→ 사용자는 한 곳에서 다양한 리뷰 비교 가능
9. 주
제
선
정
데이터 수집
서울 카페 선정
데
이
터
모
델
링
웹
구
현
결
론
Data 일부
…
…
✓ Data Filtering
• 서울지역
• 커피점/카페
10. 주
제
선
정
데이터 수집
서울 카페 – 지하철 역 거리 계산
데
이
터
모
델
링
웹
구
현
결
론
…
서울 카페 Data 서울 지하철 역 Data
서울 카페 위도, 경도와 지하철 역의 위도, 경도
→ 직선 거리(Haversine) 계산
각 카페에서 가까운 지하철 역 매핑
…
22,239개의 카페를 550개의 역으로 맵핑
서울 카페 Data
…
12. 주
제
선
정
데이터 수집
데이터 수집 방법 : 크롤링
데
이
터
모
델
링
웹
구
현
결
론
• UserID
• ItemID
• Rating
• Timestamp
수집 항목
• Platform
• Review
• Image
네이버 지도 구글 지도
카카오 지도
13. 주
제
선
정
데이터 전처리
Text Review : Word Embeddings
데
이
터
모
델
링
웹
구
현
결
론
FastText
FastText Embeddings
FastText
Review Text
14. 주
제
선
정
데이터 전처리
Image Review : Image Embeddings
데
이
터
모
델
링
웹
구
현
결
론
Original Image Resize Image
(228 X 228 X 3)
(Batch size, Dim)
ResNet50
마지막 FC Layer
pretrained ResNet50
16. 주
제
선
정
기존 추천 시스템 모델
데
이
터
모
델
링
웹
구
현
결
론
Collaborative Filtering
Preferred by both users
Content-Based Filtering
Similar Users
Preferred by user
Recommend to user
Similar cafe
17. 주
제
선
정
기존 추천 시스템 모델의 문제점
데
이
터
모
델
링
웹
구
현
결
론
✓ CF만 활용할 때 문제점
→ History만으로는 추천 불가능 (cold start 문제 발생)
✓ 해결 방안
• CF 와 CB를 적절히 활용하는 것이 관건 ! ( Hybrid 방식 )
문제점과 해결방안
18. 모델 소개
ACCM 모델 (Attentional Content & Collaborate Model)
주
제
선
정
데
이
터
모
델
링
웹
구
현
결
론
p
y
+
+ pCS
pCF
uCF vCF uCB vCB
MLP MLP
Attention
+ + bias
bu bv
bg
dot
dot
user id item id user features item features
y
+
+ v
u
uCF uCB vCB
MLP MLP
+ + bias
bu bv
bg
dot
dot
user id user features item features
uv
vCF
item id
attention attention
user part item part
19. 모델 소개
ACCM 모델
user id
gender favorite survey
Item id
image review
Embedding Embedding
Concatenate
Drop
&
BN
Drop
&
BN
User
Attention
Attention
dot dot
Item
주
제
선
정
데
이
터
모
델
링
웹
구
현
결
론
21. ACCM 모델
주
제
선
정
데
이
터
모
델
링
웹
구
현
결
론
모델 실험
• 전반적으로 Image Review를 포함했을 때, Attention size가 큰 경우 에 더 좋은 성능을 보임
• 최적의 조건 : Image Review O, Embedding Size = 128, Attention Size = 32
Loss = CF Loss + CB Loss + not cold ratio * ACCM Loss
26. 주
제
선
정
활용 방안
데
이
터
모
델
링
결
론
추천의 고도화
✓ 사용자의 피드백을 통한 모델의 가중치 조절
✓ 사용자 확보
• 사용자에게 신뢰도를 주는 시각화로 사용자 확보와 설득에 유리
• 사용자 확보로 인하여 데이터 축적 가능 → 더 좋은 추천 결과 도출 가능
• 사용자로부터 피드백을 받아 모델의 가중치를 조정할 수 있게 된다면, 더욱 개인화된 추천 가능
웹
구
현
27. 주
제
선
정
프로젝트 의의
데
이
터
모
델
링
웹
구
현
결
론
✓ cold start 문제를 해결하기 위해
Collaborative Filtering과 Content-Based Filtering을 Hybrid방식으로 모델링
✓ 웹사이트로 구현하여 추천 시스템 모델에 대해 전혀 모르는 사용자도 쉽게 시스템 이용 가능
✓ 추천 결과에 중요하게 고려된 항목을 시각화하여 제공 → 추천 결과에 대한 설명이 가능
✓ 웹사이트에서 설문조사와 좋아요 기능을 통해 사용자의 정보와 선호를 모델에 반영
→ 개인화된 추천 가능