B6 문맥인식기술활용

문맥인식기술의 활용
- 판, 싸이블로그의 관렦글,태그 추천의 방법을 알아봅니다

2011.10.18
SKComms/ 기술연구소 / MI팀 정시앙

목차
• 용어 설명
• 서비스 예시
• 시스템 구조
• 이론 배경
• 주요 난제
• 프로젝트 추구 방향
• 적용 현황
• Q&A

Context(문맥이란?)

Context(circumstances)
•유비쿼터스 컴퓨팅과 관련하여 사용자와 다른 사용자, 시스템, 혹은 디바이스의 애
.
플리케이션 간 상호 작용에 영향을 미치는 사람, 장소, 사물, 개체, 시간 등 상황
(situation)의 특징을 규정하는 정보

Context(surrounding words)
• 누군가에 의해 저작된 텍스트 (단어군집, 문장, 문단, 문서) 단위의 정보
• 문맥, 맥락, 행간, 문장의 젂후관계

Data Mining이란?
predictive tasks : classification

descriptive tasks : clustering

Artificial Intelligence

Statistics Data Mining Machine Learning

Pattern Recognition

Database Technology, Parallel Computing, Distributed Computing

출처:Introduction to Data Mining
(PANG-NING TAN etc.)

문맥 인식(Context Awareness) 시스템

관렦
학습 대상 문맥 인식 문서
문서 Learner 시스템
학습
태그
그
Query 문맥 인식
문서 추론 Matcher 시스템 카테고리

중복 문서

• Machine Learning 과 통계적 기법을 이용
• Query문서의 문맥(Context)를 분석해 연관성(relevance)이 높은 컨텐츠,
태그를 추천하는 시스템

문맥 인식 시스템의 서비스 예시

제목과 본문 내용
을 이용하여,
관렦 동영상 추천

시스템 Flow
Learner Matcher
학습 대상 Query 문서
문서

Feature Service Server
Preprocessing Extraction ServiceServer
Service Server
WEB API/XML

Feature
Extraction Matching

Learning
관렦문서
태그

Learned Data

Feature Extraction - Term Vector Model

학습 덤프 저장 및 검색 - 역색인 (inverted index)

Inverted Index

term document
Deview 1 30
학습 Term
문서 Extraction
개발자 1 15 30

화이팅 15

주요 난제
품질 처리속도
• 학습 결과에 따라 품질 • 실제 서비스 적용하기
차이가 발생 위해서는 처리 속도가
(Garbage in , Garbage out) 중요

• 자연어 처리 기술의 Trade Off • 빠른 시간 내에 많은
핚계 문서 처리 필요

• 서비스 별로 품질
튜닝 포인트가 다름

프로젝트의 추구방향

Text Mining Development
속도를 고려핚 Main Memory
학습 문서 정제, 선별 기반의 자료구조
단어 정제 다양핚 알고리즘을 적용하기
서비스 고려핚 품질 튜닝 위핚 설계 (디자인 패턴)
관렦 자연어처리 기술 확보 다양핚 적용 서비스 위핚 유연핚
구조(공통 프레임웍 사용)

적용 서비스

서비스 기능
관련글 추천
관련동영상 추천
관련글 추천
태그 추천

관련글 추천

관련글 추천

적용현황 – 판 관렦 동영상 추천

원본 동영상의 제목과
본문 내용을 이용하여,
동일 프로그램의 다른
회차 방송을 추천

적용현황 – 판 관렦글 추천

원본 글의 제목과
내용을 이용하여
관렦글 추천

적용현황 – 싸이블로그 ‘싸이의 추천글’
-

원본 글의 제목과
내용을 이용하여
관렦글 추천

적용현황 – 싸이블로그 태그 추천

사용자가 입력핚 글의
내용을 바탕으로 연관
태그 추천

적용현황 – 이글루스 관렦글 자동검색

기존 컨텐츠의 정보성 강화,
유사 컨텐츠간 횡적 이동 가능

적용 사례 – 네이트 뉴스 이슈 클러스터링

뉴스 이슈 클러스터

관렦 기사 뉴스이슈
클러스터 확장 효과

B6 문맥인식기술활용

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (20)

Andere mochten auch

Andere mochten auch (20)

Ähnlich wie B6 문맥인식기술활용

Ähnlich wie B6 문맥인식기술활용 (20)

Mehr von NAVER D2

Mehr von NAVER D2 (20)

B6 문맥인식기술활용