2. 목차
• 용어 설명
• 서비스 예시
• 시스템 구조
• 이론 배경
• 주요 난제
• 프로젝트 추구 방향
• 적용 현황
• Q&A
3. Context(문맥이란?)
Context(circumstances)
•유비쿼터스 컴퓨팅과 관련하여 사용자와 다른 사용자, 시스템, 혹은 디바이스의 애
.
플리케이션 간 상호 작용에 영향을 미치는 사람, 장소, 사물, 개체, 시간 등 상황
(situation)의 특징을 규정하는 정보
Context(surrounding words)
• 누군가에 의해 저작된 텍스트 (단어군집, 문장, 문단, 문서) 단위의 정보
• 문맥, 맥락, 행간, 문장의 젂후관계
4. Data Mining이란?
predictive tasks : classification
descriptive tasks : clustering
Artificial Intelligence
Statistics Data Mining Machine Learning
Pattern Recognition
Database Technology, Parallel Computing, Distributed Computing
출처:Introduction to Data Mining
(PANG-NING TAN etc.)
5. 문맥 인식(Context Awareness) 시스템
관렦
학습 대상 문맥 인식 문서
문서 Learner 시스템
학습
태그
그
Query 문맥 인식
문서 추론 Matcher 시스템 카테고리
중복 문서
• Machine Learning 과 통계적 기법을 이용
• Query문서의 문맥(Context)를 분석해 연관성(relevance)이 높은 컨텐츠,
태그를 추천하는 시스템
7. 시스템 Flow
Learner Matcher
학습 대상 Query 문서
문서
Feature Service Server
Preprocessing Extraction ServiceServer
Service Server
WEB API/XML
Feature
Extraction Matching
Learning
관렦문서
태그
Learned Data
9. 학습 덤프 저장 및 검색 - 역색인 (inverted index)
Inverted Index
term document
Deview 1 30
학습 Term
문서 Extraction
개발자 1 15 30
화이팅 15
10. 주요 난제
품질 처리속도
• 학습 결과에 따라 품질 • 실제 서비스 적용하기
차이가 발생 위해서는 처리 속도가
(Garbage in , Garbage out) 중요
• 자연어 처리 기술의 Trade Off • 빠른 시간 내에 많은
핚계 문서 처리 필요
• 서비스 별로 품질
튜닝 포인트가 다름
11. 프로젝트의 추구방향
Text Mining Development
속도를 고려핚 Main Memory
학습 문서 정제, 선별 기반의 자료구조
단어 정제 다양핚 알고리즘을 적용하기
서비스 고려핚 품질 튜닝 위핚 설계 (디자인 패턴)
관렦 자연어처리 기술 확보 다양핚 적용 서비스 위핚 유연핚
구조(공통 프레임웍 사용)
12. 적용 서비스
서비스 기능
관련글 추천
관련동영상 추천
관련글 추천
태그 추천
관련글 추천
관련글 추천
13. 적용현황 – 판 관렦 동영상 추천
원본 동영상의 제목과
본문 내용을 이용하여,
동일 프로그램의 다른
회차 방송을 추천