SK Planet에서 주최한 TechPlanet 2012에서 발표했던 자료입니다. 소셜 큐레이션 서비스에 대한 간략한 소개와 관련 기술, 향후 전망 등을 담고 있습니다.
! 정정합니다. 32페이지의 pypi install ... 은 pip install 이 올바른 코드입니다.
29. Amazon EC2 장점+1
• 가격이 싼 편이다.
• 원하는 만큼 사용할 수 있다.
• 데이터 센터가 물리적으로 분산되어 있다.
• 모든 서비스가 API로 만들어져 있다.
→ 용량 추가, 콘솔 출력 캡쳐, 오토 스케일링, 모니터링 등
• 아마존 서비스에 문제가 생기면 다른 회사 서비스에도 문제가
생기므로 욕을 적게 먹는다.
31. • 빠르게 개발할 수 있다.
표현력(Expressive Power)이 가장 좋은 언어 중 하나
언어 C에 상대적인 수준
C 1
C++ 2.5
Java 2.5
Python 6
출처 : Code Complete (Steve McConnell)
표현력이 좋다 = 생각을 코드로 만들기 쉽다
32. • 빠르게 개발할 수 있다.
• 라이브러리 지원이 뛰어나다.
- 여러 API 서비스는 Python 또는 Ruby 라이브러리를 우선 제공한다.
- Python Package Index의 편리함!
$> pypi install django
33. • 빠르게 개발할 수 있다.
• 라이브러리 지원이 뛰어나다.
• 개발자를 구하기 쉽다 또는 배우기 쉽다.
- Python은 발표된 지 20년이 넘은 언어이다.
- 개념이 명확하고 배우기 쉽다.
34. • 빠르게 개발할 수 있다.
• 라이브러리 지원이 뛰어나다.
• 개발자를 구하기 쉽다 또는 배우기 쉽다.
• Django 역시 꽤 성숙한 웹 개발 프레임워크이다.
35. 힘겨워하는 DB를 위하여
- 프로파일링을 통해 로직/쿼리 최적화
- 입출력이 잦은 단순 데이터는 NoSQL redis 서버로 분산
- 자주 변하지 않는 데이터는 memcached에 캐시
Photo Used under Creative Commons from nigelpepper
40. 웹 브라우저 도구
북마클릿 장 : 브라우저 호환성이 뛰어나다.
단 : 구동 시간이 필요하다. 기능에 제한이 있다.
장 : 북마클릿보다 반응이 빠르고 기능이 다양하다.
단 : 파이어폭스 확장 기능보다 사용할 수 있는 기능이 적다.
장 : 원한다면 브라우저의 거의 모든 기능을 사용할 수 있다.
단 : 크롬 확장 기능보다 만들기 훨씬 어렵다.
+Addon SDK 장 : 파이어폭스 확장기능을 그냥 만드는 것보다는 그나마 쉽다.
단 : SDK에서 지원하지 않는 기능은 사용하기 어렵다.
42. 실시간 추천
Content-based 방식과 Collaborative Filtering 방식
컨텐트의 관련 메타 데이터가 너무 부족하다!
그런데, 비교해야 할 데이터가 너무 많다.
→ Hadoop MapReduce를 사용하자.
리얼 타임이라며? 하둡은 리얼타임이 아닌데?
→ 그럼, MinHash를 사용하자.
더 알고 싶으신 분은…
MapReduce 기반 대용량 추천 알고리즘 개발 : http://readme.skplanet.co.kr/?p=2509