SlideShare ist ein Scribd-Unternehmen logo
1 von 15
페이지랭킹 by google 20042521 김진태 국민대학교
PageRank gadget http://www.sitepagerank.net/
Motivation 웹 페이지의 상대적 중요성을 어떻게 추산할 것인가? World Wide Web Hypertext 기존 score알고리즘의 문제 임의의 조작 가능
Link Structure of the Web Forwardlink(out edges) 페이지를 다운받으면 포워드링크를 알 수 있음. Backlink(in edges) 특정 페이지의 모든 백링크를 찾는 것은 불가능 ,[object Object]
Important page’s forwarlink -> more important
어떤 페이지가 높은 랭크의 백링크를 많이 가질수록 그 페이지의 랭크도 올라간다.,[object Object]
pagerank – rank sink 두 페이지가 서로 가리키고 있으며 다른 페이지로는 연결되어 있지 않은 경우 무한 루프에 빠져 랭크를 계속 계산하며 외부로 전혀 분산하지 못한다. rank sink로부터 초래되는 문제를 해결하기 위해 rank source를 도입 source와 sink (그래프 이론 용어) sink : 밖으로 나가는 링크가 없는 것 source : 안으로 들어오는 링크가 없고 밖으로 나가는 것만 잇는 것
pagerank (랭크 소스 도입) E(u) : 랭크의 소스에 해당하는 웹 페이지의 벡터 중 하나 Random Surfer Model ‘랜덤 서퍼’의 행동을 모델링한 것이 페이지랭크 실제 웹서퍼가rank sink를 만나 루프 내를 맴돌 가능성 -> ZERO 실제 웹서퍼라면 다른 페이지로 점프할 것이다. -> 부가적인 팩터E
Dangling links problem Dangling Links 외부로 나가는 링크가 없는 페이지를 가리키는 링크 Problem dangling link의 가중치가 어디로 분산되고 있는지가 불분명 danglink link가 너무 많다. 다운로드한 문서가 100인 경우 100개의 문서에서 가리키는 링크의 문서를 모두 다운받기 어렵다. Solution dangling link 제거 모든 페이지 랭크가 계산될 때까지 무시 다른 링크의 노멀라이제이션이 영향을 받을 수는 있지만 크게 변화하지는 않는다. 페이지 랭크의 계산이 끝난 후 dangling link 첨가
Implementation 부모ID를 이용해서 링크 구조를 정렬 댕글링 링크 제거 몇 번의 반복 작업만으로도 대부분의 댕글링 링크 제거 가능 랭크값 초기화 초기화 값을 잘 설정하면 수렴과정의 속도를 높일 수 있다. 가중치 수렴 현재 진행 중인 단계의 가중치는 메모리에 저장되고 전단계의 가중치는 디스크를 통해 리니어하게엑세스한다. 가중치 수렴 후, 댕글링 링크 추가 후 랭킹 재연산
Convergence Properties
페이지랭크 적용 결과 비교 조건 : 1600만 페이지를 수집하여 제목만을 사용하는 검색
Common Case 페이지랭크를 이용한 검색은 커먼케이스를 잘 처리하게 된다. 꽃을 검색하였을 때 단순히 꽃의 정보가 담긴 사이트가 아닌 꽃 판매 사이트를 출력하는 경우
Personalized PageRank E, 페이지랭크 연산의 중요 요소 랭크싱크처럼아웃엣지가 없는 싸이클을 보충하기 위한 랭크 소스 웹페이지의 벡터
페이지랭크의 적용 웹 트래픽의 추산 백 링크 예측자로써의 페이지랭크 사용자 네비게이션:페이지랭크 프락시

Weitere ähnliche Inhalte

Andere mochten auch

농촌활성화를 어떻게 송인창님
농촌활성화를 어떻게  송인창님농촌활성화를 어떻게  송인창님
농촌활성화를 어떻게 송인창님
JUNGEUN KANG
 
3 나의 경쟁력 pdf
3 나의 경쟁력 pdf3 나의 경쟁력 pdf
3 나의 경쟁력 pdf
JUNGEUN KANG
 

Andere mochten auch (10)

2013 글로벌인재양성을 위한 300프로젝트 설명회 진행PT
2013 글로벌인재양성을 위한 300프로젝트 설명회 진행PT2013 글로벌인재양성을 위한 300프로젝트 설명회 진행PT
2013 글로벌인재양성을 위한 300프로젝트 설명회 진행PT
 
농촌활성화를 어떻게 송인창님
농촌활성화를 어떻게  송인창님농촌활성화를 어떻게  송인창님
농촌활성화를 어떻게 송인창님
 
40라운드란 신철식(정책행정)ㅍ2003
40라운드란 신철식(정책행정)ㅍ200340라운드란 신철식(정책행정)ㅍ2003
40라운드란 신철식(정책행정)ㅍ2003
 
Vsm 벡터공간모델
Vsm 벡터공간모델Vsm 벡터공간모델
Vsm 벡터공간모델
 
개인브랜드사관학교 5강 브랜드블로그
개인브랜드사관학교 5강 브랜드블로그개인브랜드사관학교 5강 브랜드블로그
개인브랜드사관학교 5강 브랜드블로그
 
블로그 온라인브랜드디렉터 강정은 20110330
블로그 온라인브랜드디렉터 강정은 20110330블로그 온라인브랜드디렉터 강정은 20110330
블로그 온라인브랜드디렉터 강정은 20110330
 
100203 강원도 소셜웹을농기구처럼 (V 3)
100203 강원도 소셜웹을농기구처럼 (V 3)100203 강원도 소셜웹을농기구처럼 (V 3)
100203 강원도 소셜웹을농기구처럼 (V 3)
 
취직이 아닌 취업을, 경험을 경력으로 만드는 비법 & 300프로젝트
취직이 아닌 취업을, 경험을 경력으로 만드는 비법 & 300프로젝트취직이 아닌 취업을, 경험을 경력으로 만드는 비법 & 300프로젝트
취직이 아닌 취업을, 경험을 경력으로 만드는 비법 & 300프로젝트
 
[포트폴리오] 온라인브랜드디렉터 강정은
[포트폴리오] 온라인브랜드디렉터 강정은[포트폴리오] 온라인브랜드디렉터 강정은
[포트폴리오] 온라인브랜드디렉터 강정은
 
3 나의 경쟁력 pdf
3 나의 경쟁력 pdf3 나의 경쟁력 pdf
3 나의 경쟁력 pdf
 

Mehr von JUNGEUN KANG

Kdta 20주년 사랑과 열정
Kdta 20주년 사랑과 열정Kdta 20주년 사랑과 열정
Kdta 20주년 사랑과 열정
JUNGEUN KANG
 
121116 300프로젝트 설명회 진행pt
121116 300프로젝트 설명회 진행pt121116 300프로젝트 설명회 진행pt
121116 300프로젝트 설명회 진행pt
JUNGEUN KANG
 
대학생활포트폴리오스쿨1 7
대학생활포트폴리오스쿨1 7대학생활포트폴리오스쿨1 7
대학생활포트폴리오스쿨1 7
JUNGEUN KANG
 
[수정]일생에 한권 책을 써라 By 박순천
[수정]일생에 한권 책을 써라 By 박순천[수정]일생에 한권 책을 써라 By 박순천
[수정]일생에 한권 책을 써라 By 박순천
JUNGEUN KANG
 
120820 나꿈소 강정은
120820 나꿈소 강정은120820 나꿈소 강정은
120820 나꿈소 강정은
JUNGEUN KANG
 
대학생활포트폴리오스쿨1 5
대학생활포트폴리오스쿨1 5대학생활포트폴리오스쿨1 5
대학생활포트폴리오스쿨1 5
JUNGEUN KANG
 
대학생활포트폴리오스쿨1 4
대학생활포트폴리오스쿨1 4대학생활포트폴리오스쿨1 4
대학생활포트폴리오스쿨1 4
JUNGEUN KANG
 
소캠_대학생활포트폴리오스쿨1.나 -세번째모임
소캠_대학생활포트폴리오스쿨1.나 -세번째모임소캠_대학생활포트폴리오스쿨1.나 -세번째모임
소캠_대학생활포트폴리오스쿨1.나 -세번째모임
JUNGEUN KANG
 

Mehr von JUNGEUN KANG (20)

2016년 브랜드네트워크 2월정기모임
2016년 브랜드네트워크 2월정기모임2016년 브랜드네트워크 2월정기모임
2016년 브랜드네트워크 2월정기모임
 
[포트폴리오] 온라인브랜드디렉터 강정은
[포트폴리오] 온라인브랜드디렉터 강정은[포트폴리오] 온라인브랜드디렉터 강정은
[포트폴리오] 온라인브랜드디렉터 강정은
 
Kdta 20주년 사랑과 열정
Kdta 20주년 사랑과 열정Kdta 20주년 사랑과 열정
Kdta 20주년 사랑과 열정
 
130509 청년창업멘토협회조찬 온라인브랜드디렉터 강정은
130509 청년창업멘토협회조찬 온라인브랜드디렉터 강정은130509 청년창업멘토협회조찬 온라인브랜드디렉터 강정은
130509 청년창업멘토협회조찬 온라인브랜드디렉터 강정은
 
300프로젝트 특강3 온라인브랜드디렉터 강정은 블로그AtoZ
300프로젝트 특강3  온라인브랜드디렉터 강정은 블로그AtoZ300프로젝트 특강3  온라인브랜드디렉터 강정은 블로그AtoZ
300프로젝트 특강3 온라인브랜드디렉터 강정은 블로그AtoZ
 
2013 글로벌인재양성을 위한 300프로젝트소개서
2013 글로벌인재양성을 위한 300프로젝트소개서2013 글로벌인재양성을 위한 300프로젝트소개서
2013 글로벌인재양성을 위한 300프로젝트소개서
 
121116 300프로젝트 설명회 진행pt
121116 300프로젝트 설명회 진행pt121116 300프로젝트 설명회 진행pt
121116 300프로젝트 설명회 진행pt
 
소통테이너 오종철 프로필
소통테이너 오종철 프로필 소통테이너 오종철 프로필
소통테이너 오종철 프로필
 
작가에이전시 작가세상 브랜드런칭
작가에이전시 작가세상 브랜드런칭작가에이전시 작가세상 브랜드런칭
작가에이전시 작가세상 브랜드런칭
 
대학생활포트폴리오스쿨1 7
대학생활포트폴리오스쿨1 7대학생활포트폴리오스쿨1 7
대학생활포트폴리오스쿨1 7
 
북TV365 조연심의 브랜드쇼 - <성공하는> 안계환 저자편
북TV365 조연심의 브랜드쇼 - <성공하는> 안계환 저자편북TV365 조연심의 브랜드쇼 - <성공하는> 안계환 저자편
북TV365 조연심의 브랜드쇼 - <성공하는> 안계환 저자편
 
[수정]일생에 한권 책을 써라 By 박순천
[수정]일생에 한권 책을 써라 By 박순천[수정]일생에 한권 책을 써라 By 박순천
[수정]일생에 한권 책을 써라 By 박순천
 
잡코리아 나꿈소2회 온라인브랜드디렉터 강정은
잡코리아 나꿈소2회 온라인브랜드디렉터 강정은잡코리아 나꿈소2회 온라인브랜드디렉터 강정은
잡코리아 나꿈소2회 온라인브랜드디렉터 강정은
 
120820 나꿈소 강정은
120820 나꿈소 강정은120820 나꿈소 강정은
120820 나꿈소 강정은
 
대학생활포트폴리오스쿨1 6
대학생활포트폴리오스쿨1 6대학생활포트폴리오스쿨1 6
대학생활포트폴리오스쿨1 6
 
대학생활포트폴리오스쿨1 5
대학생활포트폴리오스쿨1 5대학생활포트폴리오스쿨1 5
대학생활포트폴리오스쿨1 5
 
대학생활포트폴리오스쿨1 4
대학생활포트폴리오스쿨1 4대학생활포트폴리오스쿨1 4
대학생활포트폴리오스쿨1 4
 
소캠 대학생활포트폴리오스쿨1. 나 -세번째모임
소캠 대학생활포트폴리오스쿨1. 나 -세번째모임소캠 대학생활포트폴리오스쿨1. 나 -세번째모임
소캠 대학생활포트폴리오스쿨1. 나 -세번째모임
 
소캠_대학생활포트폴리오스쿨1.나 -세번째모임
소캠_대학생활포트폴리오스쿨1.나 -세번째모임소캠_대학생활포트폴리오스쿨1.나 -세번째모임
소캠_대학생활포트폴리오스쿨1.나 -세번째모임
 
소셜캠퍼스 대학생활포트폴리오스쿨1. 나 -두번째모임
소셜캠퍼스 대학생활포트폴리오스쿨1. 나 -두번째모임소셜캠퍼스 대학생활포트폴리오스쿨1. 나 -두번째모임
소셜캠퍼스 대학생활포트폴리오스쿨1. 나 -두번째모임
 

Pagerank Algorithm 20042521

  • 1. 페이지랭킹 by google 20042521 김진태 국민대학교
  • 3. Motivation 웹 페이지의 상대적 중요성을 어떻게 추산할 것인가? World Wide Web Hypertext 기존 score알고리즘의 문제 임의의 조작 가능
  • 4.
  • 5. Important page’s forwarlink -> more important
  • 6.
  • 7. pagerank – rank sink 두 페이지가 서로 가리키고 있으며 다른 페이지로는 연결되어 있지 않은 경우 무한 루프에 빠져 랭크를 계속 계산하며 외부로 전혀 분산하지 못한다. rank sink로부터 초래되는 문제를 해결하기 위해 rank source를 도입 source와 sink (그래프 이론 용어) sink : 밖으로 나가는 링크가 없는 것 source : 안으로 들어오는 링크가 없고 밖으로 나가는 것만 잇는 것
  • 8. pagerank (랭크 소스 도입) E(u) : 랭크의 소스에 해당하는 웹 페이지의 벡터 중 하나 Random Surfer Model ‘랜덤 서퍼’의 행동을 모델링한 것이 페이지랭크 실제 웹서퍼가rank sink를 만나 루프 내를 맴돌 가능성 -> ZERO 실제 웹서퍼라면 다른 페이지로 점프할 것이다. -> 부가적인 팩터E
  • 9. Dangling links problem Dangling Links 외부로 나가는 링크가 없는 페이지를 가리키는 링크 Problem dangling link의 가중치가 어디로 분산되고 있는지가 불분명 danglink link가 너무 많다. 다운로드한 문서가 100인 경우 100개의 문서에서 가리키는 링크의 문서를 모두 다운받기 어렵다. Solution dangling link 제거 모든 페이지 랭크가 계산될 때까지 무시 다른 링크의 노멀라이제이션이 영향을 받을 수는 있지만 크게 변화하지는 않는다. 페이지 랭크의 계산이 끝난 후 dangling link 첨가
  • 10. Implementation 부모ID를 이용해서 링크 구조를 정렬 댕글링 링크 제거 몇 번의 반복 작업만으로도 대부분의 댕글링 링크 제거 가능 랭크값 초기화 초기화 값을 잘 설정하면 수렴과정의 속도를 높일 수 있다. 가중치 수렴 현재 진행 중인 단계의 가중치는 메모리에 저장되고 전단계의 가중치는 디스크를 통해 리니어하게엑세스한다. 가중치 수렴 후, 댕글링 링크 추가 후 랭킹 재연산
  • 12. 페이지랭크 적용 결과 비교 조건 : 1600만 페이지를 수집하여 제목만을 사용하는 검색
  • 13. Common Case 페이지랭크를 이용한 검색은 커먼케이스를 잘 처리하게 된다. 꽃을 검색하였을 때 단순히 꽃의 정보가 담긴 사이트가 아닌 꽃 판매 사이트를 출력하는 경우
  • 14. Personalized PageRank E, 페이지랭크 연산의 중요 요소 랭크싱크처럼아웃엣지가 없는 싸이클을 보충하기 위한 랭크 소스 웹페이지의 벡터
  • 15. 페이지랭크의 적용 웹 트래픽의 추산 백 링크 예측자로써의 페이지랭크 사용자 네비게이션:페이지랭크 프락시
  • 16. 결론 페이지랭크 페이지의 컨텐트에 상관없이 오직 웹의 그래프 구조 상의 위치에만 의존하는 모든 웹 페이지의 글로벌 랭킹 ‘중요한’페이지로부터의 백링크는 평균적인 페이지들로부터의 백 링크보다 더 중요하다. 재귀적인 정의를 통해 확실히 구현되어 있다. 페이지랭크 실험을 통해 웹 그래프의 구조가 정보검색 작업에서 매우 유용하다는 것을 증명하였다.