55. 모집단의 성질에 대해 표본을 통해 추정할 수 있는 것처럼,
표본의 성질에 대해서도 재표본을 통해 추정할 수 있다는 것이다.
즉 주어진 표본(샘플)에 대해서, 그 샘플에서 또 다시 샘플(재표본)을
여러번(1,000~10,000번, 혹은 그 이상)추출하여
표본의 평균이나 분산 등이 어떤 분포를 가지는가를 알아낼 수 있다.
Bootstrap
63. Averaging a set of observations reduces variance
Bootstrap
A slight change in sample,
Still a slight change in split
시험지 확인하러 가서 내 점수를 올려도
반 평균에는 큰 영향을 미치지 않는다
73. Tree
& advantages
1. 이해하기 쉽다: 씹고 뜯고 맛보고 즐기고 [White box]
2. 데이터 정제가 크게 필요하지 않다: 바로 넣자
3. numerical, categorical 가리지 않는다: 그냥 넣자
4. 데이터가 어떤 패턴인지 볼 때 편하다: 넣어봐