8. 1. 2차원 데이터의 분류
데이터의 생성
모집단의 확률분포
정의
랜덤 데이터 추출
두 클래스 𝐶1, 𝐶2에 대하여 가우시안 분포
를 따르는 확률분포 정의
9. 1. 2차원 데이터의 분류
데이터의 생성
p(x 𝐶1 ~ 𝐺(𝜇1,∑1), p(x 𝐶2 ~ 𝐺(𝜇2,∑2)
𝜇1 =
3
5
, ∑1 =
1 1
1 2
, 𝜇2 =
5
3
, ∑2 =
1 1
1 2
클래스 𝐶1, 𝐶2에 대한 분포 식
matlab 코드
가우시안 분포를 따르는 두 클래스로 이루어진
데이터 집합
10. 1. 2차원 데이터의 분류
데이터의 학습(분석)
학습 및 시험
데이터 준비
데이터 분포 특성
분석
결정경계 찾기
11. 1. 2차원 데이터의 분류
데이터의 학습(분석)
학습 및 시험
데이터 준비
데이터 분포 특성
분석
결정경계 찾기
12. 1. 2차원 데이터의 분류
데이터의 학습(분석)
학습 및 시험
데이터 준비
데이터 분포 특성
분석
결정경계 찾기
학습
13. 1. 2차원 데이터의 분류
데이터의 학습(분석)
학습 및 시험
데이터 준비
데이터 분포 특성
분석
결정경계 찾기간단한 통계 계산
복잡한 결정경계
학습 방법
학습
15. 1. 2차원 데이터의 분류
데이터의 학습(분석)
𝑚1=
2.7566
4.7419
, 𝑆1 =
1.3883 1.8897
1.8897 3.5530
𝑚2=
4.7313
2.8251
, 𝑆2 =
0.8770 0.6369
0.6369 0.9920
데이터 행렬의 평균과 공분산 행렬
matlab 코드학습데이터로 추정된 평균(𝑚1, 𝑚2)와 실평균(𝜇1, 𝜇2)
16. 1. 2차원 데이터의 분류
데이터의 분류 : 결정경계의 설정
𝑚1=
2.7566
4.7419
, 𝑆1 =
1.3883 1.8897
1.8897 3.5530
𝑚2=
4.7313
2.8251
, 𝑆2 =
0.8770 0.6369
0.6369 0.9920
데이터 행렬의 평균과 공분산 행렬
평균을 이용하여 간단한 결정경계를 찾을 수 있다
17. 1. 2차원 데이터의 분류
데이터의 분류 : 결정경계의 설정
학습데이터로 추정된 평균(𝑚1, 𝑚2)와 실평균(𝜇1, 𝜇2)
19. 1. 2차원 데이터의 분류
데이터의 분류 : 결정경계의 설정
두 점 𝒙 𝟏, 𝒙 𝟐 간의 거리
=>d(𝒙 𝟏, 𝒙 𝟐)
d(𝒎 𝟏, 𝒙 𝒏𝒆𝒘)
d(𝒎 𝟐, 𝒙 𝒏𝒆𝒘)
20. 1. 2차원 데이터의 분류
데이터의 분류 : 결정경계의 설정
두 점 𝒙 𝟏, 𝒙 𝟐 간의 거리
=>d(𝒙 𝟏, 𝒙 𝟐)
d(𝒎 𝟏, 𝒙 𝒏𝒆𝒘)
d(𝒎 𝟐, 𝒙 𝒏𝒆𝒘)
d(𝒎 𝟏, 𝒙 𝒏𝒆𝒘) < d(𝒎 𝟐, 𝒙 𝒏𝒆𝒘)
𝒙 𝒏𝒆𝒘는 𝒎 𝟏에 더 가깝다
𝒙 𝒏𝒆𝒘는 𝑪 𝟏으로 분류
21. 1. 2차원 데이터의 분류
데이터의 분류 : 결정경계의 설정
두 점 𝒙 𝟏, 𝒙 𝟐 간의 거리
=>d(𝒙 𝟏, 𝒙 𝟐)
d(𝒎 𝟏, 𝒙 𝒏𝒆𝒘)
d(𝒎 𝟐, 𝒙 𝒏𝒆𝒘)
결정경계 함수 g(x)=0
g(x) = d(𝒙 , 𝒎 𝟐)-d(𝒙 , 𝒎 𝟏) = 0
y(x) =
𝟏 𝒊𝒇 𝒈 𝒙 > 𝟎
−𝟏 𝒊𝒇 𝒈 𝒙 < 𝟎