2. 질적 자료의 정리
• 막대그래프(barplot)
– 일반적으로 x축(수평축)에 범주 표시
– 각 범주에 해당하는 관찰자료를 세어 그 높이를 표시
– 각 범주별 높이에 관심
> job <- c(rep("공무원", 12),
+ rep("기업체", 25),
+ rep("대학원진학", 5),
+ rep("해외연수", 7),
+ rep("어학 및 자격증준비", 1))
> job.table = table(job)
> barplot(job.table,
+ main="졸업후 진로")
3. 질적 자료의 정리
• 원그래프(pie)
– 각 범주의 관찰값들의 총합 중 해당 범주의 비율로 면
적 표시
• % * 360 으로 중심각 계산
– 각 범주의 면적 비교
> prop.table(job.table)
4. 질적 자료의 정리
• 선그래프(plot)
– 범주는 일정한 방향으로 움직이는 값(Ex. 시간)
– 막대그래프와 같이 각 범주의 높이 표시
– 각 범주값 연결
– 추이에 관심 > sales <- c(12.0, 10.5, 16.0, 13.5,
+ 23.0, 20.5, 25.0, 26.5)
> names(sales) <-c("p_1/4", "p_2/4",
+ "p_3/4", "p_4/4", "c_1/4", "c_2/4",
+ "c_3/4", "c_4/4")
> plot(sales, type="l",
+ main="분기별 매출실적")
> points(sales)
5. 양적 자료의 정리
• 히스토그램
– 양적 자료 특히 연속형 자료를 일정 구간으로 나누어 해당 구간안
에 해당하는 값을 나타낸다.
• X축을 막대그래프와 비교하여 보면 x축의 값이 서로 연결되어 있다.
– 구간의 개수는 5~10개 수준이 좋을 것으로 판단된다.
• 각 구간의 길이는 일정하게 유지하는 것이 좋다.
• 가장 작은 구간과 가장 큰 구간의 길이는 동일하지 않을수 있다.
– 각 구간별 개수에 대한 히스토그램과 전체 자료 중 해당 구간이 차
지하는 비율을 나타내는 히스토그램
• 비율을 나타내는 히스토그램은 각 막대의 면적에 관심이 있다.
8. 양적 자료의 정리
• 줄기-잎그림(stem)
– 히스토그램 등을 작성하기에 앞서 사전 정보 파악을 위
해 작성
– 손으로 그릴 수 있으며 효율적인 그래프 작성 가능
• 각 관측값의 개수, 구간별 개수 등을 파악하기 쉬움
– 작성 방법 : 문자열 처럼 판단
• 줄기 : 자료의 적절한 구간에 해당
• 잎 : 줄기 이후의 관찰값
– 다음을 입력해 봅니다.
• stem(weight, scale=0.5)
9. 양적 자료의 정리
The decimal point is 1 digit(s) to the right of the |
6 | 667777888889999
7 | 000000011111222222223333444
7 | 5667789
8|
8|6