참고도서: 퇴근시간이 빨라지는 비지니스 통계 입문
1. 도수분포표란?
전체 데이터를 일정한 구간으로 나누고, 그 구간에 몇 개의 데이터가 들어있는지 파악하는 표.
횟수 |
주스의 양(ml) |
횟수 |
주스의 양(ml) |
1 |
300 |
26 |
304 |
2 |
290 |
27 |
277 |
3 |
315 |
28 |
289 |
4 |
279 |
29 |
311 |
5 |
320 |
30 |
301 |
6 |
311 |
31 |
294 |
7 |
295 |
32 |
285 |
8 |
305 |
33 |
307 |
9 |
300 |
34 |
281 |
10 |
275 |
35 |
297 |
11 |
319 |
36 |
309 |
12 |
315 |
37 |
311 |
13 |
300 |
38 |
304 |
14 |
297 |
39 |
300 |
15 |
303 |
40 |
296 |
16 |
307 |
41 |
290 |
17 |
299 |
42 |
305 |
18 |
287 |
43 |
301 |
19 |
300 |
44 |
311 |
20 |
299 |
45 |
301 |
21 |
274 |
46 |
307 |
22 |
309 |
47 |
296 |
23 |
303 |
48 |
299 |
24 |
288 |
49 |
304 |
25 |
315 |
50 |
302 |
평균 |
299.74 |
도수 분포표를 만들어 보자.
1) 우선 최대값, 최소값, 범위, 계급의 수 그리고 폭을 구한다.
raw data |
계산 용이 |
|
최대값 |
320 |
320 |
최소값 |
274 |
270 |
범위 |
46 |
50 |
계급의 수 |
6 |
6 |
계급의 폭 |
7.666667 |
10 |
2) 그리고 도수분포표를 정리한다.
하한 |
상한 |
계급(주스의 양) |
계급값 |
도수 |
%(상대도수) |
270 |
279 |
270~279 |
274.5 |
29 |
38.7% |
280 |
289 |
280~289 |
284.5 |
5 |
6.7% |
290 |
299 |
290~299 |
294.5 |
11 |
14.7% |
300 |
309 |
300~309 |
304.5 |
21 |
28.0% |
310 |
319 |
310~319 |
314.5 |
8 |
10.7% |
320 |
329 |
320~329 |
324.5 |
1 |
1.3% |
합계 |
75 |
100.0% |
주의: 도수는 frequency함수는 배열. 따라서 입력할 때에는 =FREQUENCY(주스의 양,상한)기입한 후 Ctrl+Shift+Enter로 입력
히스토그램은 위의 표를 바탕으로 그래프만 그려주면 간단히 해결.
'Python, R 분석과 프로그래밍' 카테고리의 다른 글
subset, mosiacplot, hist, var,sd (0) | 2015.10.31 |
---|---|
dim, str, plot (0) | 2015.10.29 |
[데이터 처리 & 분석 실무] 데이터 타입 - 데이터 프레임, 판별, 변환 (0) | 2015.02.12 |
[데이터 처리 & 분석 실무] 데이터 타입 - 스칼라, 벡터, 리스트, 행렬, 배열 (0) | 2015.02.12 |
R Practice - diet_data (0) | 2015.01.19 |