p.46 제2장 보건 정보 데이터의 기초 분석
2.3 자료의 기술 및 요약
> setwd('c:/Rwork/')
> 담즙과포화비율자료 = read.table('담즙과포화비율.txt',header=T)
> attach(담즙과포화비율자료)
> head(담즙과포화비율자료,2)
성별 담즙의과포화비율
1 남자 40
2 남자 88
> plot(담즙의과포화비율,type='p',xlab='자료',ylab='담즙과포화비율',main='담즙과포화비율')
> par(new=T)
> plot(담즙의과포화비율,type='h',xlab='자료',ylab='담즙과포화비율',main='담즙과포화비율')
> length(담즙의과포화비율)
[1] 60
> length(담즙의과포화비율) #길이
[1] 60
> sort(담즙의과포화비율,decreasing=T) #내림차순
[1] 146 142 137 128 127 123 123 120 118 116 112 111 110 110 107 106 106 98 91 90 89 88 88
[24] 88 87 87 86 86 86 84 84 82 80 80 80 79 78 77 76 76 75 74 73 73 69 67
[47] 66 66 65 65 58 58 57 56 55 52 52 47 40 35
> sum(담즙의과포화비율) #합
[1] 5185
> cumsum(담즙의과포화비율) #누적합
[1] 40 128 238 295 381 518 596 707 795 875 961 1041 1088 1194 1259 1333 1399 1478
[19] 1536 1659 1746 1834 1924 1980 2053 2165 2275 2393 2445 2551 2618 2683 2735 2819 2905 2940
[37] 3056 3132 3187 3260 3349 3476 3563 3705 3782 3858 3916 4007 4114 4212 4340 4424 4570 4645
[55] 4765 4845 4927 5050 5116 5185
> mean(담즙의과포화비율);median(담즙의과포화비율) #평균과 중앙값
[1] 86.41667
[1] 84
> mean(담즙의과포화비율,trim=1/10) #10% 절삭
[1] 85.4375
> var(담즙의과포화비율);sd(담즙의과포화비율) #분산과 표준편차
[1] 657.1624
[1] 25.63518
> fivenum(담즙의과포화비율) #다섯숫자요약
[1] 35.0 68.0 84.0 106.5 146.0
> quantile(담즙의과포화비율)
0% 25% 50% 75% 100%
35.00 68.50 84.00 106.25 146.00
> IQR(담즙의과포화비율) #3사분위수-1사분위수
[1] 37.75
> quantile(담즙의과포화비율)[4]-quantile(담즙의과포화비율)[2]
75%
37.75
> mad(담즙의과포화비율) #Median Absolut Deviation 각 데이터에서 중앙값을 뺀 후 절대값을 취한 값들의 중앙값
[1] 26.6868
> max(담즙의과포화비율);min(담즙의과포화비율)
[1] 146
[1] 35
> range(담즙의과포화비율)
[1] 35 146
> R=max(담즙의과포화비율)-min(담즙의과포화비율)
> R
[1] 111
2. 4 표와 그래프를 이용한 자료의 요약
> head(담즙과포화비율자료,2)
성별 담즙의과포화비율
1 남자 40
2 남자 88
> 계급 = cut(담즙의과포화비율, breaks=c(20,40,60,80,100,120,140,160))
> head(계급)
[1] (20,40] (80,100] (100,120] (40,60] (80,100] (120,140]
Levels: (20,40] (40,60] (60,80] (80,100] (100,120] (120,140] (140,160]
> table(계급)
계급
(20,40] (40,60] (60,80] (80,100] (100,120] (120,140] (140,160]
2 8 18 15 10 5 2
> par(mfrow=c(1,1))
> hist(담즙의과포화비율,breaks=c(20,40,60,80,100,120,140,160),main='히스토그램')
> rug(담즙의과포화비율)
> stem(담즙의과포화비율) #나무 줄기 그림
The decimal point is 1 digit(s) to the right of the |
2 | 5
4 | 072256788
6 | 556679334566789
8 | 000244666778889018
10 | 667001268
12 | 033787
14 | 26
> stem(담즙의과포화비율,scale=2) #줄기의 마디 2배로 늘리기
The decimal point is 1 digit(s) to the right of the |
3 | 5
4 | 07
5 | 2256788
6 | 556679
7 | 334566789
8 | 000244666778889
9 | 018
10 | 667
11 | 001268
12 | 03378
13 | 7
14 | 26
> library(vioplot)
> vioplot(담즙의과포화비율,names='담즙의과포화비율',col='yellow')
> n=length(담즙의과포화비율)
> plot(sort(담즙의과포화비율),(1:n)/n,type='s',ylim=c(0,1),main='Ogive of bile supersaturation',ylab='ECDF',xlab='담즙과포화비율') #ogive 오자이브 그래프
> rug(담즙의과포화비율)
출처: 보건정보데이터 분석(이태림, 이재원, 김주한, 장대흥 공저)
'KNOU > 2 보건 정보 데이터 분석' 카테고리의 다른 글
제4장 범주형 자료의 분석 - 4.3 로짓분석 (0) | 2017.01.04 |
---|---|
제4장 범주형 자료의 분석 - 4.2.4 대응자료 및 사례 - 대조군 검정 (0) | 2016.12.29 |
제4장 범주형 자료의 분석 - 4.2.2 독립성 검정 (카이제곱 검정) (0) | 2016.11.08 |
제4장 범주형 자료의 분석 - 4.2 범주형 자료의 검정(카이제곱 검정) (0) | 2016.11.04 |
제4장 범주형 자료의 분석 - 4.1 범주형 자료와 분할표 (0) | 2016.11.04 |