2.2 독립표본을 이용한 두 모평균 차이에 대한 추론. Two-sample T-test
독립표본을 바탕으로 두 개의 모집단의 평균을 비교. 가장 흔한 실험 연구는 실험군과 대조군에 서로 다른 개입(intervention)을 적용시킨 후 두 집단의 평균이 같은지를 비교하여 개입 효과의 차이를 평가하는 것이다. 이 경우 two-sample t-test를 사용하는데, 서로 독립적인 두 변수 간에 차이의 평균이 0인지를 검정한다.
Two-sample t-test는 다음 순서를 따른다.
1) 두 집단의 분산이 같은지 검정한다. var.test(y~그룹변수)
2) 분산이 다르면 Welch의 t-test를 적용한다. t.test(y~그룹변수)
3) 분산이 같으면 pooled variance를 이용한 t-test를 적용한다. t.test(y~그룹변수, var.equal=TRUE)
예제) 제약회사에서 어떤 약을 오래 보관해도 약효가 지속되는지를 검사하려고 한다. 표본1과 2를 랜덤추출한 결과가 아래와 같다.
표본1 |
10.2 |
10.5 |
10.3 |
10.8 |
9.8 |
10.6 |
10.7 |
10.2 |
10.0 |
10.1 |
표본2 |
9.8 |
9.6 |
10.1 |
10.2 |
10.1 |
9.7 |
9.5 |
9.6 |
9.8 |
9.9 |
> medical<-read.csv('medical.csv',header=T)
> head(medical,3)
sample result
1 sample1 10.2
2 sample1 10.5
3 sample1 10.3
> tail(medical,3)
sample result
18 sample2 9.6
19 sample2 9.8
20 sample2 9.9
> boxplot(result~sample,data=medical)
-> 해석: Sample1의 분산이 sample2보다 더 큼을 알 수 있다.
#two sample test 1. 등분산 검정
> var.test(result~sample,data=medical)
F test to compare two variances
data: result by sample
F = 1.7965, num df = 9, denom df = 9, p-value = 0.3959
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.4462364 7.2328801
sample estimates:
ratio of variances
1.796545
귀무가설 H0: σ21 = σ22
대립가설 H1: σ21 ≠ σ22
검정통계량 F(df1=9, df2=9) = 1.7965
p-value = 0.3959
결정 : 귀무가설 기각할 수 없다. 등분산을 가정한다.
> 1/1.7965 #F값 1.7965의 역수는 0.55로 sample2의 분산이 sample1대비 0.55배임을 알 수 있다.
[1] 0.5566379
#two sample test 2. 분산이 같은 경우, pooled variance사용
> t.test(result~sample,var.equal=TRUE,data=medical)
Two Sample t-test
data: result by sample
t = 3.8511, df = 18, p-value = 0.00117
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.222688 0.757312
sample estimates:
mean in group sample1 mean in group sample2
10.32 9.83
귀무가설 H0: μ1 = μ2
대립가설 H1: μ1 ≠ μ2
검정통계량 t(df=18) = 3.8511
p-value = 0.00117
결정 : 귀무가설 기각한다. 두 모집단의 평균이 다르다.
#two sample test 3. 분산이 다른 경우, Welch의 t-test를 한다.
> t.test(result~sample,data=medical)
출처: 실험계획과 응용, R로 하는 통계 분석
'KNOU > 2 실험 계획과 응용' 카테고리의 다른 글
6장 회귀분석과 공분산분석 (0) | 2016.10.17 |
---|---|
4장 이원배치법, 이원분산분석, two way anova (0) | 2016.10.17 |
3장 일원배치법, 일원분산분석, one way anova (0) | 2016.10.12 |
2장 짝지어진 비교 Paired T-Test (1) | 2016.10.12 |