2장 독립표본 두 모평균 차이 추론 two sample test

KNOU/2 실험 계획과 응용 2016. 10. 12. 09:59

2.2 독립표본을 이용한 두 모평균 차이에 대한 추론. Two-sample T-test

독립표본을 바탕으로 두 개의 모집단의 평균을 비교. 가장 흔한 실험 연구는 실험군과 대조군에 서로 다른 개입(intervention)을 적용시킨 후 두 집단의 평균이 같은지를 비교하여 개입 효과의 차이를 평가하는 것이다. 이 경우 two-sample t-test를 사용하는데, 서로 독립적인 두 변수 간에 차이의 평균이 0인지를 검정한다.

Two-sample t-test는 다음 순서를 따른다.

1) 두 집단의 분산이 같은지 검정한다. var.test(y~그룹변수)

2) 분산이 다르면 Welch의 t-test를 적용한다. t.test(y~그룹변수)

3) 분산이 같으면 pooled variance를 이용한 t-test를 적용한다. t.test(y~그룹변수, var.equal=TRUE)

예제) 제약회사에서 어떤 약을 오래 보관해도 약효가 지속되는지를 검사하려고 한다. 표본1과 2를 랜덤추출한 결과가 아래와 같다.

표본1	10.2	10.5	10.3	10.8	9.8	10.6	10.7	10.2	10.0	10.1
표본2	9.8	9.6	10.1	10.2	10.1	9.7	9.5	9.6	9.8	9.9

> medical<-read.csv('medical.csv',header=T)

> head(medical,3)

sample result

1 sample1 10.2

2 sample1 10.5

3 sample1 10.3

> tail(medical,3)

sample result

18 sample2 9.6

19 sample2 9.8

20 sample2 9.9

> boxplot(result~sample,data=medical)

-> 해석: Sample1의 분산이 sample2보다 더 큼을 알 수 있다.

#two sample test 1. 등분산 검정

> var.test(result~sample,data=medical)

F test to compare two variances

data: result by sample

F = 1.7965, num df = 9, denom df = 9, p-value = 0.3959

alternative hypothesis: true ratio of variances is not equal to 1

95 percent confidence interval:

0.4462364 7.2328801

sample estimates:

ratio of variances

1.796545

귀무가설 H0: σ²1 = σ²2

대립가설 H1: σ²1 ≠ σ²2

검정통계량 F(df1=9, df2=9) = 1.7965

p-value = 0.3959

결정 : 귀무가설 기각할 수 없다. 등분산을 가정한다.

> 1/1.7965 #F값 1.7965의 역수는 0.55로 sample2의 분산이 sample1대비 0.55배임을 알 수 있다.

[1] 0.5566379

#two sample test 2. 분산이 같은 경우, pooled variance사용

> t.test(result~sample,var.equal=TRUE,data=medical)

Two Sample t-test

data: result by sample

t = 3.8511, df = 18, p-value = 0.00117

alternative hypothesis: true difference in means is not equal to 0

95 percent confidence interval:

0.222688 0.757312

sample estimates:

mean in group sample1 mean in group sample2

10.32 9.83

귀무가설 H0: μ1 = μ2

대립가설 H1: μ1 ≠ μ2

검정통계량 t(df=18) = 3.8511

p-value = 0.00117

결정 : 귀무가설 기각한다. 두 모집단의 평균이 다르다.

#two sample test 3. 분산이 다른 경우, Welch의 t-test를 한다.

> t.test(result~sample,data=medical)

출처: 실험계획과 응용, R로 하는 통계 분석

'KNOU > 2 실험 계획과 응용' 카테고리의 다른 글

6장 회귀분석과 공분산분석 (0)	2016.10.17
4장 이원배치법, 이원분산분석, two way anova (0)	2016.10.17
3장 일원배치법, 일원분산분석, one way anova (0)	2016.10.12
2장 짝지어진 비교 Paired T-Test (1)	2016.10.12

Posted by 마르띤

데이터마이너를 꿈꾸며

2장 독립표본 두 모평균 차이 추론 two sample test

'KNOU > 2 실험 계획과 응용' 카테고리의 다른 글

링크

카테고리

최근에 올라온 글

최근에 받은 트랙백

글 보관함

티스토리툴바