4.2.4 대응자료 및 사례 – 대조군 검정
유권자 |
이전 |
이후 |
1 |
1 |
0 |
2 |
0 |
0 |
3 |
1 |
1 |
. . . |
. . . |
. . . |
100 |
0 |
1 |
선거유세의 효과를 파악하는 방법으로 유권자 100명을 확률표본으로 추출하여 유세 이전의 지지(1=여당, 0 = 야당)와 유세 이후의 지지(1=여당, 0=야당) 데이터를 만들었다. 유세 이전과 이후 유권자의 지지변화가 있었는지 알아보자
데이터를 table로 만들면 아래와 같다.
구분 |
유세이후 |
|||
X2=1 |
X2=0 |
합 |
||
유세이전 |
X1=1 |
63 |
4 |
67 |
X1=0 |
21 |
12 |
33 |
|
합 |
84 |
16 |
100 |
> 선거유세효과<-matrix(c(63,4,21,12),2,2,byrow=T,dimnames=list(유세이전=c('유세전 여당','유세전 야당'),유세이후=c('유세후 여당','유세후 야당')))
> 선거유세효과
유세이후
유세이전 유세후 여당 유세후 야당
유세전 여당 63 4
유세전 야당 21 12
> mcnemar.test(선거유세효과,correct=F) #McNemar 검정, {(21-4)/(21+4)}^2=11.56, 11.56보다 같거나 더 극단적인 값이 나올 확률 0.0006739
McNemar's Chi-squared test
data: 선거유세효과
McNemar's chi-squared = 11.56, df = 1, p-value = 0.0006739
> mcnemar.test(선거유세효과) #연속성 수정
McNemar's Chi-squared test with continuity correction
data: 선거유세효과
McNemar's chi-squared = 10.24, df = 1, p-value = 0.001374
> library(exact2x2)
> exact2x2(선거유세효과,paired=T)
Exact McNemar test (with central confidence intervals)
data: 선거유세효과
b = 4, c = 21, p-value = 0.0009105
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.04753664 0.56452522
sample estimates:
odds ratio
0.1904762
귀무가설: H0 유세 전과 후의 지지율이 같다
대립가설: H1 유세 전과 후의 지지율이 다르다
검정 결과: McNemar 검정 결과 p-값 0.0009105
결론: 귀무가설을 기각, 유세 이전과 이후에 유권자의 지지에 변화가 일어났다.
McNemar 검정은 변화의 유의성 검정 이외에 역학 연구에서 흔히 이루어지는 사례-대조군 연구에도 사용된다. 역학연구에서는 후향연구의 한 형태로 사례-대조군 연구를 실시하고 경우에 따라서 사례에 대한 대조를 1:1 대응으로 찾는 경우가 있다. 다음의 호지킨병과 편도적출(tonsillectomy)자료는 1:1 대응의 사례-대조군 연구 자료이고 McNemar 검정의 좋은 예이다.
[예] 1972년에 편도적출과 호지킨병의 관계를 규명하는 연구보고가 있었다. 미국 국립 암 연구소에서 치료를 받은 174명의 호지킨병 환자들을 사례군으로 하고 환자들의 형제자매 472명을 대조군으로 구성하였다. 그리고 이 자료를 기초로 한 추후의 연구보고에서는 사례와 대조를 1:1 대응으로 하기 위해서 사례 한 명에 대응되는 대조는 나이 차이가 5년 이내이고 같은 성별을 가진 형제자매 중 사례와 나이가 가장 가까운 사람으로 정하였다. 이렇게 하여 85쌍의 사례 – 대조군 자료가 관찰되었다. 호지킨병과 편도적출이 독립적인가를 검정하는 문제를 생각해보자.
> 호지킨병 = matrix(c(26,15,7,37),nrow=2,byrow=T)
> 호지킨병
[,1] [,2]
[1,] 26 15
[2,] 7 37
> dimnames(호지킨병) = list(사례군=c('편도추출 유','편도추출 무'), 대조군=c('편도추출 유','편도추출 무'))
> 호지킨병
대조군
사례군 편도추출 유 편도추출 무
편도추출 유 26 15
편도추출 무 7 37
> 분할표_호지킨병 = addmargins(호지킨병)
> 분할표_호지킨병
대조군
사례군 편도추출 유 편도추출 무 Sum
편도추출 유 26 15 41
편도추출 무 7 37 44
Sum 33 52 85
> mcnemar.test(호지킨병,correct=F) #McNemar 검정
McNemar's Chi-squared test
data: 호지킨병
McNemar's chi-squared = 2.9091, df = 1, p-value = 0.08808
> mcnemar.test(호지킨병) #McNemar 검정(연속성 수정)
McNemar's Chi-squared test with continuity correction
data: 호지킨병
McNemar's chi-squared = 2.2273, df = 1, p-value = 0.1356
> library(exact2x2)
> exact2x2(호지킨병,paired=T)
Exact McNemar test (with central confidence intervals)
data: 호지킨병
b = 15, c = 7, p-value = 0.1338
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.8224084 6.2125863
sample estimates:
odds ratio
2.142857
귀무가설: H0 호지킨병과 편도적출이 독립적이다
대립가설: H1 호지킨병과 편도적출이 독립적이지 않다
검정결과: McNemar 검정결과 p-value 0.1338
결론: a=0.05에서 H0를 기각시키기에 충분한 증거를 제시하지 않는다고 결론
출처: 보건정보데이터 분석(이태림, 이재원, 김주한, 장대흥 공저)
'KNOU > 2 보건 정보 데이터 분석' 카테고리의 다른 글
제5.1장 공분산 분석 - 1. 공변량이 하나인 경우 (0) | 2017.01.06 |
---|---|
제4장 범주형 자료의 분석 - 4.3 로짓분석 (0) | 2017.01.04 |
제2장 보건정보 데이터의 기초분석 (1) | 2016.12.27 |
제4장 범주형 자료의 분석 - 4.2.2 독립성 검정 (카이제곱 검정) (0) | 2016.11.08 |
제4장 범주형 자료의 분석 - 4.2 범주형 자료의 검정(카이제곱 검정) (0) | 2016.11.04 |