예제 1. 우리나라 여성 전체의 평균 키는 160cm 이고, 분산은 200이라고 한다. 10,000명을 표본으로 하여 조사한 결과 평균 169cm 를 얻었다. 우리나라 여성의 평균 키가 160cm 라고 할 수 있을까?
예제 2. 우리나라 여성의 평균키는 160cm 라고 한다. 이에 대한 가설을 검정하기 위하여 10,000명을 표본으로 하여 조사한 결과, 평균 169cm, 분산 300을 얻었다. 우리나라 여성의 평균 키가 160cm 라고 할 수 있는가?
예제 1과 같이 모집단 분산을 알고 있는 경우와, 예제 2와 같이 모집단 분산을 알지 못하는 경우에 모집단 평균에 대한 가설검정방법은 서로 다르다. 그러므로 앞으로 1 ) 모집단 분산을 알고 있는 경우와, 2 ) 모집단 분산을 알지 못하는 경우를 구분하여 설명하도록 한다.
1. 귀무가설과 대립가설
2. 유의수준의 결정
3. 채택영역과 기각영역 : 임계값 <img src="https://saylordotorg.github.io/text_introductory-statistics/section_12/72f0cd42fda04cdfb0341bcfe11601c1.jpg", width=600>
4. 통계량의 계산과 임계값과의 비교
5. 결과의 해석
예제 1. 통조림회사에서 수출용 과일통조림을 생산하는데, 그 통조림의 무게가 $16$온스며, 무게의 분포가 정규분포라 한다. 그러나 해외에서는 통조림 무게가 $16$온스가 아니라는 불평이들어오고 있다. 회사측에서는 이를 확인하기 위하여 $25$개래의 통조림을 표본으로 뽑아 평균을 조사하여 본 결과, $\bar{X}=15.5$온스였다. 모집단의 표준편차는 $1.5$온스라는 것을 과거의 경험으로 알고 있다고 하자. $\alpha=0.05$로 하면, 위의 결과로부터 이 회사의 통조림 무게가 $16$온스라고 말할 수 있겠는가?
In [2]:
plt.show()
양측검정
$$ \begin{align} ①&\quad H_{0} : \mu = 16 \\ &\quad H_{a} : \mu \ne 16 \\ ②&\quad \alpha = 0.05 ( 5\% ) \\ ③&\quad 채택영역 : -1.96 \le Z \le 1.96 \\ &\quad 기각영역 : Z < -1.96 또는 Z > 1.96 \\ ④&\quad \bar{X}=15.5에 해당하는 Z 값\\ &\quad Z = \frac{\bar{X}-\mu}{\sigma_{\bar{X}}} = \frac{15.5-16}{0.3} = -1.67 \\ &\quad Z = -1.67 은 채택영역 안에 있으므로 H_{0}를 기각할 수 없다. \\ ⑤& \quad 따라서 통조림의 무게가 16온스라고 주장할 수 있다. \end{align} $$단측검정
what if ?
예제 2. 어느 도시에서는 유치원 교사의 이직률이 높아 평균 재직기간이 $\mu=20$개월이라 한다. 실제로 그러한지를 알아보기 위해 유치원 교사 $10$명을 뽑아 재직기간을 조사해 보았더니 다음 $표 11-3$과 같았다. $\mu = 20$개월이라는 가설을 $\alpha=0.05$ 수준에서 양측검정과 단측검정을 하라. 유치원 교사의 재직기간은 개월로 표시하여 정규분포를 이룬다고 가정한다.
교사 | 재직기간($X_{i}$) | $X_{i}$ - $\bar{X}$ | $(X_{i}$ - $ \bar{X})^{2}$ |
---|---|---|---|
A | 16 | -7 | 49 |
B | 28 | 5 | 25 |
C | 20 | -3 | 9 |
D | 34 | 11 | 121 |
E | 22 | -1 | 1 |
F | 18 | -5 | 25 |
G | 30 | 7 | 49 |
H | 22 | -1 | 1 |
I | 25 | 2 | 4 |
J | 15 | -8 | 64 |
합계 | 230(개월) | 348 |
양측검정
$$ \begin{align} ①&\quad H_{0} : \mu = 20 \\ &\quad H_{a} : \mu \ne 20 \\ ②&\quad \alpha = 0.05 ( 5\% ) \\ ③&\quad \alpha/2=0.025고, 자유도 n-1=9 일 때 t-분포표를 보면, \\ &\quad 채택영역 : -2.262 \le t \le 2.262 \\ &\quad 기각영역 : t < -2.262 또는 t > 2.262 \\ ④&\quad \bar{X}=23에 해당하는 t 값\\ &\quad t = \frac{\bar{X}-\mu}{S_{\bar{X}}} = \frac{23-20}{1.96} = 1.53 \\ &\quad t = 1.53 은 채택영역 안에 있으므로 H_{0}를 기각할 수 없다. \\ ⑤& \quad 따라서 유치원 교사의 평균 재직기간이 20개월이라 주장할 수 있다. \end{align} $$단측검정
모집단의 분산을 알고 있을 때 | 표본이 클 때 $(n \ge 30)$ |
표본이 작을 때 $(n < 30)$ |
---|---|---|
모집단이 정규분포 | $Z-분포$ | $Z-분포$ |
모집단이 비정규분포 | $Z-분포$ | - |
모집단의 분산을 모를 때 | 표본이 클 때 $(n \ge 30)$ |
표본이 작을 때 $(n < 30)$ |
---|---|---|
모집단이 정규분포 | $Z-분포$ | $t-분포$ |
모집단이 비정규분포 | $Z-분포$ | - |
<img src="http://cfile24.uf.tistory.com/image/270CFE3D548D4F0421B054", width=350>
<img src="http://cfile237.uf.daum.net/image/2255074A5192E82A031593", width=350>
양측검정
$$ \begin{align} & 채택영역 \quad \quad \chi^{2}_{\alpha/2} \le \frac{(n-1) \cdot S^{2}}{\sigma^{2}} \le \chi^{2}_{1-\alpha/2} \\ & 기각영역 \quad \quad \quad \chi^{2}_{\alpha/2} > \frac{(n-1) \cdot S^{2}}{\sigma^{2}} \\ & \quad \quad \quad 또는 \quad \chi^{2}_{1-\alpha/2} < \frac{(n-1) \cdot S^{2}}{\sigma^{2}} \end{align} $$단측검정 (대립가설이 $H_{a} : \sigma^{2} > q$인 경우)
$$ \begin{align} & 채택영역 \quad \quad \chi^{2}_{1-\alpha} \ge \frac{(n-1) \cdot S^{2}}{\sigma^{2}} \\ & 기각영역 \quad \quad \chi^{2}_{1-\alpha} < \frac{(n-1) \cdot S^{2}}{\sigma^{2}} \\ \end{align} $$단측검정 (대립가설이 $H_{a} : \sigma^{2} < q$인 경우)
$$ \begin{align} & 채택영역 \quad \quad \chi^{2}_{\alpha} \le \frac{(n-1) \cdot S^{2}}{\sigma^{2}} \\ & 기각영역 \quad \quad \chi^{2}_{\alpha} > \frac{(n-1) \cdot S^{2}}{\sigma^{2}} \\ \end{align} $$예제3. 어느 연구소에서 발표한 바에 의하면 우리나라 중소기업의 종업원 임금은 어느 정도 안정되어 있어 임금의 표준편차가 $\sigma$가 $500원$이라고 한다. 그러나 많은 종업원들은 임금격차가 너무 심하기 때문에 표준편차가 이보다 훨씬 크리라고 생각하며, 또 어떤 사람은 전국의 중소기업의 임금수준은 대동소이하여 표준편차가 더 작을 것이라 생각하고 있다. 이를 검정하기 위하여 $51$명을 무작위(random)로 뽑아 그들의 임금을 조사하여 본 결과 표준편차가 $700$원이었다. 종업원 임금은 정규분포를 이룬다고 가정하고 연구소의 발표를 $\alpha=0.10$에서 검정하라. (표준편차 $\sigma=500$은 부산으로 나타내면 $\sigma^{2}=250,000$이다.)
예제4. 어느 고등학교에서는 고교평준화를 시행한 후 이전보다 학생들의 성적이 고르지 않다는 주장을 하고 있다. 평준화 전의 성적의 분산은 $\sigma^{2}=60$이라고 하며, 교육과학부에서는 지금도 전과 마찬가지일 것이라는 주장이다. 한 연구자는 교육과학부의 주장을 검정하기 위하여 $61$명을 선택하여 그 표본의 분산을 계산하여 본 결과 $S^{2}=70$이었다. 그 표본이 $\sigma^{2}=60$인 모집단에서 나온 것이라고 할 수 있는가를 $\alpha=0.10$에서 검정하려 한다. 고등학교의 성적분포는 정규분포라고 가정한다.