Ch6. 이산확률분포

  • 이항분포
  • 다항분포

1. 이항분포 ( Binomial Distribution )

베르누이시행 ( Bernoulli Trial )

  • 실험의 결과 또는 표본을 뽑는 결과가 상호배타적인 두 가지 사건만으로 나타나는 경우
    • ex. 동전을 한 번 던지는 실험 => { 앞 , 뒤 }
  • 베르누이시행의 조건
    1. 각 시행의 결과는 상호배타적인 두 사건으로 구분된다. ( 성공 or 실패 )
    2. 각 시행에서 성공의 결과가 나타날 확률은 $p = P(T)$로 나타내며, 실패가 나타날 확률은 $q = P(F) = 1 - p$ 로 나타낸다. 그러므로 각 시행에서 성공이 나타날 확률과 실패가 나타날 확률의 합은 $ p + q = 1$ 이 된다.
    3. 각 시행은 서로 독립적이다. 한 시행의 결과는 다음 시행의 결과에 아무런 영향을 주지 않는다.

베르누이분포 ( Bernoulli Distribution )

This can also be expressed as

<img src="https://wikimedia.org/api/rest_v1/media/math/render/svg/a7523b2ddba75e02e1afe1ba4f5f9f7599305585", >

이항확률변수 ( Binomial Random Variable )

  • 베르누이시행을 여러번 반복한 결과, 성공의 횟수 또는 실패의 횟수를 이항확률변수라 하며 보통 $X$ 로 표시한다

이항분포 ( Binomial (Probability) Distribution )

  • 이항확률변수의 분포는 특정한 확률분포를 갖게 되는데, 이를 이항분포라 한다
  • ex. 동전던지기를 세 번 한다고 할때, 앞면(H)이 나타나게 될 경우의 수를 이항확률변수로 하여, 이항분포를 구하라
결과 첫째 시행 둘째 시행 셋째 시행 앞면의 수($X_{i}$)
1 H H H 3
2 H H T 2
3 H T H 2
4 H T T 1
5 T H H 2
6 T H T 1
7 T T H 1
8 T T T 0
< table. 가능한 결과 >
앞면의 수($X_{i}$) P($X_{i}$)
0 1/8
1 3/8
2 3/8
3 1/8
< table. 이항확률분포 >

이항확률함수

$$ \begin{align} k &: 성공횟수 \\ n &: 시행횟수 \\ p &: 성공확률 \\ 1-p=q &: 실패확률 \\ {n}\choose{k} &: ~_{n}C_{k} \end{align} $$

이항분포의 모양

  1. p = 0.5 일 때, n 이 작더라도 확률분포는 대칭을 이룬다.
  2. p = 0.5 가 아니더라도, n 이 커지면 확률분포는 대칭에 가까워진다.

<br > <img src="http://www.boost.org/doc/libs/1_42_0/libs/math/doc/sf_and_dist/graphs/binomial_pdf_2.png", width=400>

< figure. 서로 다른 성공확률(p) 에 따른 이항분포 >

<br > <img src="http://www.boost.org/doc/libs/1_56_0/libs/math/doc/graphs/negative_binomial_pdf_2.png", width=400>

< figure. 서로 다른 시행횟수(n) 에 따른 이항분포 >

이항분포의 기댓값과 분산

$$ \begin{align} 기댓값 \quad \mu &= E(X) = np \\ 분산 \quad \sigma^{2} &= Var(X) = np(1-p) = npq \\ 표준편차 \quad \sigma &= \sqrt{np(1-p)} = \sqrt{npq} \\ \end{align} $$

Q. 연습문제

  1. 이항분포의 기댓값 공식을 증명하세요
  2. 이항분포의 분산 공식을 증명하세요

Q. 연습문제

  • fair한 동전을 네 번 던져서 앞면이 세 번 이하로 나올 확률은 얼마인가?

2. 다항분포 ( Multinomial Distribution )

  • 실험의 결과 또는 표본을 뽑는 결과가 상호배타적인 k 개의 사건으로 나타나는 경우
    • ex. 주사위를 던지는 실험 => { 1, 2, 3, 4, 5, 6 }

다항확률함수

$$ \begin{align} k &: 발생 가능한 결과 갯수 ( k = 2 이면 이항분포와 같다 ) \\ n &: 전체 시행 횟수 \\ x_{i} &: 각 결과별 발생 횟수 \\ p_{i} &: 각 결과별 확률 \\ \end{align} $$

정답 :

$$ \begin{align} P(X \le 3) &= P(X=0) + P(X=1) + P(X=2) + P(X=3) \\ &= (0.5)^{4} + 4 \dot (0.5)^{4} + 6 \cdot (0.5)^{4} + 4 \cdot (0.5)^{4} \\ &= 0.9375 \end{align} $$