
저번 글에 이어 관측 데이터가 나올 수 있는 집단이 두 개인 경우를 다뤄보겠다.
$G_1 \sim N(0,1^2)$이고 $G_2 \sim N(2, 1^2)$입니다. 새로운 관측 데이터 $x=1$이 주어졌을 때, 이 데이터가 $G_1$에 속할 확률과 $G_2$에 속할 확률은 각각 $\pi_1 = 0.4$, $\pi_2 = 0.6$입니다. 이 데이터가 정말 $G_1$에서 나왔을 가능성(우도)를 구하세요.(확률밀도함수는 각각 $f_1(x)$, $f_2(x)$라 한다)
이 데이터는 다음과 같은 두 가지 가능성이 있다.
① $G_1$소속인 경우
$G_1$소속일 가능성은 $\pi_1$이고 $G_1$소속으로서 관측될 가능성은 $f_1(1)$이다.
② $G_2$소속인 경우
$G_2$소속일 가능성은 $\pi_2$이고 $G_2$소속으로서 관측될 가능성은 $f_2(1)$이다.
따라서 이 데이터가 관측될 가능성은
$\pi_1 f_1(1) + \pi_2 f_2(1)$
이므로 이 가운데 사실은 $G_1$이었을 가능성은
$\dfrac{ \pi_1 f_1(1) }{ \pi_1 f_1(1) + \pi_2 f_2(1) }$
이다.
$f_1(x) = \dfrac{1}{\sqrt{2\pi}} e^{-\frac{ x^2 }{ 2 } } $이므로 $f_1(1) = \dfrac{1}{\sqrt{2\pi}} e^{-\frac{1}{2}}$
$f_2(x) = \dfrac{1}{\sqrt{2\pi}} e^{-\frac{(x-2)^2}{2}}$이므로 $f_2(1) = \dfrac{1}{\sqrt{2\pi}} e^{-\frac{1}{2}}$
$f_1(1) = f_2(1)$이므로 분자분모에서 약분하면 답은 $\pi_1=0.4$이다. 따라서 가능성은 0.4
연습문제
$G_1 \sim N(0,1^2)$이고 $G_2$는 $\lambda=1$인 지수분포를 따릅니다. 데이터 $x=0$이 관측되었을 때, 이 데이터가 $G_1$과 $G_2$에 속할 확률은 각각 $\pi_1=0.3$, $\pi_2=0.7$입니다. $x$가 $G_2$에 속할 확률을 구하세요.
자, 아직까지는 쉽다. 그런데 현실에서는 $G_1$과 $G_2$에 속할 확률 $\pi_1$과 $\pi_2$를 모르는 경우가 대부분이다. 사실 모집단의 파라미터를 아예 모르는 것이 현실이기도 하다. 이럴 때는 어떻게 해야할까?
'단편 강의' 카테고리의 다른 글
| 이 데이터, 여기서 나왔을 확률은? - Membership Problem(4) (0) | 2026.04.14 |
|---|---|
| 이 데이터, 여기서 나왔을 확률은? - Membership Problem(3) (0) | 2026.04.14 |
| 이 데이터, 여기서 나왔을 확률은? - Membership Problem(1) (0) | 2026.04.13 |
| 최대우도추정(Maximum Likelihood Estimation) (0) | 2026.04.13 |
| EM 알고리즘의 수렴성 (0) | 2026.04.09 |