본문 바로가기
단편 강의

이 데이터, 여기서 나왔을 확률은? - Membership Problem(2)

by 취미수학 2026. 4. 13.

 

저번 글에 이어 관측 데이터가 나올 수 있는 집단이 두 개인 경우를 다뤄보겠다.

 

$G_1 \sim N(0,1^2)$이고 $G_2 \sim N(2, 1^2)$입니다. 새로운 관측 데이터 $x=1$이 주어졌을 때, 이 데이터가 $G_1$에 속할 확률과 $G_2$에 속할 확률은 각각 $\pi_1 = 0.4$, $\pi_2 = 0.6$입니다. 이 데이터가 정말 $G_1$에서 나왔을 가능성(우도)를 구하세요.(확률밀도함수는 각각 $f_1(x)$, $f_2(x)$라 한다)

 

이 데이터는 다음과 같은 두 가지 가능성이 있다.

 

① $G_1$소속인 경우

$G_1$소속일 가능성은 $\pi_1$이고 $G_1$소속으로서 관측될 가능성은 $f_1(1)$이다.

 

② $G_2$소속인 경우

$G_2$소속일 가능성은 $\pi_2$이고 $G_2$소속으로서 관측될 가능성은 $f_2(1)$이다.

 

따라서 이 데이터가 관측될 가능성은

 

$\pi_1 f_1(1) + \pi_2 f_2(1)$

 

이므로 이 가운데 사실은 $G_1$이었을 가능성은

 

$\dfrac{ \pi_1 f_1(1) }{ \pi_1 f_1(1) + \pi_2 f_2(1) }$

 

이다.

 

$f_1(x) = \dfrac{1}{\sqrt{2\pi}} e^{-\frac{ x^2 }{ 2 } } $이므로 $f_1(1) = \dfrac{1}{\sqrt{2\pi}} e^{-\frac{1}{2}}$

 

$f_2(x) = \dfrac{1}{\sqrt{2\pi}} e^{-\frac{(x-2)^2}{2}}$이므로 $f_2(1) = \dfrac{1}{\sqrt{2\pi}} e^{-\frac{1}{2}}$

 

$f_1(1) = f_2(1)$이므로 분자분모에서 약분하면 답은 $\pi_1=0.4$이다. 따라서 가능성은 0.4

 

연습문제

$G_1 \sim N(0,1^2)$이고 $G_2$는 $\lambda=1$인 지수분포를 따릅니다. 데이터 $x=0$이 관측되었을 때, 이 데이터가 $G_1$과 $G_2$에 속할 확률은 각각 $\pi_1=0.3$, $\pi_2=0.7$입니다. $x$가 $G_2$에 속할 확률을 구하세요.

 

 

 

자, 아직까지는 쉽다. 그런데 현실에서는 $G_1$과 $G_2$에 속할 확률 $\pi_1$과 $\pi_2$를 모르는 경우가 대부분이다. 사실 모집단의 파라미터를 아예 모르는 것이 현실이기도 하다. 이럴 때는 어떻게 해야할까?