
이곳에서는 연속확률변수의 경우만 다룬다.(이 경우가 어려우므로)
두 확률변수 $X$와 $Y$를 동시에 고려하는 사건의 결합확률밀도함수(Joint Probability Density Function)를 $f(x,y)$라 하자. 그렇다면
$U=u(X,Y)$, $V=v(X,Y)$
위와 같이 변수변환을 하게 되면 , 새로운 확률변수 $U$와 $V$의 결합확률밀도함수 $g(u,v)$는 어떻게 구할지 알아보자.
아이디어는 다음과 같다.
$X$, $Y$와 $U$, $V$가 함수 관계에 있으므로 $f(x,y)$를 적절히 변형하면 얻을 수 있지 않을까?
그러면 역함수 정리(Inverse Function Theorem)에 의해 $X=h_1(U,V)$와 $Y=h_2(U,V)$를 만족하는 함수 $h_1$과 $h_2$가 존재하므로 $f(x,y)$를 다음과 같이 변형할 수 있다.
$f(x,y) = f(h_1(u,v), h_2(u,v))$
그렇다면
$g(u,v) = f(h_1(u,v), h_2(u,v))$
라고 결론 내릴 수 있을까?
아니다. 문제가 하나있다. $g(u,v)$는 확률밀도함수이기 때문에
$\displaystyle \iint g(u,v) dudv = 1$
이지만
$\displaystyle \iint f(h_1(u,v), h_2(u,v)) dudv \neq 1$
이다. 왜냐면 $dxdy \neq dudv$이기 때문이다.
따라서 $J(u,v)dxdy = dudv$를 만족하는 스케일링 인자 Jacobian을 찾아야 한다. (이 부분은 자코비안에 대한 단편강의 (1), (2), (3), (4)에서 다루므로 참고하길 바란다)
$J(u,v) = \begin{vmatrix} \dfrac{\partial u}{\partial x} & \dfrac{\partial u}{\partial y} \\ \dfrac{\partial v}{\partial x} & \dfrac{\partial v}{\partial y} \end{vmatrix}$
이므로 새로운 결합확률밀도함수는 다음과 같다.
$g(u,v) = f(h_1(u,v), h_2(u,v))|J|^{-1}$
예시) $X$와 $Y$가 독립이고 각각 파라미터가 $(\alpha, \lambda)$, $(\beta, \lambda)$ 감마 분포를 따른다. 새롭게 정의한 확률변수 $U=X+Y$와 $V=\dfrac{X}{X+Y}$의 결합확률분포의 확률밀도함수를 찾으시오.
우선 $X$와 $Y$가 독립이므로 $f(x,y) = f_X(x)f_Y(y)$이다. 즉, 각각의 확률밀도함수의 곱으로 나타낼 수 있으므로
$f(x,y) = \dfrac{\lambda e^{-\lambda x}(\lambda x)^{\alpha-1}}{\Gamma(\alpha)} \cdot \dfrac{\lambda e^{-\lambda y}(\lambda y)^{\beta-1}}{\Gamma(\beta)} $
이다. 이제 $x$와 $y$를 $u$와 $v$로 바꾸자. 주어진 대응관계를 잘 연립하면
$ \begin{cases} \begin{aligned} x&=u \\ y&=u(1-v) \end{aligned} \end{cases}$
이다. 이제 Jacobian을 구해보자.
$u(x,y)=x+y$이고 $v(x,y)=\dfrac{x}{x+y}$이므로
$J(u,v) = \begin{vmatrix} 1 & 1 \\ \dfrac{y}{(x+y)^2} & \dfrac{-x}{(x+y)^2} \end{vmatrix} = -\dfrac{1}{x+y} = -\dfrac{1}{u}$
이다. 이제 $U$와 $V$의 결합확률밀도함수를 구해보자.
$g(u,v) = f(h_1(u,v), h_2(u,v)) \cdot |J|^{-1} = f(uv, u(1-v)) \cdot u$
이므로 모두 대입하면
$g(u,v) = \dfrac{\lambda e^{-\lambda uv} (\lambda uv)^{\alpha-1} }{\Gamma(\alpha)} \cdot \dfrac{\lambda e^{-\lambda u(1-v)} (\lambda u(1-v))^{\beta-1} }{\Gamma(\beta)}$
우변을 잘(!) 정리하면 $u$에 대한 함수와 $v$에 대한 함수의 곱 형태로 바꿀 수 있다.
$g(u,v) = \dfrac{\lambda e^{-\lambda u} (\lambda u)^{\alpha+\beta-1} }{\Gamma(\alpha+\beta)} \cdot \dfrac{v^{\alpha-1}(1-v)^{\beta-1}\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)} $
즉, $U$와 $V$의 확률밀도함수는 각각
$ \begin{cases} \begin{aligned} g_U(u) &= \dfrac{\lambda e^{-\lambda u} (\lambda u)^{\alpha+\beta-1} }{\Gamma(\alpha+\beta)} \\ g_V(v) &= \dfrac{v^{\alpha-1}(1-v)^{\beta-1}\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)} \end{aligned} \end{cases}$
이다. 게다가 $U$와 $V$의 결합확률밀도함수가 각각의 확률밀도함수의 곱으로 표현되므로 $U$와 $V$가 독립이라는 사실도 알아낼 수 있다.
($U$는 파라미터가 $(\alpha+\beta, \lambda)$인 감마분포를, $V$는 파라미터가 $(\alpha, \beta)$인 베타분포를 따른다.)
'시리즈 강의 > 확률론' 카테고리의 다른 글
| 우연은 얼마나 우연일까? - 포아송 분포로 보는 우연의 우연성 (0) | 2026.05.21 |
|---|---|
| 순서 통계량(Order Statistics) (0) | 2026.04.03 |
| 지시 확률 변수(4) (0) | 2026.03.31 |
| 지시 확률 변수(3) (0) | 2026.03.31 |
| 지시 확률 변수(2) (0) | 2026.03.31 |