
지시 확률 변수가 주는 직관적 난해함
앞의 설명들을 읽고 아무런 지적 거부감이 없다면 다행이지만 나는 다음과 같은 이유로 지시 확률 변수 풀이를 받아들이기 힘들었다.
예5를 보면
$E[X] = \displaystyle E\left[ \sum_{k=1}^{25} I_k \right] = \sum_{k=1}^{25} E[I_k] = 25 \times \left\{ 1 - \left( \dfrac{24}{25} \right)^{10} \right\}$
이렇게 계산을 한다. 그런데 $25$개의 쿠폰을 뽑는게 아닌데 왜 $25$를 곱하는지? 즉, 실제 뽑힌 쿠폰 종류는 최대 $10$이라는 제약조건이 과연 어디에 반영이 된 것인지? 이해가 가지 않았다.
이 글을 쓰는 지금도 직관적으로 이해하진 못했다. 다만, 논리로 이해했을 뿐이다. 그래서 설명이 다소 만족스럽지 못할 수 있음을 미리 알린다. 이유는 다음과 같다.
첫째, 확률 변수 $X$의 표본 공간(Sample space, 시행 결과들의 집합)은 $\{ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 \}$이므로 $X=I_1 + \cdots + I_25$라 하더라도 $X \leq 10$은 자동으로 성립한다.
둘째, $P(I_k=1) = 1 - \left( \dfrac{24}{25} \right)^{10}$에서 지수에 나타난 $10$이 실제 제약 조건이 반영된 결과다.
지시 확률 변수는 만능인가?
지시 확률 변수라고 무조건 좋기만 한 것은 아니다. 지시 확률 변수 기법이 큰 힘을 발휘하는 순간은 기댓값 계산이다. 단순히 확률을 구하는 것이라면 지시 확률 변수도 어려운 것은 마찬가지다. (확률 기호 $P$는 선형성이 없기 때문)
지시 확률 변수가 중요한가?
지시 확률 변수가 그저 특정 문제에 한해 쓰이는 도깨비같은 개념이라면 이해가 잘 안되더라도 적당히 외우고 넘어가도 상관없겠지만 아쉽게도 확률 모델들(예:마르코프 체인 등)을 공부하려면 지시 확률 변수가 중요하다. 실제로 지시 확률 변수는 확률 변수를 다루는 중요한 기법이다.
지시 확률 변수의 철학
지시 확률 변수를 사용하는 행위의 기저에 깔린 아이디어는 문제를 경우의 수 중심으로 푸는 조합론적 아이디어(즉, 행위 중심)가 아닌 결과 중심에 있다. 학생들을 가르칠 때 대부분의 경우의 수 문제들은 행위 중심의 사고방식으로 풀지만 가끔 어려운 문제들은 결과 중심의 사고 방식을 쓰지 않으면 굉장히 난해하다.
혹시..?
모든 평가원 기출을 보진 않았지만 검색해본 결과 아직 지시 확률 변수를 이용하면 쉽게 풀리는 기댓값 문제를 본 적이 없다. 그렇게 대단한 개념이 아니니까 혹시 언젠가 출제될 수 있지 않을까? 싶지만 학생들을 납득시키기는 쉽지 않아 보인다.
'시리즈 강의 > 확률론' 카테고리의 다른 글
| 결합확률분포의 변수변환 (0) | 2026.04.12 |
|---|---|
| 순서 통계량(Order Statistics) (0) | 2026.04.03 |
| 지시 확률 변수(3) (0) | 2026.03.31 |
| 지시 확률 변수(2) (0) | 2026.03.31 |
| 지시 확률 변수(1) (0) | 2026.03.31 |