본문 바로가기
시리즈 강의/확률론

순서 통계량(Order Statistics)

by 취미수학 2026. 4. 3.

 

순서 통계량(Order Statistics)

원활한 이해를 위해 예시를 보자.
 
예제) 6개의 센서가 달린 기계가 있다. 각 센서의 수명 $X_i$는 $[0,10]$(시간) 구간에서 균등분포(Uniform Distribution)를 따른다. 이 기계는 네 개의 센서가 고장나는 순간 셧다운된다. 이 기계가 5시간 이전에 셧다운될 확률을 구하시오.
 
각각의 센서의 수명은 상식적으로 독립이다. 하지만 이 기계의 셧다운 여부는 센서가 4개 고장나는지의 여부에 달렸다. 즉, 기계의 셧다운 여부라는 제약 조건 때문에 6개의 센서들의 수명은 종속관계가 된다.
 
편의상 기계에 달린 센서들의 수명을 왼쪽에 달린 것부터 $X_1$, $X_2$, $X_3$, $X_4$, $X_5$, $X_6$이라고 하자. 그런데 왼쪽에 달렸다고 먼저 수명이 다하는 것이 아니기 때문에 첫번째로 죽는 센서를 $X_1$이라고 놓으면 안 된다. 그래서 다음과 같이 표현한다.
 

$X_{(1)}$ : 첫번째로 죽는 센서의 수명
$X_{(2)}$ : 두번째로 죽는 센서의 수명
$\cdots$
$X_{(6)}$ : 여섯번째로 죽는 센서의 수명

 
해석학으로 보면 수열 재배열(Rearrangement of Sequences)과 비슷하다.
 
이처럼 확률변수로 정의되는 수학적 대상들 중 이벤트가 일어나는 순서가 중요한 개념을 '순서 통계량(Order Statistics)'라 한다.
 
 

예제의 풀이

위 상황에서는 다음과 같은 부등식이 성립한다.
 

$X_{(1)} \leq X_{(2)} \leq X_{(3)} \leq X_{(4)} \leq X_{(5)} \leq X_{(6)} $

 
5시간 이전에 기계가 셧다운 된다는 것은 네번째로 죽는 센서의 수명이 5시간 이하라는 것이므로 확률은 다음과 같이 쓸 수 있다.
 

$P(X_{(4)} \leq 5)$

 
$X_{(i)} \sim \text{Uni}(0,10)$이므로 누적분포함수 $F$는 $F(x) = \dfrac{x}{10}$이다. (정의역은 $[0,10]$)
 
기계가 5시간 이내로 셧다운되려면 5시간 이내에 센서가 4개, 5개, 6개가 죽는 경우이다. 그리고 하나의 센서가 5시간 이내로 죽을 확률은 $F(5)$이고 5시간 이상 살 확률은 $1-F(5)$이므로 계산은 다음과 같다.
 

$ P(X_{(4)} \leq 5) = \displaystyle \sum_{k=4}^{6} {6 \choose k} \{ F(5) \}^{k} \{ 1 - F(5) \}^{6-k}$

 
$F(5) = \dfrac{1}{2}$이고 $1-F(5) = \dfrac{1}{2}$이므로 계산하면, $22 \times \dfrac{1}{64} = 0.34375$이므로 약 $34\%$이다.
 
${6 \choose k}$가 나온 이유는 6개의 센서들 중에 죽을 것들을 선택하는 경우의 수이기 때문이다.
 
 

그런데... 굳이?

그런데 위에서 제시한 예제는 '확률과 통계'를 잘 공부한 학생이라면 순서 통계량이라는 멋드러진 개념없이도 풀 수 있는 문제다. 사실 대부분의 순서 통계량 문제가 그렇긴 하다. 그렇다면 굳이 저런 이름을 붙여서 공부할 이유가 있을까?
 

당연히 있다.

 
만약 순서 통계량이라는 용어와 $X_{(k)}$와 같은 개념이 없다면 관련 문제들을 주먹 구구식으로 풀어야 하지만 용어와 기호가 존재하면 순서에 대한 종속성이 있는 상황들을 예쁘게 형식화할 수 있다. 게다가 우리가 겪는 대부분의 사건들은 한 사람이 일어난 후에 다른 사건이 연달아 일어나는 경우기 때문에 수 많은 종속성 중에서도 순서 종속성(Order Dependency)를 특별히 다룰 필요가 있다. 뒤에 배울 Markov chain, Renewal theory, Queuing theory, Reliability theory 등이 그렇다.
 
 

연습문제

어느 공장에서 생산되는 전구의 수명 $X$는 지수분포(Exponential Distribution)을 따르며, 누적분포함수(CDF)는 다음과 같다고 가정하자.
 

$F(x) = 1 - e^{-x}$ $(x \geq 0)$

 
이 공장에서 생산된 전구 5개를 무작위로 추출하여 동시에 켰을 때, 5개의 전구 중 두 번째로 빨리 꺼지는 전구의 수명을 $X_{(2)}$라 할 때, 이 전구가 1시간 이상 버틸 확률을 구하시오. (단, 각 전구의 수명은 서로 독립입니다.)