본문 바로가기

Probability

Discrete random variable

지난 포스팅에는 확률변수(random variable)의 정의에 대해서 작성했는데, 이번 포스팅에는 확률변수 중에서도

 

셀 수 있는(Counting) 확률변수인 이산 확률변수(discrete random variable)에 대해 작성해보겠다.

 

예를들어, 두개의 주사위를 던졌을때 나온 수의 합이나, 어떤 가게에 방문하는 고객들의 수와 같은 것들은

 

우리가 직관적으로 셀 수 있는 것(counting)을 알 수 있다. 이러한 확률변수들을 우리는 이산 확률변수라고 한다. 

 

한편, 이러한 이산 확률변수 X에 대해서, X의 확률 질량 함수(probability mass function) $p(a)$를 아래와 같이 정의 한다.

$$ p(a) = P\left\{X=a \right\} $$

확률 질량함수 $p(a)$는 a가 가질 수 있는 모든 셀 수 있는 값에 대해 양의 값을 가진다. 

 

즉, 만약 확률변수 X가 $x_1, \; x_2, \; \cdots $ 의 값 중 하나라고 가정한다면, 아래를 만족한다. 

$$ \begin{align} p( x_i )  &> 0 \  &&i \; = 1, \; 2, \; \ldots  \\ p(x) &= 0  \ && \text{all other values of}\; x \end{align}$$그리고 확률변수 X가 $x_i$ 중 하나의 값을 갖기 때문에 $\sum_{i=1}^\infty p(x_i) = 1$을 만족하며, 누적 분포함수 F는 $p(a)$를 이용하여

 

아래와 같이 표현 될 수 있다.

$$ F(a) \; = \; \sum_{all \; x_i \leq a} p(x_i) $$

예를 들어 확률변수 X가 아래와 같은 확률 질량함수(pmf)가 주어진다면

$$ p(1) = \frac{1}{2}, \quad p(2) = \frac{1}{3}, \quad p(3) = \frac{1}{6}$$확률변수 X의 누적 분포 함수(cdf)는 아래와 같다. 

$$F(a) = \begin{Bmatrix} 0, && a < 1 \\ \frac{1}{2}, &&1 \leq a < 2 \\  \frac{5}{6}, &&2 \leq a < 3 \\ 1, &&3 \leq a \end{Bmatrix}$$

이산 확률변수(discrete random variable) 중에서도 대표적인 Bernoulli, Binomial 에 대해서 알아보자. 

Bernoulli random variable

결과가 '성공(Success)' 또는 '실패(Failure)' 로 구분되는 결과를 가지는 실험(Experiment) 또는 시도(Trial)를 가정해보자. 

만약 실험 결과가 '성공'이면 확률변수 X가 1이고, 실험결과가 '실패'이면 확률변수 X가 0이라고 할 때,

이러한 확률변수 X의 확률 질량 함수(pmf)는 아래와 같이 주어진다.
$$ \begin{align} &p(0) = P\left\{X=0 \right\} =1-p \\ &p(1) = P\left\{X=1 \right\} = p \end{align}$$여기서 $p$는 실험 결과가 '성공'으로 나올 확률을 의미한다. 

만약 확률변수 X의 확률 질량 함수가 위에서 언급된 것처럼 주어진다면,

이러한 확률변수 X를 Bernoulli random variable이라고 한다. 

 

Binomial random variable

결과가 '성공(Success)'일 확률이 $p$이고, '실패(Failure)'일 확률이 $1-p$인 실험(Experiment) 또는 시도(Trial)를

독립적으로 n번 시행한다고 가정해보자. (참고로 Bernoulli는 실험을 1번만 하지만, Binomial은 실험을 n번 시행을 가정)

만약 확률변수 X가 n번의 실험에서 '성공(Success)'이 나온 횟수라고 할때, 이러한 확률변수 X를 파라미터가 $(n,p)$인

binomial random variable이라고 한다. 

파라미터가 $(n,p)$인 binomial random variable의 확률 질량 함수는 아래와 같이 주어진다. 
$$ p(i) = \begin{pmatrix} n \\ i \end{pmatrix} p^i (1-p)^{n-i}, \quad i = 0, 1, \ldots,n, \quad \text{where} \begin{pmatrix} n \\ i \end{pmatrix} = \frac{i!}{(n-i)! i!} $$한편 Binomial random variable에 대해서 확률 질량 함수의 합은 1이며 아래식이 성립한다.
$$ \sum_{i=0}^\infty p(i) = \sum_{i=0}^n \begin{pmatrix} n \\ i \end{pmatrix} p^i (1-p)^{n-i} = (p+(1-p))^n = 1 $$
<Example - Problem>
앞,뒷면에 나올 확률이 동일한 동전을 4번 던진다고 하자.
만약 각 결과가 서로 독립적이라면, 앞면과 뒷면이 각각 두번씩 나올 확률은 얼마인가?

<Example - Solution>
확률변수 X를 앞면이 나올 횟수라고 하자. 그러면 확률변수 X는 binomial random variable이고 이때 파라미터가 $(n,p) = (4, \frac{1}{2} ) $이다. 따라서 위에서 정의한 확률 질량함수에 의해 아래와 같이 구할 수 있다.
$$ P \left\{ X=2 \right\} = \begin{pmatrix} 4\\2 \end{pmatrix} \begin{pmatrix} 1\\2 \end{pmatrix}^2 \begin{pmatrix} 1\\2 \end{pmatrix}^2 = \; \frac{3}{8} $$

 

다음 포스팅에서는 이산 확률변수인 geometric random variable과 poisson random variable에 대해서 작성해보겠다.