본문 바로가기

Probability

Discrete random variable (2) - geometric, poisson

지난번 포스팅에서는 이산 확률변수가 무엇인지, 그리고 이산 확률변수 중 Bernoulli, Binomial random variable에 대해서 알아보았다.

 

이번 포스팅에는 지난시간에 이어, 이산 확률변수의 일종인 geometric, poisson random variable에 대해서

작성해보겠다.

 

1.  Geometric random variable

성공할 확률이 $p$인 실험이 있고 이러한 실험을 독립적으로 여러번 시행한다고 가정하자. 

 

이때 확률변수 X를 가정에서 설명한 실험을 시행했을 때, 첫번째로 실험이 성공했을때의 실험 횟수라고 한다면

 

이러한 확률변수를 파라미터가 $p$인 geometric random variable이라고 하며, 확률 질량 함수는 아래와 같다.

$$ p(n) = p\left\{ X=n \right\} =(1-p)^{n-p}p, \quad n = 1, 2, \ldots $$ geometric random variable의 확률 질량함수는 그 확률변수의 정의를 생각하면 쉽게 이해할 수 있다.

 

실험을 n번 진행했을때, n번째에 첫번째로 실험이 성공했다면 n-1번째까지는 실험이 계속 실패해야 한다.

 

따라서 실험이 실패할 확률(1-p)이 연속적으로 n-1번 나오고, 실험이 성공할 확률 p가 가장 마지막에 나오면 된다. 

(단, 매회 실험은 서로 독립적이여야 한다는 가정이 필요함)

 

geometric random variable의 확률 질량함수 $p(n)$의 전체 합이 1인지 확인해보자. 

$$ \sum_{n=1} ^ \infty p(n) = p \sum_{n=1}^\infty (1-p)^{n-1} = 1  $$

2.  Poisson random variable

확률변수 X가 0, 1, 2, $\ldots$의 값 중 하나를 취하며, 어떤 임의의 $\lambda$ > 0 에 대해 아래와 같은 확률 질량함수를 가질때 $$ p(i) = P\left\{ X=i \right\} = e^{- \lambda } \frac{ \lambda^!} {i \, !}, \quad i = 0, 1, \ldots$$ 이러한 확률변수 X를 파라미터가 $ \lambda$인 Poisson random variable이라고 한다. 

 

Poisson random variable의 확률 질량함수 $p(n)$의 전체 합이 1인지 확인해보자.

$$ \sum_{i=0}^\infty p(i) = e^{- \lambda} \sum_{i=0}^\infty \frac{\lambda ^ i}{i \,!} = e^{- \lambda} e^{\lambda} = 1 $$ poisson random variable은 정말 많은 분야에서 사용되기 때문에, 차후에 추가적으로 포스팅 해보도록 하겠다.

 

Poisson random variable과 관련된 중요한 성질 중 하나는,

 

파라미터가 $(n,p)$인 binomial random variable가

n이 충분히 크고, p가 충분히 작은 경우 poisson random variable로 근사(approximation)이 된다는 것이다. 

 

근사가 되는 과정을 한번 살펴보자.

확률변수 X를 파라미터 $(n,p)$인 binomial random variable이고, $ \lambda = np$라고 가정해보자. 

그러면 아래와 같은 수식이 성립한다. 
$$ \begin{align} P\left\{ X = i \right\} &= \frac{n!}{(n-i)! \, i!} p^i (1-p)^{n-i} \\ \\ &= \frac{n!}{(n-i)! \, i!} \left( \frac{\lambda}{n} \right)^i \left(1 - \frac{\lambda}{n} \right)^{n-i}  \\ \\  &= \frac{n(n-1) \cdots (n-i+1)}{n^i} \frac{ \lambda^i}{i!} \frac{(1- \lambda /n)^n}{(1- \lambda /n)^n} \end{align} $$ 그리고 n이 충분히 크고 p가 충분히 작으면 아래와 같이 근사가 가능하다.

$$ \left( 1- \frac{\lambda}{n} \right)^n \approx e^{- \lambda}, \quad  \frac{n(n-1) \cdots (n-i+1)}{n^i} \approx 1, \quad \left( 1 - \frac{\lambda}{n} \right)^i \approx 1$$ 따라서 충분히 큰 n과 충분히 작은 p에 대해서 
$$ P \left\{X = i \right\} \approx e^{- \lambda} \frac{\lambda^i}{i!}$$

 

Poisson random variable에 대한 간략한 예제를 풀어보도록 하자.

Q) 일일단위로 고속도로에서 발생하는 사고 발생 횟수가 $\lambda = 3$인 poisson random variable이라고 하자.
     이때, 오늘 사고가 발생하지 않을 확률은 얼마인가?

A) Poisson random varialbe의 확률 질량 함수를 통해 아래와 같이 계산할 수 있다. $$P \left\{ X = 0 \right\} = e^{-3} \frac{3^0}{0!} = e^{-3} \approx 0.05$$ 따라서 오늘 사고가 발생하지 않을 확률은 약 5%이다. 

 

다음 포스팅에서는 continuous random variable에 대해 작성해보도록 하겠다.

 

 

'Probability' 카테고리의 다른 글

Expectation of a random variable  (0) 2021.08.17
Continuous random variable(2) - exponential, gamma, normal  (0) 2021.08.16
Continuous random variable  (0) 2021.08.15
Discrete random variable  (0) 2021.08.13
Random Variable  (0) 2021.08.12