Processing math: 100%
본문 바로가기

Probability

Discrete random variable

지난 포스팅에는 확률변수(random variable)의 정의에 대해서 작성했는데, 이번 포스팅에는 확률변수 중에서도

 

셀 수 있는(Counting) 확률변수인 이산 확률변수(discrete random variable)에 대해 작성해보겠다.

 

예를들어, 두개의 주사위를 던졌을때 나온 수의 합이나, 어떤 가게에 방문하는 고객들의 수와 같은 것들은

 

우리가 직관적으로 셀 수 있는 것(counting)을 알 수 있다. 이러한 확률변수들을 우리는 이산 확률변수라고 한다. 

 

한편, 이러한 이산 확률변수 X에 대해서, X의 확률 질량 함수(probability mass function) p(a)를 아래와 같이 정의 한다.

p(a)=P{X=a}

확률 질량함수 p(a)는 a가 가질 수 있는 모든 셀 수 있는 값에 대해 양의 값을 가진다. 

 

즉, 만약 확률변수 X가 x1,x2, 의 값 중 하나라고 가정한다면, 아래를 만족한다. 

p(xi)>0 i=1,2,p(x)=0 all other values ofx그리고 확률변수 X가 xi 중 하나의 값을 갖기 때문에 i=1p(xi)=1을 만족하며, 누적 분포함수 F는 p(a)를 이용하여

 

아래와 같이 표현 될 수 있다.

F(a)=allxiap(xi)

예를 들어 확률변수 X가 아래와 같은 확률 질량함수(pmf)가 주어진다면

p(1)=12,p(2)=13,p(3)=16확률변수 X의 누적 분포 함수(cdf)는 아래와 같다. 

F(a)={0,a<112,1a<256,2a<31,3a}

이산 확률변수(discrete random variable) 중에서도 대표적인 Bernoulli, Binomial 에 대해서 알아보자. 

Bernoulli random variable

결과가 '성공(Success)' 또는 '실패(Failure)' 로 구분되는 결과를 가지는 실험(Experiment) 또는 시도(Trial)를 가정해보자. 

만약 실험 결과가 '성공'이면 확률변수 X가 1이고, 실험결과가 '실패'이면 확률변수 X가 0이라고 할 때,

이러한 확률변수 X의 확률 질량 함수(pmf)는 아래와 같이 주어진다.
p(0)=P{X=0}=1pp(1)=P{X=1}=p여기서 p는 실험 결과가 '성공'으로 나올 확률을 의미한다. 

만약 확률변수 X의 확률 질량 함수가 위에서 언급된 것처럼 주어진다면,

이러한 확률변수 X를 Bernoulli random variable이라고 한다. 

 

Binomial random variable

결과가 '성공(Success)'일 확률이 p이고, '실패(Failure)'일 확률이 1p인 실험(Experiment) 또는 시도(Trial)를

독립적으로 n번 시행한다고 가정해보자. (참고로 Bernoulli는 실험을 1번만 하지만, Binomial은 실험을 n번 시행을 가정)

만약 확률변수 X가 n번의 실험에서 '성공(Success)'이 나온 횟수라고 할때, 이러한 확률변수 X를 파라미터가 (n,p)

binomial random variable이라고 한다. 

파라미터가 (n,p)인 binomial random variable의 확률 질량 함수는 아래와 같이 주어진다. 
p(i)=(ni)pi(1p)ni,i=0,1,,n,where(ni)=i!(ni)!i!한편 Binomial random variable에 대해서 확률 질량 함수의 합은 1이며 아래식이 성립한다.
i=0p(i)=ni=0(ni)pi(1p)ni=(p+(1p))n=1
<Example - Problem>
앞,뒷면에 나올 확률이 동일한 동전을 4번 던진다고 하자.
만약 각 결과가 서로 독립적이라면, 앞면과 뒷면이 각각 두번씩 나올 확률은 얼마인가?

<Example - Solution>
확률변수 X를 앞면이 나올 횟수라고 하자. 그러면 확률변수 X는 binomial random variable이고 이때 파라미터가 (n,p)=(4,12)이다. 따라서 위에서 정의한 확률 질량함수에 의해 아래와 같이 구할 수 있다.
P{X=2}=(42)(12)2(12)2=38

 

다음 포스팅에서는 이산 확률변수인 geometric random variable과 poisson random variable에 대해서 작성해보겠다.