본문 바로가기

Probability

Continuous random variable

지난 포스팅에서는 이산 확률변수(Discrete random variable)에 대해서 작성했다. 

 

이번 포스팅에서는 셀 수 없는(Uncountable) 확률변수인 연속 확률변수(Continuous random variable)에 대해서 작성해보겠다. 

 

만약 $ x \in (- \infty , \infty)$에서 정의 되는 음이 아닌 함수(Non-negative function) $f(x)$가 어떤 임의의 실수집합 B에

대해 아래와 같은 조건을 만족하면 우리는 확률변수 X를 연속 확률변수(Continuous random variable)이라고 한다.

$$ P\left\{X \in B \right\} = \int_{B} f(x)\, dx  \quad \quad \cdots \cdots \cdots \quad(1)$$ 그리고 함수 $f(x)$를 확률변수 X의 확률 밀도함수(Probability density function)이라고 한다. 

 

수식 (1)은 확률변수 X가 B에 속할 확률은 확률 밀도함수(Probability density function)을 집합 B에 대해 적분한 값을 의미한다. 확률변수 X는 어떤 특정한 값을 갖기 때문에 아래와 같은 식을 항상 만족한다.

$$ 1 = P \left\{ X \in ( - \infty, \infty) \right\} = \int_{- \infty}^{\infty} f(x)\, dx $$ 예를 들어 만약 $B = [a,b]$라면, 수식 (1)에 의해  아래와 같은 수식을 얻을 수 있다. 

$$ P \left\{a \leq X \leq b \right\} = \int_{a}^{b} f(x) \,dx \quad \quad \cdots \cdots \cdots \quad(2) $$ 그리고 a와 b가 같은 값을 가진다면, 즉 $a=b$ 라면 아래와 같은 식이 성립한다. $$ P \left\{ X = a \right\} = \int_{a}^{a} f(x)\, dx = 0$$ 이는 연속 확률변수가 어떤 특정한 값을 가진다면 그 확률은 0임을 의미한다. 

 

누적 분포 함수(Cumulative distribution function) $F(\cdot)$와 확률 밀도함수 $f \left( \cdot \right)$의 관계는 아래 식과 같다. 

$$  F(a) = P \left\{X \in \left( - \infty, a \right] \right\} = \int_{- \infty}^{a} f(x)\, dx$$ 그리고 양변을 미분하면 아래 관계식을 만족한다. 

$$ \frac{d}{dx} F(a) = f(a) $$ 수식(2)로부터 확률밀도 함수에 대해 아래 식과 같이 직관적인 해석을 얻을 수 있다

$$ P \left\{ a - \frac{\epsilon}{2} \leq X \leq a + \frac{\epsilon}{2} \right\} = \int_{a-\epsilon / 2}^{a+ \epsilon /2} f(x) \, dx \approx \epsilon f(a)  \quad \quad \text{when} \; \epsilon  \; \text{is small} $$ 이를 해석하면 확률변수 X가 a 주변의 길이가 $\epsilon$인 구간안에 속할 확률이 $\epsilon f(a)$로 근사가 가능하다는 것이다. 

 

다음 연속 확률변수 X 중 하나인 Uniform random variable에 대해서 알아보자. 

Uniform random variable

만약 확률 밀도함수가 아래의 조건을 만족하면, 확률변수가 구간(interval) (0, 1)에 대해 균등하게 분포(Uniformly distributed)되어 있다고 말한다. 

$$ f(x) = \begin{Bmatrix} 1, \quad & 0 < x < 1 \\ 0, \quad & otherwise \end{Bmatrix} $$ 그리고 확률밀도함수 $f(x)$는 0보다 크거나 작기 때문에 아래의 식을 만족한다. 

$$ \int_{- \infty}^{\infty} f(x) \, dx = \int_{0}^{1} \, dx = 1 $$ 다른말로 하면 확률변수 X가 구간 (0, 1)사이의 부분구간(subinterval)에 속할 확률은 그 부분구간의 길이와 같다고 할 수 있다.

 

일반적으로 확률변수 X의 확률 밀도 함수가 아래 조건을 만족하면 확률변수 X를 구간 $(\alpha, \beta)$에서의 uniform random variable이라고 한다. 

$$ f(x) = \begin{Bmatrix} \frac{1}{\beta - \alpha}, && if \quad \alpha < x < \beta\\ 0, && otherwise \end{Bmatrix} $$ 아래 예제를 풀어보도록 하자. 

 

Q1. Uniform random variable이 $( \alpha, \beta)$에서 정의 될때, 누적 분포함수를 계산하라. 

A1. $F(a) = \int_{- \infty}^{a} f(x) \, dx, $이기 때문에 아래와 같이 계산할 수 있다. 
$$ F(a) = \begin{Bmatrix} 0, &a \leq \alpha \\ \frac{a - \alpha}{\beta - a}, & \alpha < a < \beta \\ 1, & otherwise \end{Bmatrix} $$
Q2. 만약 확률변수 X가 (0,10)에서 uniformly distributed 되었을때, (a) X < 3 , (b) X > 7일때의 확률을 구하여라.

A2. Q1에 따라 아래와 같이 계산 할 수 있다.
$$ \begin{align} P \left\{ X < 3 \right\} &= \frac{\int_{0}{3} \,dx }{10} = \frac{3}{10} \\  P \left\{ X > 7 \right\} &= \frac{\int_{10}{7} \,dx }{10} = \frac{3}{10}  \end{align} $$

다음 포스팅에서는 또다른 연속 확률변수인 exponential, gamma, normal random variable에 대해서 작성해보겠다. 

 

 

'Probability' 카테고리의 다른 글

Expectation of a random variable  (0) 2021.08.17
Continuous random variable(2) - exponential, gamma, normal  (0) 2021.08.16
Discrete random variable (2) - geometric, poisson  (0) 2021.08.14
Discrete random variable  (0) 2021.08.13
Random Variable  (0) 2021.08.12