계량투자 실험실 Quantlab

베르누이 분포와 이항분포

성공과 실패의 두 가지 중 하나로만 나오는 실험을 반복적으로 수행했을 때, 각각의 결과는 베르누이 분포를 따르게 된다. 베르누이 분포를 누적하면 이항분포를 얻게 된다.

베르누이 분포

개념

베르누이 시행
베르누이 시행(Bernoulli trial)은 결과가 성공 또는 실패의 두 가지 중 하나로만 나오는 실험을 의미한다. 예를들어 동전을 던지는 행위는 베르누이 시행으로 볼 수 있다.

베르누이 시행의 결과를 확률변수 로 나타내는 경우 일반적으로 성공을 , 실패를 이라고 둔다. 불연속적인 두 가지의 경우의 수 밖에 없기 때문에, 이산확률변수(Discrete random variable)가 된다. 특히 일 확률을 성공확률 라고 부른다. 이 때 확률변수 가 모수 베르누이 분포(Bernoulli distribution)를 따른다고 하고, 다음과 같이 표현한다.

여기서 성공확률 는 베르누이 분포의 단 하나의 모수(parameter)에 해당하고, 는 베르누이 확률밀도함수1를 의미한다. 정의에 의해 다음을 알 수 있다.


베르누이 확률변수를 또는 로 표현할 수도 있다. 다만 이 경우, 베르누이 확률분포는 다음과 같이 다소 복잡하게 묘사된다.


주요성질


Proof.


다변수 베르누이 분포

개념

베르누이 시행을 반복적으로 번 수행(독립시행2 가정)하면 어떨까? 즉 확률변수 벡터 의 각 요소가 서로 독립이고, 성공확률이 인 베르누이 분포를 따른다고 생각해보자. 이 경우 확률변수 는 모수 의 다변수 베르누이 분포(Multivariate Bernoulli distribution)3를 따른다고 하고, 임의의 샘플 에 대하여 다음과 같이 묘사된다.

위의 확률밀도함수를 유도해보자.


이항분포

개념

성공확률이 인 베르누이 시행을 번 반복해서 수행(독립시행)했을 때의 성공한 총 횟수를 확률변수 라고 하면, 확률변수 는 모수가 이항분포(Binomial distribution)을 따른다고 하고, 다음과 같이 표현한다.

여기서 개의 샘플 중 개를 선택하는 경우4의 수를 의미하고, 다음과 같이 계산된다.

위의 확률밀도함수를 베르누이 분포로부터 유도해보자. 베르누이 시행을 통해 임의로 추출한 개의 샘플을 라고 하자. 어떤 값 에 대하여, 이들 샘플로부터 가 나올 수 있는 경우의 수는 이므로,


참고로 인 경우의 이항분포는 베르누이 분포와 동일하다.


주요성질


Proof.

여기서 마지막 줄의 증명은, 독립시행을 가정했기 때문에 가능한 전개이다.

  1. 이산확률변수의 확률밀도함수(pdf: probability density function)를 보통 확률질량함수(pmf: probability mass function)라고 한다 

  2. 매번 같은 조건에서 어떤 시행을 반복할 때, 각 시행의 결과가 다른 시행의 결과에 영향을 미치지 않는 시행 (independent trials) 

  3. 다변수 베르누이 분포라는 용어가 실제로 존재하는 지는 명확하지 않다. 확률분포의 개념을 정리하는 과정에서 필자의 필요에 의해 만든 용어임을 알려둔다. 

  4. 조합(Combination)이라고 하며 로 표기하기도 한다. 

comments powered by Disqus