성공과 실패의 두 가지 중 하나로만 나오는 실험을 반복적으로 수행했을 때, 각각의 결과는 베르누이 분포를 따르게 된다. 베르누이 분포를 누적하면 이항분포를 얻게 된다.
베르누이 시행의 결과를 확률변수 로 나타내는 경우 일반적으로 성공을 , 실패를 이라고 둔다. 불연속적인 두 가지의 경우의 수 밖에 없기 때문에, 는 이산확률변수(Discrete random variable)가 된다. 특히 일 확률을 성공확률 라고 부른다. 이 때 확률변수 가 모수 의 베르누이 분포(Bernoulli distribution)를 따른다고 하고, 다음과 같이 표현한다.
여기서 성공확률 는 베르누이 분포의 단 하나의 모수(parameter)에 해당하고, 는 베르누이 확률밀도함수1를 의미한다. 정의에 의해 다음을 알 수 있다.
베르누이 확률변수를 또는 로 표현할 수도 있다. 다만 이 경우, 베르누이 확률분포는 다음과 같이 다소 복잡하게 묘사된다.
Proof.
베르누이 시행을 반복적으로 번 수행(독립시행2 가정)하면 어떨까? 즉 확률변수 벡터 의 각 요소가 서로 독립이고, 성공확률이 인 베르누이 분포를 따른다고 생각해보자. 이 경우 확률변수 는 모수 의 다변수 베르누이 분포(Multivariate Bernoulli distribution)3를 따른다고 하고, 임의의 샘플 에 대하여 다음과 같이 묘사된다.
위의 확률밀도함수를 유도해보자.
성공확률이 인 베르누이 시행을 번 반복해서 수행(독립시행)했을 때의 성공한 총 횟수를 확률변수 라고 하면, 확률변수 는 모수가 인 이항분포(Binomial distribution)을 따른다고 하고, 다음과 같이 표현한다.
여기서 는 개의 샘플 중 개를 선택하는 경우4의 수를 의미하고, 다음과 같이 계산된다.
위의 확률밀도함수를 베르누이 분포로부터 유도해보자. 베르누이 시행을 통해 임의로 추출한 개의 샘플을 라고 하자. 어떤 값 에 대하여, 이들 샘플로부터 가 나올 수 있는 경우의 수는 이므로,
참고로 인 경우의 이항분포는 베르누이 분포와 동일하다.
Proof.
여기서 마지막 줄의 증명은, 독립시행을 가정했기 때문에 가능한 전개이다.
이산확률변수의 확률밀도함수(pdf: probability density function)를 보통 확률질량함수(pmf: probability mass function)라고 한다 ↩
매번 같은 조건에서 어떤 시행을 반복할 때, 각 시행의 결과가 다른 시행의 결과에 영향을 미치지 않는 시행 (independent trials) ↩
다변수 베르누이 분포라는 용어가 실제로 존재하는 지는 명확하지 않다. 확률분포의 개념을 정리하는 과정에서 필자의 필요에 의해 만든 용어임을 알려둔다. ↩
조합(Combination)이라고 하며 로 표기하기도 한다. ↩