베르누이 시행과 이항분포 쉽게 이해하기

확률 변수

동전을 던질 때 경우의 수는 두 가지로 정합시다. {“앞면”, “뒷면”} 둘 뿐입니다. 이를 {1, 0}으로 바꾸어도 아무런 문제가 없습니다. 확률 공간이 실수로 바뀌었습니다.
확률 변수는 불확실성을 내포한 변수라는 의미로 정의되었습니다. 동전을 던져보기 전까지는 알 수가 없는 값이죠. 우리는 이 확률변수를 대문자를 사용해서 표현합니다. X. 동전이 앞면이라면 X = 1, 뒷면이라면 X = 0

표본과 표본 평균 이해하기

통계학에서 우리는 보통 모집단을 무한한 집단이라고 생각합니다.
표본은 집단이 아닙니다. 하나의 표본은 하나의 값을 의미합니다. $X_1, X_2, X_3,...,X_n$ 모두 모집단에서 뽑을 하나의 특정값을 아직 뽑지 않아 모르니 변수로 표현한 것일 뿐입니다.
이때 표본 평균은 n개의 평균이라면 $\bar X = \frac{1}{n}\times (X_1 + X_2 + ... + X_n)$ 이 될 것이고 k개의 평균이면 $\bar X = \frac{1}{k}\times (X_1 + X_2 + ... + X_k)$ 가 되겠죠?

베르누이 확률와 이항분포

베르누이 시행이란 값이 0과 1로만 나뉘어진 사건의 확률을 계산하는 방법입니다. p가 1이 일어날 확률이라고 합시다. 시행의 확률 변수를 Y라고 한다면 베르누이 시행의 기댓값과 분산은 다음과 같아요.
$E(Y) = 1 \times p + 0 \times (1 - p) = p$
$Var(Y) = E(Y^2) - E(Y)^2$
$= 1^2 \times p$ $+ 0^2 \times (1 - p) - E(Y)^2$
$= p + 0 - p^2$
$= p(1-p)$

이항분포는 베르누이 시행이 여러 번 일어나는 분포를 나타냅니다. 이 때 각 베르누이 시행은 독립이어야겠죠.
베르누이 시행은 B(1, p)로 쓸 수 있습니다. 이항 분포는 B(n, p)로 사용하는데 n개의 베르누이 시행 표본을 뽑는 것을 의미합니다. 따라서 이항분포에서 새롭게 사용할 확률 변수 X는 베르누이 시행 표본들의 합입니다.

$X = Y_1 + Y_2 + ... + Y_n$
$E(X) = E(Y_1 + Y_2 + ... + Y_n)$
$=n \times p$
$Var(X) = Var(Y_1 + Y_2 + ... + Y_n )$
$= Var(Y_1) + Var(Y_2) + ... + Var(Y_n)$
$= \sum_{i=1}^n Var(Y_i) = np(1-p)$

이 블로그 검색

I love brew