二項分布
ベルヌーイ試行*をn回行なった時、成功回数Xは二項分布という離散確率分布に従います。
確率変数Xが二項分布に従う時、$X=k$である確率は次の式で表されます。
二項分布
$$P(X=k)={}_nC_kp^k(1-p)^{n-k}$$
ベルヌーイ試行
コインを投げた時のように、結果が二通りしかない試行のことをベルヌーイ試行と言います。
ベルヌーイ試行では一般に、どちらかの状態を成功、もう一方を失敗と呼び、確率変数Xの値が数値になるように、成功=1、失敗=0のようにして処理します。
仮に成功する確率がpであるとすると、
$$P(X=1)=p$$
$$P(X=0)=1-p$$
二項分布の導出
二項分布の導出は高校数学の確率で扱う反復試行の問題と同じです。
例えば10回試行を行い、そのうち3回成功する確率を求めてみます。
10回中3回成功というのは例えば極端ですが$成,成,成,失,失,失,失,失,失,失$というパターンがあります。
1回の試行で成功する確率をpとすると、このように最初に3回連続で成功してその後全部失敗する確率は
$$p^3×(1-p)^7$$
ほかにも$成,失,成,失,成,失,失,失,失,失$というパターンであっても確率は同じく$p^3×(1-p)^7$です。
では10回中3回成功というのは全部で何パターンあるのかを考えると、これは同じものを含む順列の考えで、10回のうちから3回成功する回を選べば良いので${}_{10}C_3$通りであることがわかります。
よって、確率$p^3×(1-p)^7$のパターンが${}_{10}C_3$通りあるので、10回中3回成功する確率は
$${}_{10}C_3p^3(1-p)^7$$
n回中k回成功するのも同じように考えればその確率は
$$P(X=k)={}_nC_kp^k(1-p)^{n-k}$$
だとわかります。
二項分布の期待値・分散
二項分布の期待値は$E(X)=np$、分散は$V(X)=np(1-p)$です。
二項分布の期待値の証明
二項分布に従うXの期待値
$$E(X)=np$$
証明
$$E(X)=\sum^n_{k=0}kP(X=k)$$
$$=\sum^n_{k=1}k{}_nC_kp^k(1-p)^{n-k}$$
$$=\sum^n_{k=1}k\frac{n!}{(n-k)!k!}p^k(1-p)^{n-k}$$
$$=\sum^n_{k=1}\frac{n(n-1)!}{(n-k)!(k-1)!}pp^{k-1}(1-p)^{n-k}$$
$$=np\sum^n_{k=1}\frac{(n-1)!}{\{(n-1)-(k-1)\}!(k-1)!}p^{k-1}(1-p)^{(n-1)-(k-1)}$$
ここで、$n-1=n’$、$k-1=k’$とすると、
$$=np\sum^{n’}_{k’=0}\frac{n’!}{\{n’-k’\}!k’!}p^{k’}(1-p)^{n’-k’}$$
$$=np\sum^{n’}_{k’=0}{}_{n’}C_{k’}p^{k’}(1-p)^{n’-k’}$$
$$=np\sum^{n’}_{k’=0}P(X=k’)$$
$$=np$$
(∵確率質量関数の総和は1のため。)
二項分布の分散の証明
二項分布に従うXの分散
$$V(X)=np(1-p)$$
証明
Xがポアソン分布に従う時、二次モーメント$E(X^2)$は
$$E(X^2)=\sum^n_{k=0}k^2P(X=k)$$
$$=\sum^n_{k=0}k(k-1)P(X=k)+\sum^n_{k=0}kP(X=k)$$
$$=\sum^n_{k=2}k(k-1){}_nC_kp^k(1-p)^{n-k}+E(X)$$
$$=\sum^n_{k=2}k(k-1)\frac{n!}{(n-k)!k!}p^k(1-p)^{n-k}+np$$
$$=\sum^n_{k=2}\frac{n!}{(n-k)!(k-2)!}p^k(1-p)^{n-k}+np$$
$$=\sum^n_{k=2}\frac{n(n-1)(n-2)!}{(n-k)!(k-2)!}p^2p^{k-2}(1-p)^{n-k}+np$$
$$=n(n-1)p^2\sum^n_{k=2}\frac{(n-2)!}{(n-k)!(k-2)!}p^{k-2}(1-p)^{n-k}+np$$
$$=n(n-1)p^2\sum^n_{k=2}\frac{(n-2)!}{(n-k)!(k-2)!}p^{k-2}(1-p)^{n-k}+np$$
ここで、$n-2=n’$、$k-2=k’$とおくと、
$$=n(n-1)p^2\sum^{n’}_{k’=0}\frac{n’!}{(n’-k’)!k’!}p^{k’}(1-p)^{n’-k’}+np$$
$$=n(n-1)p^2+np$$
(∵確率質量関数の総和は1のため。)
よって分散は
$$V(X)=E(X^2)-E(X)^2$$
$$=n(n-1)p^2+np-(np)^2$$
$$=np^2+np$$
$$=np(1-p)$$
コメント