区間推定とは
区間推定とは、点推定とは違い、「95%の確率で平均値$\mu$はこの範囲内の値である。」と言った推定の仕方です。
点推定についてはこちらをご覧ください。
区間推定をするにあたっては母集団の分布が重要になってきます。
そもそも「確率変数Xが平均が$\mu$・分散が$\sigma ^2$の正規分布に従う。」とはXの値の確率は下図のような面積で表されるという意味です。

Xが$\mu$あたりである確率は高く、平均値$\mu$から離れるほどその確率は減っていきます。
ここで、図の面積が確率に対応するのですが、平均値$\mu$から両側 $1.96×\sigma$(標準偏差)の内側の面積は全体の95%に当たることを覚えておきましょう。
つまり確率変数Xが$\mu-1.96×$\sigma$から$\mu+1.96×$\sigma$の間の数値である確率が95%ということになります。
標本が1つの場合
平均値の区間推定で分散が分かっている場合を考えてみたいと思います。
標本が1つの場合、得た標本を$X_1$とすると、母集団の分布が平均$\mu$(推定の対象)・分散$\sigma ^2$(既知)の正規分布なので、同じく$X_1$も平均$\mu$・分散$\sigma ^2$の正規分布に従うはずです。
よって95%の確率で次の式が成り立ちます。
$$\mu -1.96\sigma<X_1<\mu +1.96\sigma$$
これを変形すると、
$$X_1-1.96\sigma<\mu<X_1+1.96\sigma$$
よって信頼度95%で$\mu$の範囲を絞ることができます。
標本が複数の場合
標本がn個の場合は推定をより正確に行うことができます。
n個の標本から標本平均$\bar X$を計算し、$\bar X$についての次の性質を使って推定を行います。
母集団の分布が平均$\mu$・分散$\sigma ^2$の正規分布のとき、n個の標本から得た標本平均$\bar X$は平均$\mu$・分散$\frac{\sigma ^2}{n}$の正規分布に従う。
$\bar X$は平均$\mu$・分散$\frac{\sigma ^2}{n}$の正規分布に従うので、95%の確率で次の式が成り立ちます。
$$\mu -1.96\frac{\sigma}{\sqrt n}<\bar X<\mu +1.96\frac{\sigma}{\sqrt n}$$
これを変形すると、
$$\bar X -1.96\frac{\sigma}{\sqrt n}<\mu<\bar X +1.96\frac{\sigma}{\sqrt n}$$
標準化を用いる考え方
$\bar X$が平均$\mu$・分散$\frac{\sigma ^2}{n}$の正規分布に従うということは、これを標準化した$\frac{\bar X-\mu}{\frac{\sigma}{\sqrt n}}$は平均0・分散1の正規分布、つまり標準正規分布に従うことになります。
よって、次の式が95%の確率で成り立ちます。
$$0-1.96<\frac{\bar X-\mu}{\frac{\sigma}{\sqrt n}}<0+1.96$$
この式を変形することで、
$$\bar X -1.96\frac{\sigma}{\sqrt n}<\mu<\bar X +1.96\frac{\sigma}{\sqrt n}$$
コメント