前回、前々回は次のような場合での平均値の区間推定を行ってきました。
母集団が正規分布に従い、その分散がわかっているときの平均値の推定
母集団が正規分布に従い、その分散がわわかっていないときの平均値の推定
今回はより現実の状況に近づけるために、母集団の分布すらわからない場合を扱います。
母集団分布がわからない場合の平均値の区間推定
中心極限定理
母集団の分布が正規分布の場合は平均値を割と簡単に推定することができました。
それほど正規分布というものは便利なのです。
今回もなんとか正規分布に従う量を用いたいので、次の定理を使います。
中心極限定理
平均$\mu$・分散$\sigma ^2$の母集団から抽出した標本の数が十分に大きい時、標本平均$\bar X$は近似的に$\mu$・分散$\frac{\sigma ^2}{n}$の正規分布に従う。
この定理の主張は、「母集団がどんな分布であっても標本の数が多ければ標本平均は正規分布に従う。」ということです。
「標本平均が正規分布に従う。」とは、『標本を集める→標本平均を計算』という行為を何回も行なった時、そのたくさんの標本平均のデータは正規分布に従うという意味です。
正規分布に従う量があればなんとか推定できそうですね。
標本平均を使って推定を行う
中心極限定理
平均$\mu$・分散$\sigma ^2$の母集団から抽出した標本の数が十分に大きい時、標本平均$\bar X$は近似的に$\mu$・分散$\frac{\sigma ^2}{n}$の正規分布に従う。
この定理から、標本平均$\bar X$は近似的に$\mu$・分散$\frac{\sigma ^2}{n}$の正規分布に従うので95%の確率で次の式が成り立ちます。
$$\mu -1.96\frac{\sigma}{\sqrt n}<\bar X<\mu +1.96\frac{\sigma}{\sqrt n}$$
ここで、nは十分大きい時を考えているので$\sigma = U(不偏分散)$としてよく、$\mu$について整理すると
$$\bar X -1.96\frac{U}{\sqrt n}<\mu<\bar X +1.96\frac{U}{\sqrt n}$$
例題
とあるYouTuberの動画100本を標本として調査したところ、標本平均$\bar X=1200$、標本の不偏分散$U ^2=900$であった。
再生数の平均値を信頼度95%で求めよ。
解答
95%の確率で次の式が成り立つ。
$$\bar X -1.96\frac{U}{\sqrt n}<\mu<\bar X +1.96\frac{U}{\sqrt n}$$
$\bar X=1200$、$U=30$を用いると、
$$1200-1.96\frac{30}{\sqrt{100}}<\mu<1200+1.96\frac{30}{\sqrt{100}}$$
$$1194.12<\mu<1205.88$$
コメント