問題
二項分布は、サンプルサイズ\(n\)が大きいときに正規分布に近似できることを示せ。
である。
使う定理や公式
- スターリングの公式
- 指数関数
考えたこと
前回の確率関数\(W\)を\(C = \sqrt{2\pi}\)として、\(p_{i},~~m\)で書くと次のようにまとめられる。
\[ W \simeq \sqrt{\frac{n}{2\pi n_{1}n_{2}}} \left[ \left(1 + \frac{m}{np_{1}}\right)^{p_{1}}\left(1 - \frac{m}{np_{2}}\right)^{p_{2}} \right]^{-n} \left(1 + \frac{x_{1}^{2}}{m}\right)^{-m}\left(1 + \frac{-x_{2}^{2}}{m}\right)^{m}\]
\([\ldots]\)以外は前回と同じ。\(x^{2} = x_{1}^{2} + x_{2}^{2}\)として、
\[ [\ldots] \simeq \exp \left(\frac{x_{1}^{2}}{2p_{1}p_{2}}\right) = e^{x^{2}/2} ~~(*)\]
になることを認めれば、
\[ \begin{align*} &W \simeq \frac{1}{\sqrt{2\pi n p_{1}p_{2}}} e^{-x^{2}/2}\\ &x = \frac{n_{1} - np_{1}}{\sqrt{np_{1}p_{2}}}\\ \end{align*} \]
となる。従って、二項分布は\(n >> 1\)のとき正規分布に近づく。
\([\ldots]\)以外は前回と同じ。\(x^{2} = x_{1}^{2} + x_{2}^{2}\)として、
\[ [\ldots] \simeq \exp \left(\frac{x_{1}^{2}}{2p_{1}p_{2}}\right) = e^{x^{2}/2} ~~(*)\]
になることを認めれば、
\[ \begin{align*} &W \simeq \frac{1}{\sqrt{2\pi n p_{1}p_{2}}} e^{-x^{2}/2}\\ &x = \frac{n_{1} - np_{1}}{\sqrt{np_{1}p_{2}}}\\ \end{align*} \]
となる。従って、二項分布は\(n >> 1\)のとき正規分布に近づく。
(*)の評価
(*)を示すには
\[ \lim_{n\to \infty} \left| e^{x^{2}/2} - \left[\left(1 + \frac{m}{np_{1}}\right)^{p_{1}}\left(1 - \frac{m}{np_{2}}\right)^{p_{2}} \right]^{n}\right| = 0\]
になることを確認すれば良い。
\[
\begin{align*}
a &= e^{x^{2}/(2n)}\\
b &= \left(1 + \frac{m}{np_{1}}\right)^{p_{1}} \left(1 - \frac{m}{np_{2}}\right)^{p_{2}}
\end{align*}
\]
としたとき、\(a^{n} - b^{n} = (a-b)\sum_{i=0}^{n-1}a^{i}b^{n-1-i}\)なので\(a \le c,~~b \le c\)な\(c\)をとると
\[ |a^{n} - b^{n}| \le n c^{n}|a - b|\]
である。\(b\)を\(m/n\)で展開して、\(x_{1} = m/\sqrt{n} = \mathcal{O}(1)\)であることを使うと
\[ \begin{align*} a - b &= e^{y/n} - \left( 1 + \frac{y}{n} + \mathcal{O}(N^{-3/2})\right)\\ &= \left(\frac{y}{n}\right)^{2}\sum_{k=2}^{\infty}\frac{1}{k!}\left(\frac{y}{n}\right)^{k} + \mathcal{O}(N^{-3/2})\\ \end{align*} \]
としたとき、\(a^{n} - b^{n} = (a-b)\sum_{i=0}^{n-1}a^{i}b^{n-1-i}\)なので\(a \le c,~~b \le c\)な\(c\)をとると
\[ |a^{n} - b^{n}| \le n c^{n}|a - b|\]
である。\(b\)を\(m/n\)で展開して、\(x_{1} = m/\sqrt{n} = \mathcal{O}(1)\)であることを使うと
\[ \begin{align*} a - b &= e^{y/n} - \left( 1 + \frac{y}{n} + \mathcal{O}(N^{-3/2})\right)\\ &= \left(\frac{y}{n}\right)^{2}\sum_{k=2}^{\infty}\frac{1}{k!}\left(\frac{y}{n}\right)^{k} + \mathcal{O}(N^{-3/2})\\ \end{align*} \]
となる。\(y/n \le 1\)なので右辺第一項は
\[ \text{第一項} \le \left(\frac{y}{n}\right)^{2}\sum_{i=2}^{\infty} \frac{1}{k!} = \left(\frac{y}{n}\right)^{2}(e - 2)\]
であるから全体として\(a - b = \mathcal{O}(N^{-3/2})\)である。これを使うと\( |a^{n}-b^{n}| = \mathcal{O}(N^{-1/2})\)になることが分かるので\(n \to \infty\)で\(0\)に収束する。
\[ \text{第一項} \le \left(\frac{y}{n}\right)^{2}\sum_{i=2}^{\infty} \frac{1}{k!} = \left(\frac{y}{n}\right)^{2}(e - 2)\]
であるから全体として\(a - b = \mathcal{O}(N^{-3/2})\)である。これを使うと\( |a^{n}-b^{n}| = \mathcal{O}(N^{-1/2})\)になることが分かるので\(n \to \infty\)で\(0\)に収束する。
次回
次回は三項分布について同じ解析をする予定です。$k$項分布の場合の式を予想するためです。
0 件のコメント:
コメントを投稿