ページ

2013年4月27日土曜日

多項分布から多変量正規分布への近似について(2)

問題

二項分布は、サンプルサイズ\(n\)が大きいときに正規分布に近似できることを示せ。二項分布の確率関数\(W\)は
\[ \begin{align*} &W = \frac{n!}{n_{1}! n_{2}!} p_{1}^{n_{1}} p_{2}^{n_{2}}\\ &n_{1} + n_{2} = n\\ &p_{1} + p_{2} = 1 \end{align*} \]
である。

使う定理や公式

  • 不完全なスターリングの公式
  • 指数関数

考えたこと

不完全なスターリングの公式を使うと
\[ \frac{n!}{n_{1}!n_{2}!} \simeq \frac{1}{C} \sqrt{\frac{n}{n_{1}n_{2}}}\left(\frac{n_{1}}{n}\right)^{- n_{1}}\left(\frac{n_{2}}{n}\right)^{-n_{2}} \]
である。これを使うと、次のようにまとめることができる。
\[ W \simeq \frac{1}{C} \sqrt{\frac{n}{n_{1}n_{2}}} \left(\frac{n_{1}}{np_{1}}\right)^{- n_{1}}\left(\frac{n_{2}}{np_{2}}\right)^{-n_{2}} \]
連続分布に移行したとき、\(X_{i} \sim \mathrm{N}(0, 1)\)になるように定義する。
\[ E[n_{i}] = V[n_{i}] = np_{i}\]
なので、
\[ x_{i} = \frac{n_{i} - np_{i}}{\sqrt{np_{i}}} = \frac{m_{i}}{\sqrt{np_{i}}}\]
とする。以下では、計算を容易にするために\(m = m_{1} = - m_{2}\)として、\(p_{1} = p_{2} = p (= 1/2)\)の場合を考える。すると次のように書ける。
\[ W \simeq \frac{1}{C} \sqrt{\frac{n}{n_{1}n_{2}}} \left(1 + \frac{-2x_{1}^{2}}{n}\right)^{-n/2} \left(1 + \frac{x_{1}^{2}}{m}\right)^{-m}\left(1 + \frac{-x_{1}^{2}}{m}\right)^{m}\]
\(\sqrt{\frac{n}{n_{1}n_{2}}} \simeq 2 \frac{1}{\sqrt{n}}\)で、指数関数の定義を使えば
\[ \begin{align*} W &\simeq \frac{2}{C\sqrt{n}} e^{-x^{2}/2}\\ x^{2} &= x_{1}^{2} + x_{2}^{2} \end{align*} \]
となる。前回得た式と\(\Delta n = \frac{\sqrt{n}}{2} \Delta x\)を使うと
\[ p(x) = \frac{1}{C}e^{-x^{2}/2}\]
を得る。確率密度関数の規格化条件から\(C = \sqrt{2\pi}\)も得られるので、完全なスターリングの公式も得られる。

次回

\(p_{1} = p_{2}(=1/2)\)の場合のみ得られたので、次回はこの制限を取り払った場合を考える。

0 件のコメント:

コメントを投稿