ページ

2013年4月29日月曜日

多項分布から多変量正規分布への近似について(4)

問題

三項分布がサンプルサイズ\(n\)が大きいとき、2次元正規分布に近似できることを示せ

考えたこと

問題に答えるには、\(n\)が大きいときの確率関数\(W\)の式を求めて、
\[ W(n_{1}, n_{2}) \Delta n_{1} \Delta n_{2} \simeq p(z_{1}, z_{2}) \Delta z_{1} \Delta z_{2}\]
を使って、確率密度関数を求めれば良い。この式は
\[ \begin{align*} &\mathrm{Prob}[z_{1} \le Z_{1} \le z_{1} + \Delta z_{1}, z_{2} \le Z_{2} \le z_{2} + \Delta z_{2}] \\ &= \mathrm{Prob}[n_{1} \le N_{1} \le n_{1} + \Delta n_{1}, n_{2} \le N_{2} \le n_{2} + \Delta n_{2}] \end{align*} \]
として、1次元の時と同様に考えると得られる。

ここでは、\(W\)の近似式を得るところまでをやる。確率関数は
\[ \begin{align*} &W = \frac{n!}{n_{1}! n_{2} !n_{3}!} p_{1}^{n_{1}} p_{2}^{n_{3}} p_{3}^{n_{3}}\\ &n_{1} + n_{2} + n_{3} = n\\ &p_{1} + p_{2} + p_{3} = 1 \end{align*} \]
である。二項分布と同様に変数
\[z_{i} = \frac{n_{i} - np_{i}}{\sqrt{np_{i}}} = \frac{m_{i}}{\sqrt{np_{i}}}\]
を導入して、スターリングの公式を使って整理すると、次のようになる。
\[ \begin{align*} W &\simeq \frac{1}{2\pi}\sqrt{\frac{n}{n_{1}n_{2} n_{3}}} \prod_{i=1}^{3} \left(\frac{n_{i}}{np_{i}}\right)^{-n_{i}}\\ &= \frac{1}{2\pi}\sqrt{\frac{n}{n_{1}n_{2} n_{3}}} \left[\prod_{i=1}^{3} \left(1 + \frac{m_{i}}{np_{i}}\right)^{p_{i}}\right]^{-n} \prod_{i=1}^{3} \left(1 + \frac{z_{i}^{2}}{m_{i}}\right)^{-m_{i}} \end{align*} \]
\([\ldots ]\)の部分は、\(m_{i}/(np_{i})\)でテイラー展開して\(\sum_{i=1}^{3} m_{i} = 0\)を使うと
\[ [\ldots ] \simeq 1 + \frac{1}{n} \frac{z^{2}}{2}\]
なので、これを\(W\)に代入して\(\sqrt{\frac{n}{n_{1}n_{2} n_{3}}} \simeq \frac{1}{\sqrt{np_{1} np_{2} p_{3}}}\)を使うと、次のようにまとめられる。
\[ \begin{align*} &W \simeq \prod_{i=1}^{2}\frac{1}{\sqrt{2\pi np_{i}}} \frac{1}{\sqrt{p_{3}}} e^{-z^{2}/2}\\ &z^{2} = z_{1}^{2} + z_{2}^{2} + z_{3}^{2} \end{align*} \]

次回

得られた\(W\)は一見すると3次元正規分布のようだが、実際は2次元である。これはよく、
\[ z_{3} = - \sqrt{\frac{p_{1}}{p_{3}}} z_{1}- \sqrt{\frac{p_{2}}{p_{3}}} z_{2}\]
だからだとか言われるが、次回はこれについて具体的に確かめる。

0 件のコメント:

コメントを投稿