ページ

2013年5月15日水曜日

無相関検定に使う推定量の確率分布について(1)

問題

\[ \begin{align*} r &= \frac{S_{XY}}{S_{XX}S_{YY}}\\ S_{AB} &= \frac{\sum_{i=1}^{n}(A_{i}-\bar{A})(B_{i}-\bar{B})}{n} \end{align*} \]
で定義される相関係数(ピアソンの積率相関係数)\(r\)使って定義した量
 \[t = \sqrt{n-2}\frac{r}{\sqrt{1-r^{2}}}\]
は、\(X,Y\)に相関が無い場合、自由度n-2のt分布に従うことを示せ。

考えたこと

\[ \begin{align*} &c_{i} = \frac{x_{i}-\bar{x}}{\sqrt{nS_{XX}}}\\ &\sum_{i=1}^{n}c_{i} = 0, ~~~\sum_{i=1}^{n}(c_{i})^{2} = 1 \end{align*} \]
で定義した\(c_{i}\)を使って
 \[ \begin{align*} Z_{1} &= \sqrt{n}\bar{Y} = Z_{1}\\ Z_{2} &= \sum_{i=1}^{n}c_{i}Y_{i} \end{align*} \]
を定義する。直交行列\(\mathcal{O}\)を
\[ \mathcal{O}^{t} = (\boldsymbol{u}_{1}, \boldsymbol{u}_{2}, \ldots ,\boldsymbol{u}_{3})\]
として、\(\mathcal{O}\boldsymbol{Y} = \boldsymbol{Z}\)とすることができる。実際、
\[ \begin{align*} \boldsymbol{u}_{1} &= \frac{1}{\sqrt{n}}\sum_{i=1}^{n} \boldsymbol{e}_{i}\\ \boldsymbol{u}_{2} &= \sum_{i=1}^{n} c_{i}\boldsymbol{e}_{i} \end{align*} \]
となり、これらは互いに直交し、大きさも1に規格化されている。残りのベクトルについても、適当に基底を選んで、全体として規格直交ベクトルになるようにできれば、3成分以降の\(Z_{i}\)も定義されるので、 \[\sum_{i=1}^{n} Y_{i}^{2} = \sum_{i=1}^{n}Z_{i}^{2}\] となる。これを使うと
 \[ t = \frac{Z_{2}}{\sqrt{\sum_{i=3}^{n}(Z_{i})^{2}/(n-2)}}\]
と書くことができる。\(Y_{i} \sim \mathrm{N}(0, 1)\)だから、正規分布の再生性から\(Z_{i} \sim \mathrm{N}(0, 1)\)なので、\(t\)は自由度\(n-2\)のt分布に従う。

次回

適当に\(\boldsymbol{u}_{i}\)をとれば\(t\)分布に従うことは分かったので、次回は \(n=3\)の場合に、そのようなベクトルを構成できることを確かめる。

0 件のコメント:

コメントを投稿