では、まず考えていた問題をもう少し正確に書いておこう。
問題
2つの特徴、例えば、背の高さと足の速さのようなものを考える。これらはそれぞれ、{高い, 低い}と{速い、 遅い}を取るとする。小学4年生男子を、この特徴で分類すると4つに別れる。これらの数をそれぞれ\(n_{11}, n_{12}, n_{21}, n_{22}\)と書くことにする。ここで左のインデックスを背の高さ、右のインデックスを足の速さとし、
\[ \begin{align*} &(\text{高い}, \text{低い}) \to (1, 2)\\ &(\text{速い}, \text{遅い}) \to (1, 2) \end{align*} \]
という対応をとるとする。このようにすると、特徴の詳細に全く依らない書き方になる。
\(n_{ij}\)の合計は\(n\)に固定しておく。これらの分類がどれだけの割合になるかは分からないとする。
この2つの特徴は独立であるとすると、特徴1が\(i\)、特徴2が\(j\)に分類される確率\(p_{ij}\)は次のように2つの確率の積で書ける。
\[ p_{ij} = p_{i\circ} p_{\circ j}\]
最尤推定から、これらの確率を推定すると結果は次のようになる。
\[ \begin{align*} &p_{i\circ} = \frac{n_{i \circ }}{n},~~~~p_{\circ j} = \frac{n_{\circ j}}{n}\\ &n_{i \circ} := n_{i 1} + n_{i 2}\\ &n_{\circ j} := n_{1 j} + n_{2 j} \end{align*} \]
このときの確率分布を求めよ。
\[ p_{ij} = p_{i\circ} p_{\circ j}\]
最尤推定から、これらの確率を推定すると結果は次のようになる。
\[ \begin{align*} &p_{i\circ} = \frac{n_{i \circ }}{n},~~~~p_{\circ j} = \frac{n_{\circ j}}{n}\\ &n_{i \circ} := n_{i 1} + n_{i 2}\\ &n_{\circ j} := n_{1 j} + n_{2 j} \end{align*} \]
このときの確率分布を求めよ。
この問題は明日、計算しよう。これがうまくいけば次は、最終的な確率変数が2つの場合をやる。
0 件のコメント:
コメントを投稿