最尤法について
書くまでもないかもしれないけど、最尤法について書いておきます。
最尤法とは
与えられたデータから、母数を推定する手法のこと。母数とは、その関数を特徴付けるパラメータのことで、xからyを求めるんじゃなくてyからaを求めるみたいなイメージ。
データが与えられて、適当に母数を当てはめて、それっぽい(尤もらしい)パラメータを推測する。それっぽい、つまり確率がもっとも高くなる母数を推定するということ。
やってみよう
A君がバスケのフリースローを50本中30本決めたとします。このときの確率はいくつか。ここでいう確率が母数で、50本中30本決めたというのがデータになります。
このときの尤度関数、つまり確率は以下の式によって求めることができる。
これを最大にするようなpを求めます。対数をとるほうが計算しやすいので対数をとります。
微分して0を代入。
となり、このときのもっともそれらしい確率は0.6になります。でもこの場合は、こんなことをしなくても最初から30割る50をすればすぐに求まりますね。
では次です。先程の問題では、確率の結果(分布)が、フリースローが入るか入らないかの2択で離散でした(ベルヌーイ試行)。これが連続値になると、確率の求め方がそれによって変わります。例えば、正規分布にしたがうランダムな値をn個生成したとします。このn個の値から、正規分布の母数であるとを最尤法によって推定してみます。ここで、とします。まず、ここでの尤度関数を求めます。
すべてののなかからを選ぶ確率は、ここでは正規分布に従っているので、
となります。ということは、からまでの値を選ぶ確率(尤度関数)は、それぞれを選ぶ確率の積で表せるから、
となる。この関数を最大にするようなを求める。これも対数をとってから、それぞれの偏微分を求めて0を代入する。
まとめ
- 尤度は確率
- 分布や母数が連続か離散かで尤度関数の求めかたが変わる
- 分布の一部を尤度関数にあてはめて母数を推定するのが最尤法