PRML勉強会で発表してきた@DeNA(渋谷ヒカリエ)
今日の発表で使った資料をupします。
PRMLrevenge_3.3
View more PowerPoint from risuo
間違いのご指摘・ご意見等ありましたら、ブログのコメント欄やtwitter等で気軽に話しかけてください。
実は、今日は動くモノを準備していたのですが、変な空気の読み方をしてしまい不発となってしまいました。なので、ここで簡単にご紹介します。
発表後半の直線フィッティングの話です。
データ生成の際に乗せるノイズの強さや、データの数を変えることで、パラメータの推定値がどう振る舞うかを解析するプログラムです(R実装)
具体的には次のようになります。黒で引いた直線のパラメータには、wのMAP解を使っています。
N=20, Beta=25(テキストの例)
N=20, Beta=5(ノイズ大)
N=100, Beta=5(ノイズ大、データ数多)
N=1000, Beta=5(ノイズ大、データかなり多)
この結果から、以下のことが読み取れると思います。また、直観的にも理解しやすいと思います。
1.ノイズが大きいほど予測しづらい
2.データが増えるほど予測しやすい。