PRML勉強会で発表してきた@DeNA(渋谷ヒカリエ)

今日の発表で使った資料をupします。


間違いのご指摘・ご意見等ありましたら、ブログのコメント欄やtwitter等で気軽に話しかけてください。
実は、今日は動くモノを準備していたのですが、変な空気の読み方をしてしまい不発となってしまいました。なので、ここで簡単にご紹介します。
発表後半の直線フィッティングの話です。
データ生成の際に乗せるノイズの強さや、データの数を変えることで、パラメータの推定値がどう振る舞うかを解析するプログラムです(R実装)
具体的には次のようになります。黒で引いた直線のパラメータには、wのMAP解を使っています。

N=20, Beta=25(テキストの例)

N=20, Beta=5(ノイズ大)

N=100, Beta=5(ノイズ大、データ数多)

N=1000, Beta=5(ノイズ大、データかなり多)

この結果から、以下のことが読み取れると思います。また、直観的にも理解しやすいと思います。
1.ノイズが大きいほど予測しづらい
2.データが増えるほど予測しやすい。

最後に、ヒカリエ21Fから見た夕日がきれいでした。