以前、社内の勉強会用の資料として作成した「確率統計-機械学習その前に」という資料を今回大幅に改定して公開しました。
改定の一番のポイントは、統計分析の総覧的なガイドとして使えるようにしたことです。正直な話、内容的に私自身も十分に理解出来ていない部分も多いのですが、いろいろ調べた結果、なんとなく統計分析の手法マップ的なものが頭の中に出来上がってきたので、それをアウトプットとしてまとめてみました。
確率統計に限った話ではありませんが、新しい分野を学ぶ初学者にとって、全体像がよくわからないため混乱することが少なくありません。この資料を読むことでなんとなくでも全体を把握できていれば、他の文献を読む際にも理解が容易になるのではと思っています。
例によって、確率統計については完全に素人なので、間違いもあるかもしれません。その場合はそっと教えてもらえると幸いです。最近 SlideShare は再アップロードが廃止され、直接修正が難しいところもありますが、何らかの形で訂正できればと思います。
資料化したことで個人的にも気づきがありました。
昨今、とりあえずなんでも機械学習に入れてしまえという風潮が目立ちますが、原因を分析し意思決定する場合には、機械学習や非線形回帰はさほど役に立たず、確率統計こそが必要なのだ、ということがようやく理解できたような気がします。
その意味で、昨今ベイズ推定の本が増えているのは当然の流れなのかもしれません。頻度主義確率に基づく統計分析は理解も解釈も難しいのに対し、ベイズ推定による統計分析は(覚えるまでは大変ですが)結果の解釈も含め直観的で使い勝手のよいツールに感じられます。