hidekatsu-izuno 日々の記録

プログラミング、経済政策など伊津野英克が興味あることについて適当に語ります(旧サイト:A.R.N [日記])

「確率統計-機械学習その前に-」を更新した(version 2.3)

以前から公開していた「確率統計-機械学習その前に-」を拡充して Speaker Deck で再公開しました。

SlideShare がある時からスライドの再アップロードが完全にできなくなってしまい、間違いの修正すらできなくて困っていましたが、今後はこれで随時更新をかけられるようになります。

変更内容としては以下の通り

  • uncorrelated 氏から受けた指摘内容の反映
  • 対数変換、誤差が正規分布でない場合の対応の追加
  • 統計的因果推論についての記述を追加

[2021/12/18 追記/ここから]

  • 対数変換に関する記述の誤りを修正
  • 回帰分析の誤差構造に関する条件に関する記述の誤りを修正
  • 例数設計に関する記述を追加

[2021/12/18 追記/ここまで]

ネット上の確率統計に関する資料はひどいものばかりだ教科書読めと言う議論をよく目にしますが、このスライドもそのひどいもののひとつであることは疑いありません。この資料は元々は社内の勉強会に向けて作った(結局、使わなかった)ものですが、基本的には自分の得た知識をまとめておくために更新を続けています。

本職はただのプログラマで日ごろ統計の知識を使うことはないので、一度理解してもしばらく経つと忘れてしまいがちです。このようにして、知識を書き出すようにしておくと、更新する際に何度も読み返すので、多少は記憶にとどまりやすくなるようです(当社比)。

Twitter を見ていても確率統計は難しい話題のようで、専門家と称しているいる人でも間違ったことを書いていたり、(渡辺ベイズの議論のように)専門家と目される人同士であっても見解の相違が大きかったり、統計学と科学哲学で用語の定義が違ったりと「正しい」ことを言うのがなかなか難しい分野のようです。

実際、心理学の危機に見られるように本来統計学を専門家並みに理解していなければならない研究者ですら、理解がおぼつかないケースも散見されます。

このような状況ですから、個人的見解としては「正しくなければ公開すべきでない」という発想は捨てて、対話をし納得すれば修正・訂正する(納得しなければ修正しない)というオープンソース同様のプロセスを続けるしかないな、と考えています。そう思わない人もいるかとは思いますが、私はそう考えることにしました。

というわけで今後もインターネット上にあるひどい資料を公開し続けると思いますが、そこのところよろしくお願いします。