hidekatsu-izuno 日々の記録

プログラミング、経済政策など伊津野英克が興味あることについて適当に語ります(旧サイト:A.R.N [日記])

確率統計の勉強用資料を公開してみた

確率統計なんて趣味の範疇ならともかく仕事じゃ絶対に使わないよなぁ、とは思っていたのだけど、ここ最近の機械学習の隆盛で必ずしもそうとも言い切れない状況にある。

機械学習と言えばディープラーニングだけれど、画像、映像系ならともかく、テキストデータ中心の業務系の問題への適用を考えるとロジスティック回帰、SVM、ランダムフォレスト、自然言語処理くらいは押さえておかないとダメかな、という感じもあり、そうすると確率統計の基礎も押さえていかざるをえない。

うーん、システム開発の現場にそのレベルの知識、経験って現実的に適用可能なのだろうか。業務システム開発の世界は、基本的に努力と根性の世界であってアカデミックな知識からは最も遠い場所にある。

まぁ、とはいえ、日本のコの業界も少しづつ変わっていけばいいな、と思っているのでその一助になればと。社内勉強会の資料にもそのうち流用する予定。

正直なところ、私のこの分野に関する知識レベルは高くないし、確率統計界隈はマサカリ飛び交うマッドマックス的世界なので、公開するか自体を迷いはしたのだけど、おかしなところを指摘してもらえればきっと理解も深まるだろうと考えることにした。何かあればコメントいただければ幸いである。