hidekatsu-izuno 日々の記録

プログラミング、経済政策など伊津野英克が興味あることについて適当に語ります(旧サイト:A.R.N [日記])

確率統計

なぜ統計モデルは一次関数と正規分布ばかりなのか

「統計学とは何か、そしてベイズ統計学の話」に反論があまり寄せられなかったので調子に乗って、今度は(古典的な)統計モデルの話(ただ、だいぶ理解の怪しい話なので間違いがあれば教えてほしい)。 現実の世界では単なる加減算だけでなく2乗や 3 乗ある…

ニューラルネットとランダムフォレストと統計学の決定的違いって何?

最近、統計学にはそれなり詳しくなってきたと思う一方、統計学と機械学習は本質的に何が違うのか、という基本的なところでずっともやもやを抱えていた。統計学にもノンパラメトリックなものはあるし、統計学も広い意味では機械学習のひとつと言えなくもない…

なぜ統計学には主義が必要なのか

前回「ベイズ統計学に関する議論を整理する」では、できるだけ中立的な視点で書くことに注力し、伊津野なりの結論については特に書かなかった。今回のエントリでは、様々な見解や調べた結果を元に私見を書く。 もちろん、伊津野は専門家ではなく、情報や理解…

ベイズ統計学に関する議論を整理する

最近、「統計学を哲学する」の出版をきっかけとした Twitter 上の議論を追いかけながらベイズ統計学について調べている。 統計学を哲学する作者:大塚 淳発売日: 2020/10/26メディア: 単行本(ソフトカバー) 前々からベイズ統計学については興味があったので…

最後の工数見積りの海を彷徨う(外れ値分析編)

過去、幾度となくIPAの資料に基づき工数見積りを計算するためのエントリを書いた。 hidekatsu-izuno.hatenablog.com 最後のエントリを書いてからしばらくが経ち「ソフトウェア開発データ白書2018-2019」が出ていたのも知っていたけど、前回の分析データで概…

Python で主成分分析(PCA)する

工数の分析にあたり、画面、帳票、バッチの重み付けをシステマティックに行いたいという積年の課題があり、単純に考えると重回帰分析を行えばという話なのだけど、実際にやってみるとまったく予想外の結果がでる。 df= pd.read_csv('./IPA_2014-2019.csv') m…

「確率統計-機械学習その前に v2.0」を公開した

以前、社内の勉強会用の資料として作成した「確率統計-機械学習その前に」という資料を今回大幅に改定して公開しました。 改定の一番のポイントは、統計分析の総覧的なガイドとして使えるようにしたことです。正直な話、内容的に私自身も十分に理解出来てい…

工数見積りの海を彷徨う・征服

過去、何度かIPAの資料に基づき工数見積りを計算するためのエントリを書いた。今回のエントリは、その暫定解決編という位置づけとなる。 hidekatsu-izuno.hatenablog.com hidekatsu-izuno.hatenablog.com hidekatsu-izuno.hatenablog.com 前回までは、ロバス…

Python での統計処理メモ

たまに時間があると統計を身に着けようと試みているのだけど、データサイエンティストというわけでは当然ないので、すぐにやり方を忘れてしまう。というわけで今日のエントリは完全にメモ書きです。はい。 環境 Python は Anaconda を使ってインストールする…

「ダメな統計学」お勉強メモ

アレックス・ラインハート著「ダメな統計学」は、いわゆるトンデモ統計批判の書ではない。ここで説明されるのは、科学者が意図せず間違って使用している確率・統計の手法についてだ。科学者ならば統計についての知識水準は高いものがあるのだろうと思ってい…