前回のエントリで外れ値を分析したが、「画面、帳票、バッチの比率 1.5 : 1.0 : 0.7 という数値は感覚的なもので根拠がない」という問題については残されたままとなっていた。
hidekatsu-izuno.hatenablog.com
以前のエントリで書いた通り、比率を正しく求める手順としては、主成分分析からの重回帰分析が一般的なのだけど、正規分布から外れる場合にはうまく分析できないという問題がある(主成分分析を経由する場合、切片を0にする事ができないという問題もある)。
いろいろ考えたのだが、例えば画面については機能数あたりの画面数で人時工数に重みを付けた上で分位点回帰を行えば、画面あたりの係数が求まる。これを帳票、バッチについても行えば、それなりに妥当な結果が得られるのではなかろうか。
というわけでやってみた結果は以下の通り。なお、箱ひげ図における外れ値は対象外として分析している(前回は、第一分位点~第三分位点に絞ってみたが小規模案件が相対的に減ってしまい、むしろ変な結果になることがわかったため通常の外れ値を使うことにした)。
画面の係数=105.4706 帳票の係数=110.4000 バッチの係数=50.8271
だいたい、画像:帳票:バッチ=1.0:1.0:0.5 というところだろうか。この係数を元に分位点回帰を行うと係数は 1.0247 となる。人月工数に換算すると次の通り。
人月工数=0.68 * 画面数 + 0.71 * 帳票数 + 0.33 * バッチ数
わりあい妥当な線かもしれない。