評価パラメタ (1)

前回書いたように、評価パラメタのKPPとKKPは、その要素数が膨大である(KPP:9000万弱、KKP:500万弱)。最早、人間が手動で調整できるものではない。
Bonanza 4.0.3の配布ファイルの中に、fv.binというファイル名で学習済みの評価パラメタが提供されている。
このファイルは、Bonanzaを起動した時点で読み込まれる。fv.binの中にあるのは、評価パラメタのうちKPPとKKPだけで、駒の種類ごとの価値は含まれていない。駒の価値は、ソースファイルの中のparam.hで与えられているので、プログラムをコンパイルしなければ変更できない。


KPP/KKPの値が実際にどうなっているのかを、fv.binを読み込んで調べてみる。

KPP 最小値: -12690, 最大値: 8107, 平均値:-0.10, 標準偏差: 38.49
KKP 最小値: -2950, 最大値: 3403, 平均値: 0.19, 標準偏差: 5.61


KPP/KKPの各要素に対応する駒の位置関係が実際の局面で実現する確率はそれぞれ全く異なるので、単純に平均をとってみても意味はないが、計算するとこのようになった。

値の比率を見ると、以下のように0の付近の小さい値が大半である。

KPP value ratio
valueratio
-50.11%
-40.17%
-30.51%
-25.59%
-121.43%
034.76%
126.12%
28.12%
30.65%
40.19%
50.11%


KKP value ratio
valueratio
-50.09%
-40.15%
-30.51%
-25.87%
-121.99%
035.01%
125.87%
27.94%
30.64%
40.16%
50.09%

KPPの場合、値の絶対値が20以内に99%, 107以内に99.5%, 473以内に99.9%が含まれている。
KKPの場合、値の絶対値が12以内に99%, 50以内に99.5%, 333以内に99.9%が含まれている。