4.0.3 -> 4.1.1
世界コンピュータ将棋選手権はGPS将棋の優勝だった。
KCCは予選のプログラムから変更したもので、最初の三局を戦ったらしい。もし予選のままで最初から出ていれば優勝した可能性もある。しかしこのクラスになると実力が接近しているので、七局の結果だけでは、どれが一番強いかわからないだろう。
今朝、ボナンザ4.1.1をダウンロードした。
今のところ、学習に関係ある部分しか見ていないが、次のような変更があった。
- 学習中の探索の深さが1から3に変わった (SEARCH_DEPTH)
- KPP/KKPの一回の更新量が、可変から1固定になった
- 評価関数evaluate()がptree->stand_pat[ply]を参照して、値があればそれを返すようになった
- 評価関数evaluate()がehash_tbl[]を参照して、値があればそれを返すようになった
探索の深さの変更は1から2になったと書いてあった筈だが、ソースを読むと何故か3になっている。
更新量が1固定になったと言っても、乱数による効果はそのまま残っている。更新量が1固定ということは、第二フェーズの繰り返しの回数がnstepそのものになるので、第二フェーズの時間がかなり増えてしまうだろう。
ehash_tbl[]は、新しく追加された評価関数用のハッシュテーブルで、全体サイズは4194304エントリで34MB。