4.0.3 -> 4.1.1

世界コンピュータ将棋選手権GPS将棋の優勝だった。
KCCは予選のプログラムから変更したもので、最初の三局を戦ったらしい。もし予選のままで最初から出ていれば優勝した可能性もある。しかしこのクラスになると実力が接近しているので、七局の結果だけでは、どれが一番強いかわからないだろう。

今朝、ボナンザ4.1.1をダウンロードした。
今のところ、学習に関係ある部分しか見ていないが、次のような変更があった。

  1. 学習中の探索の深さが1から3に変わった (SEARCH_DEPTH)
  2. KPP/KKPの一回の更新量が、可変から1固定になった
  3. 評価関数evaluate()がptree->stand_pat[ply]を参照して、値があればそれを返すようになった
  4. 評価関数evaluate()がehash_tbl[]を参照して、値があればそれを返すようになった

探索の深さの変更は1から2になったと書いてあった筈だが、ソースを読むと何故か3になっている。
更新量が1固定になったと言っても、乱数による効果はそのまま残っている。更新量が1固定ということは、第二フェーズの繰り返しの回数がnstepそのものになるので、第二フェーズの時間がかなり増えてしまうだろう。
ehash_tbl[]は、新しく追加された評価関数用のハッシュテーブルで、全体サイズは4194304エントリで34MB。