4.0.3 -> 4.1.1 - 報國挺身日記

世界コンピュータ将棋選手権はGPS将棋の優勝だった。
KCCは予選のプログラムから変更したもので、最初の三局を戦ったらしい。もし予選のままで最初から出ていれば優勝した可能性もある。しかしこのクラスになると実力が接近しているので、七局の結果だけでは、どれが一番強いかわからないだろう。

今朝、ボナンザ4.1.1をダウンロードした。
今のところ、学習に関係ある部分しか見ていないが、次のような変更があった。

学習中の探索の深さが1から3に変わった (SEARCH_DEPTH)
KPP/KKPの一回の更新量が、可変から1固定になった
評価関数evaluate()がptree->stand_pat[ply]を参照して、値があればそれを返すようになった
評価関数evaluate()がehash_tbl[]を参照して、値があればそれを返すようになった

探索の深さの変更は１から２になったと書いてあった筈だが、ソースを読むと何故か３になっている。
更新量が１固定になったと言っても、乱数による効果はそのまま残っている。更新量が１固定ということは、第二フェーズの繰り返しの回数がnstepそのものになるので、第二フェーズの時間がかなり増えてしまうだろう。
ehash_tbl[]は、新しく追加された評価関数用のハッシュテーブルで、全体サイズは4194304エントリで34MB。