将棋AIでは、教師(教師局面)を生成して、そこから評価関数パラメーターの学習を行っている。AlphaZeroなんかもそうしている。 教師は、実際に対局して生成する。ところが、この対局は、1手指すごとに何千とか何万とかの局 … 続きを読む
The post 将棋AIの強化学習の基礎が根底から変わりそうな件 first appeared on やねうら王 公式サイト.
将棋AIでは、教師(教師局面)を生成して、そこから評価関数パラメーターの学習を行っている。AlphaZeroなんかもそうしている。 教師は、実際に対局して生成する。ところが、この対局は、1手指すごとに何千とか何万とかの局 … 続きを読む →
The post 将棋AIの強化学習の基礎が根底から変わりそうな件 first appeared on やねうら王 公式サイト.