※個人の感想※レーティングへの批判
レーティング
プロ将棋界でも非公式ながら利用されるレーティング。イロ・レーティングというものが使われているらしい。
その仕組み自体はよくできたもので、ある程度の対戦データの蓄積があれば、棋士の実力を示す相対値(勝敗予想する上での)としてそれなりに信頼でき、またその時間変化を負うのも楽しい。
レーティングに足りない要素
ただ、現在のレーティング情報で欠落してしまっている情報のうち、
・先手後手の得意不得意
・持ち時間の長さと得意不得意
は勝敗予想する上ではできれば考慮したいものではないか。
特にプロ将棋界では一般に先手が有利とは言われているし、その一方で後手番特有の戦術(例: 横歩取り)を得意とする棋士もいる。先手後手の得意不得意は勝敗に影響を与える因子として重要ではないか。
持ち時間についても棋士ごとに得意不得意がありそうだ。明らかに長時間棋戦か得意と公言する棋士(例: 斎藤慎太郎八段)もいれば、どちらかというと短時間棋戦で力を発揮する棋士もいる。羽生九段と藤井竜王の強さの比較、なんて文脈でもこの議論はある。やはり持ち時間の情報は欠かせない。
情報量の視点
現状のレーティングにこれらの先手後手の情報や持ち時間の情報を加えようとするためには、「層別」して計算し直さなくてはならない。
例えば藤井竜王を例に取るとして、先手の藤井竜王と後手の藤井竜王のレーティングを分けて計算するには、先手の藤井竜王の戦績と後手の藤井竜王の戦績を分けて、それぞれ計算しなければならない。
これに持ち時間の情報を加えるとしよう。例えば持ち時間5時間以上の棋戦を長時間、1時間以下の棋戦を短時間、その間を中時間の棋戦の3カテゴリーに分けたとする(カテゴリーの分け方は仮)。藤井竜王の戦績を、先手×長時間、先手×中時間、先手×短時間、後手×長時間、後手×中時間、後手×短時間の6層に分けてレーティングをそれぞれ計算しなければならない。
計算すること自体は可能だが、それぞれの層の戦績データは少なくなってしまうので、それぞれのレーティングの信頼性が落ちてしまう。
6パターンの藤井竜王をそれぞれ別人として計算することになるが、6人は同じ藤井竜王なので6パターンの藤井竜王の実力にはそれなりに関連があるはずである。
それらの情報を削ぎ落として信頼性の低いレーティングを計算するのは、なんかもったいない。
オリジナルのレーティングを作ろう
ならこれらの弱点を克服するレーティングを、データ解析の手法を用いて開発しましょう、というのが私のモチベーション。
最近データのモデル解析をやってなくて腕が鈍っている感覚があるので、その維持向上も目的の一部としてあります。なので試行錯誤課程もブログに残します。
難しくては途中で心が折れてしまうかもだけど、できたらできたで観る将ライフにきっと新しい視点を提供できるので、自己満足でもいいからやってみたいな、と。
今日はこれでおしまい。