黒と白の勝率

オセロの大会では多くの場合、伏石によって黒番・白番を決めます。引き分けありの大会では上下を宣言して、宣言した人がその面の色を持つことになるので、実質的には運で決まります。一方、引き分けなしの大会では上が黒か白かを当てて、当たったら「色を選ぶ権利」「引き分け勝ちの権利」のいずれかを選択することができます。では当たった時にどれを選択するのが一番有利なのでしょうか?もちろん人によって得意・不得意はあるので絶対的な答えがあるわけではないですが、一般的な傾向を見てみたいと思い、調査をすることにしました。

ネット上で見てみると、オセロの必勝法のサイトやコンピュータプログラムによる実験で検証で白番が若干有利だと述べられています。ただ引き分けを含めて考えた場合、色の選択は放棄して引き分け勝ちを選んだ方が良いのか、若干有利と言われる白を選んだ方が良いのかまではわかりませんでした。

そんな中、umigame_p七段のブログはその名も「黒引き分け勝ち」で、引き分けの場合は黒が勝ちだとすればちょうど良いくらいではないかという説を提唱しておられます。今回は、実際の対局結果を使ってこの仮説を検証してみたいと思います。

元データ

調査には黒番・白番がはっきりしている大量の勝敗結果が必要ですが、手番の価値の調査でも使ったフランスオセロ連盟のWTHORファイルを使うことにします。今回は黒と白の勝率や引き分けの比率がわかれば良いので、単純に集計をすれば良いと思っていました。しかしこのファイルにはいろいろと罠があり、思いの外苦労しました。

結果の前にちょっとだけ苦労話にお付き合いください。

終局していない棋譜がある

実は前回の手番の価値の調査をした時から気づいていたのですが、WTHORに収録されている棋譜の中には最終局面まで行かずに終わっている棋譜があります。それでも最終スコアの項目があるので、それを使って集計することもできますが、途中までの棋譜は念のため集計対象から除外することにしました。

ソフトの棋譜が紛れ込んでいる

最初は気付かずに集計していたのですが、1年だけやたらと引き分けが多い年があり、調べてみたらソフトの棋譜が紛れ込んでいることがわかりました。今回は人間が対局するにあたっての勝敗・引分の比率を知りたいので、ソフトのデータは除外したいところです。WTHORのフォーマットにはソフトかどうかを表す項目はないのですが、どうやらソフトの場合は選手名が「ソフトウェア名 (作者名)」という書式になっているようなので、選手名にカッコがついている対戦を除外することにしました。

選手不明の棋譜がある

ID:0番の選手名が“???”なので、おそらく選手名が不明な棋譜なのでしょうが、調べてみるとソフトとも対局しているケースがあり、ID:0番自身がソフトのケースもありそうなので、ID:0番は集計から除外することにしました。

集計結果

そんな罠にはまりながら集計した結果が以下です。

試合数 黒勝利 白勝利 引分
82,309 39,073(47.47%) 40,898(49.69%) 2,338(2.84%)

ここで「引分」というのは32石対32石になった試合を表しています。もちろん、引き分けなしの大会もあるのでどちらかが勝っている可能性はありますが、この集計結果においては引き分けありとみなしています1)

黒勝利+引分で50.31%なので微妙に50%を超えてはいますが、ほぼ50%という結果です。約8万局からの推定なのでそこそこの精度はあると思いますが、試しに95%信頼区間を計算してみると、

黒勝利 47.13%〜47.81%
白勝利 49.35%〜50.03%
引分 2.73%〜2.95%

となり、ギリギリですが50%も含まれる結果となっています。冒頭の「黒引き分け勝ち」説はかなり妥当な線のようです。

ついでにわかったこと

石数

WTHORは勝敗だけでなく、石数の情報もあります。黒から見た最終スコアの分布は以下のようになっていました。 31石が最頻値になっています。また64対0の方が63対1より起こりやすいのも見てとれます。石数の平均値は31.97でした。これが勝率の微妙な差になっているのでしょう。

さらにもう1つ興味深いことがわかりました。WTHORには残り24マス時点での理論スコア(つまり残り24手が双方最善だった場合のスコア)が載っているのですが、その平均値は32.66でした。残り24マス時点では若干黒の方が優勢なようです。最終的には黒が負け越していますから、残り24マスで逆転していることになります。白の方が偶数理論を目指して打てる分、考えやすいということでしょうかね?

年度別

年度別の勝敗の状況も見てみました。が、あまり面白いことはわかりませんでした・・・(なら書くなって)

ソフトの結果

WTHORにはソフトの結果もあるので、調べてみました。 ソフトの結果は90年代が中心のようなので、人も勝ててはいるようです。ソフト同士の対決では引き分けが大分多く、黒と白ではより白が有利になっているのも興味深いところです。

  • 勝率は黒47.47%、白49.69%、引分2.84%で、引き分けありなら白が2%くらい有利
  • 引き分けなしなら、黒が引き分け勝ちを持っているとほぼ互角
  • 残り24マス時点では黒の方がやや優勢
  • ソフト同士の戦いは引き分けが多い

1)
さらに言えば、引き分けありの試合かなしの試合かで、トップクラスの人たちは打ち方が変わってくる可能性があるので、そういう不正確さもあることをご了承ください

ログインするとコメントできます。
  • stats/bw_win.txt
  • 最終更新: 2017/10/08 08:18
  • by lavox