2019年3月21日木曜日

確率ゲーム(京大入試より)

 ちょっと古いものですが、京都大学の入試問題(数学)に ゲーム理論っぽいもの を見つけました。(京都大学 文系学部 1977年度)



(1) サイコロを1回または2回ふり、最後に出た目の数を得点とするゲームを考える。1回ふって出た目を見た上で、2回目をふるか否かを決めるのであるが、どのように決めるのが有利であるか。

(2) 上と同様のゲームで、3回ふることも許されるとしたら、2回目、3回目をふるか否かの決定は、どのようにするのが有利か。



 この問題のどこがゲーム理論っぽいかというと、自分に最も有利な戦略を立てようとしているところ。そして、時間をさかのぼりながら後ろから前へと順に解を求めるところ。ゲームの木の処理の仕方と同じです。
 反対にゲーム理論っぽくないところは、ゲームの相手がサイコロであるところ。つまり「互いに相手の戦略を読み合う」という構図にはなっていないわけです。自分は一生懸命考えて手を打とうとしているのですが、サイコロは何も考えずに気まぐれに手を打ってきます。
  「ゲーム理論」といえばゲーム理論なんでしょうけれど、受験生にとっては普通に「数学の問題」でしょうね。
 でもこの問題、大人にも高校生にも楽しめると思います。(2) は難しいかもしれませんが。
 上の問題がすんなり解けてしまった人は、
(3) 上と同様のゲームで、最大で 10 回までふることが許されるとしたら、どのようにするのが有利か。
これでも考えてみてください。



《解答》
(1) サイコロを1回ふったときの得点の期待値は 7/2 = 3.5 。
         (1回目でも2回目でも3回目でも同じだ)
  よって、1回目にふって出た目の数が 1 , 2 , 3 のいずれかのときは2回目をふり、
      1回目にふって出た目の数が 4 , 5 , 6 のいずれかのときは2回目をふらない … (A)
  これが最も有利な戦略である。

  この戦略に出た場合の得点の期待値は 3/6×7/2+1/6×4+1/6×5+1/6×6=17/4=4.25 … (B)
  無条件に2回目をふる、もしくは無条件に2回目をふらない場合の得点の期待値は 7/2=3.5 … (C)
  確かに、(B) の方が (C) より有利だ。

(2) サイコロをふるチャンスが残り1回となった時点では上記 (A) の戦法を採るべきだ。
  さて、1回目をふった後に2回目をふるか否かの判断をどうすればいいか?
  2回目をふった時点で戦法 (A) を採れば期待値は (B) になるから、1回目に出た目と (B) をくらべればいい。
  よって、1回目にふって出た目の数が 1 , 2 , 3 , 4 なら2回目をふり、5 , 6 なら2回目をふらない
      2回目にふって出た目の数が 1 , 2 , 3  なら3回目をふり、4 , 5 , 6 なら3回目をふらない … (D)
  これが最も有利な戦略である。

  この戦略に出た場合の得点の期待値は 4/6×17/4+1/6×5+1/6×6=14/3 ≒ 4.67 … (E)
  (B) よりさらに期待値が上がった。


ついでながら、ここでもう1問追加してみます。

(3) 上と同様のゲームで、最大で 10 回までふることが許されるとしたら、どのようにするのが有利か。
(2) から「最後から3回目のサイコロをふった時点では上記 (D) の戦法を採るのが最も有利だ」といえる。
さて、最後から4回目をふった後に次をふるか否かの判断をどうすればいいか?
それには、最後から4回目に出た目と (E) をくらべればいい。
その結果、最後から4回目に出た目が 1 , 2 , 3 , 4 なら次をふり、5 , 6 なら次をふらない となる。

さて、この計算をいつまで続ければいいのか?
ところで、(B) , (E) にあたる値はこの後増え続けて、減ることはない。また、6 を超えることもあり得ない。
その値が 5 より大きければ「サイコロの目が 6 ならそこでやめ、それ以外なら続けるのがよい」となる。
その値が 5 より小さければ「サイコロの目が 5 , 6 ならそこでやめ、1 , 2 , 3 , 4 なら続けるのがよい」となる。
だから、(B) , (E) にあたる計算をし続けて、5 を超える瞬間を見つければいいのである。

そこで、計算を繰り返す。
4/6×14/3+1/6×5+1/6×6 = 89/18 ≒ 4.94 ・・・ おしい、、もうちょっと。
この値は「最大で4回ふることが許される場合の期待値」であり、
このことから「最後から5回目に 5 , 6 が出たらそこで止め、1 , 2 , 3 , 4 なら続けるのがよい」ことがわかる。

ゴールは近い、もう1回。
4/6×89/18+1/6×5+1/6×6 = 277/54 ≒ 5.13 ・・・ やったぁ、超えたぁ。
この値は「最大で5回ふることが許される場合の期待値」であり、このことから「最後から6回目に出た目が 6 ならそこで止め、 他の目なら続けるのがよい」ことがわかる。

この先はずっと同じである。例の期待値はこの後も増え続けるが、6 には到達しないのだから、「6 が出たら止めて、6 が出なかったら続ける」のが最も有利である。

以上をまとめると、
(3) サイコロを最大で 10 回までふってよくて、最後に出た目を得点とするゲームを考える。
  10 回未満の回数でやめてもよい。このゲームで最も有利な戦略はどんなものか。
の答えは
1~5回目では 6 の目が出た時点でやめ、6 が出ないなら続ける。
6~8回目では 5 か 6 の目が出た時点でやめ、5 , 6 が出ないなら続ける。
9回目では 4 , 5 , 6 が出たらやめ、1 , 2 , 3 が出たら最後の 10 回目をふる。
となる。計算ミスしてなければ 。。。


0 件のコメント:

コメントを投稿