2019年3月17日日曜日

転校生は 女の子? 男の子?

 ベイズ推定の仕組みが実感できるような確率の問題を作りました。



 女の子と男の子が生まれる確率をそれぞれ 1/2 とします。小学生のベイズちゃんの家の隣に家族が引っ越してくることになりました。その家のお母さんがベイズちゃんの家に挨拶に来て、言いました。
  • うちには子供が2人いて、上の子が中学生で、下の子が小学生です。 ・・・ (A)
ベイズちゃんは、下の子が女の子なのか、男の子なのか、とても気になりました。確率の計算が得意なベイズちゃんは、隣の家のお母さんの次の言葉を待っています。新しい情報によって、隣の家の「下の子が女の子なのか、男の子なのか」についてのベイズちゃんの見込み(条件付き確率)が変わるからです。
 さて、もし隣の家のお母さんから次の3つの情報のいずれかが得られたとすると、ベイズちゃんの見込みはどのように変わるでしょうか。
  • うちには女の子がいます。  ・・・ (B)
  • 上の子は女の子です。    ・・・ (C)
  • うちの息子はイケメンです。 ・・・ (D)
では、ここで【問題】です。次のそれぞれの場合の「下の子が女の子である確率」を求めてください。
  1.  ベイズちゃんが (A) の情報を得た時点
  2.  (A) に加えて (B) の情報を得たとき
  3.  (A) に加えて (C) の情報を得たとき
  4.  (A) に加えて (D) の情報を得たとき
  5.  (A) , (B) , (C) , (D) のすべての情報を得たとき
ベイスちゃんの見込みは新しい情報によってどんどん変わります。



 では、《解説・解答》といきましょう。
  • うちには子供が2人います。 ・・・ (A)
さて、これだけの情報から「下の子が女の子である確率」を判断しようとすると、(A) には性別に関する情報は何も含まれていませんから、1/2 と判断せざるを得ないでしょう。そこに、
  • うちには女の子がいます。  ・・・ (B)
という情報が加わると、その確率はどのように変わるでしょうか。その女の子が、上の子なのか、下の子なのかは分かりません。ですから、「下の子が、女の子なのか、男の子なのか」について、確実なことは分かりません。でも、「下の子が、女の子である確率」は (A) の 1/2 から動いています(よね?)。さて、その値をどうやって算出したらいいでしょうか。

 なにはともあれ、書き出してみましょう。最初の (A) の状態に戻ると、この時点で2人の子供の性別について、次の4通りが考えられます。
  • 上が女の子で、下も女の子 ・・・ (ア)
  • 上が女の子で、下が男の子 ・・・ (イ)
  • 上が男の子で、下が女の子 ・・・ (ウ)
  • 上が男の子で、下が男の子 ・・・ (エ)
そして、この4通りはどれも同様に確からしい。このうち「下の子が女の子」なのは (ア) と (ウ) の2通りですから、その確率は 2/4 = 1/2。これが (A) の情報だけから出てくる確率です。
 そこに (B) の情報が加わるとどうなるかというと、(エ) の可能性が消えます。そして、全部で (ア) , (イ) , (ウ) の3通りとなって、そのうち「下が女の子」なのは (ア) と (ウ) の2通り。というわけで、「下の子が女の子である確率」は 2/3 となります。
 また、(A) に
  • 上の子は女の子です。    ・・・ (C)
という情報が加わると、(ウ) と (エ) の可能性が消えます。残るのは (ア) と (イ) だけになって、このうち「下の子が女の子」なのは (ア) だけ。というわけで、「下の子が女の子である確率」は 1/2 となります。
 また、(A) に
  • うちの息子はイケメンです。 ・・・ (D)
という情報が加わると、イケメンかどうかはともかく、上の子か下の子のどちらかが男の子であることが分かりますから、(ア) の可能性が消えて、可能性があるのは (イ) か (ウ) か (エ) の3通りになって、このうち「下の子が女の子」なのは (ウ) だけ。というわけで、「下の子が女の子である確率」は 1/3 となります。
 最後に、(A) に加えて (B) , (C) , (D) の3つの情報が得られると、(イ) に決まって、この場合は 「下の子が女の子である確率」 は 0 となります。

 というわけで、
《正解》 は  (1) 1/2  (2) 2/3  (3) 1/2  (4) 1/3  (5) 0   です。

 この流れがベイズ推定です。ベイスちゃんの見込みは新しい情報によってどんどん変わります。

0 件のコメント:

コメントを投稿