2019年5月4日土曜日

差があるのか、たまたまか

(慶応大学商学部2016年度入試・論文テストより)

【問題】以下の文章を読んで、次の問1~問5に答えなさい。

 Aさんは大学の課題レポートの研究テーマとして、ネット広告を出すことが売上に及ぼす効果に興味を持ち、ある業種の企業を対象にアンケート調査を行った。ランダムに選んだ企業に質問書を送付し、150社から回答を得た。その結果を表1の「実測値」の行に示す(以下、本文中のデータは全て仮想のものである)。表1の通り、企業は4つに分類され得る。すなわち、「(最近1年以内に)広告を出して、そののち売上が増えた企業」、「広告を出して売上が増えなかった企業」、「広告を出さず売上が増えた企業」、「広告を出さず売上が増えなかった企業」である。これらをそれぞれカテゴリー1~4と呼ぶことにする。表1を見ると、売上が増えた企業の割合は、ネット広告を出した企業では30社中21社であり、広告を出さなかった企業(120社中54社)より高い。(a) この結果に基づき、Aさんは「ネット広告を出すことで、売上が増えた」と考えた。しかし、友人Bさんは「この割合の違いは、サンプリングの偶然によるものではないか?」と指摘した。 仮に「ネット広告を出したか否か」(要因1)と「売上が増えたか否か」(要因2)の間に関係がなくとも、質問紙を送る企業を選ぶ際などの偶然によって、「たまたまカテゴリー1の企業が多めにサンプリングされる」ということが起こり得る。しかし、サイコロの同じ目が何度も出続けることが稀にあるように、非常に偏った調査結果も偶然で得られる可能性がある。「偶然だ」、「偶然ではない」という不毛な水掛け論を避け、2つの要因の間の関係の有無を判断するにはどうしたらよいだろうか。

表1.Aさんのアンケート調査の結果
ネット広告を出した出さない合計
売上が増えた
(カテゴリー1)
増えない
(カテゴリー2)
増えた
(カテゴリー3)
増えない
(カテゴリー4)
実測値(O)2195466150
期待値(E)15(1)(2)(3)150

 データを使用する多くの研究で生じる同様の問題を、統計的仮設検定は解決してくれる。どのような調査結果も偶然で起こり得るのであれば、単なる偶然でそのような結果が得られる確率を実際に計算するのである。この結果があらかじめ定めた基準(通常0.05)よりも低ければ、偶然の結果とみなさず、何か意味のある(=有意な)結果が得られたと考える。例えば「店舗の改装の有無により、売上が異なると解釈できるデータを得たとしよう。この解釈を統計学的に検証するためには、「店舗の改装の有無によらず、売上には差がない」と、まずは仮定する。そう仮定することで、実際に観察された売上の差が単なる偶然によって生じる確率を計算できる。この例のように、「観察された差は単なる偶然の産物であり、意味のある差ではない」と仮定する考えは帰無仮説と呼ばれる。一般的に、帰無仮説に基づいて計算された確率Pが0.05を下回る時にのみ、すなわち「単なる偶然では20回に1度あるいはそれ以下の確率でしか生じない事象が起こった時」のみ、帰無仮説を捨て去る。このようにして、観察された差は有意なものであると判断するのである。
 まずは簡単な例で考えよう。ある新商品を購入した人の8人中7人が女性だった場合、企業は「この製品は女性好みかも知れない」と感じるだろう。この際、帰無仮説は「この商品への好みに男女差はない」となる。ヒトの男女比はほぼ1:1であるので、帰無仮説のもとでは、ある一人の購入客が女性である確率はq=0.5である。この時、全n人の顧客のうちk人が女性である確率は、{n!/{k!(nーk)!}qn という式で表される。従って、8人中7人が女性となる確率は (4) であり、0.05を下回る。しかし、例えば帰無仮説のもとで最も起こりやすい「500人中ちょうど半数が女性」である確率でさえ、同式で計算すると約0.04(<0.05)となるように、この数字だけで判断するのは誤りである。より極端なパターンである「8人の購入客全員が女性」である確率約0.0039を加える。さらに、「男性が女性よりもこの商品を好むはずがない」というよほど明確な理由がない限り、逆に男性に偏ったケース(8人中7または8人が男性)の確率も足し合わせることになる。このように計算されたP値は約 (5) となり、0.05を超えるので、帰無仮説を捨て去ることはできない。すなわち、「この商品は女性好みである」という主張には科学的裏付けが与えられない。このように統計学的仮説検定とは、「観察された差と同等の結果、またはより極端な結果が偶然によって得られる確率を評価する作業」と考えれば良い。
 Aさんの研究に戻ろう。帰無仮説は「(ア)」となる。この帰無仮説を、表1のようなデータに対して検討する場合、ピアソンのカイ2乗検定という手法がよく用いられる。全体としてネットに広告を出した企業の割合(R)は30/150で0.2となり、同様に、全体のうち売上が増えた企業の割合(S)は (6) となる。サンプル全数(N=150)にRとSをかけて求められる15が、帰無仮説のもと、RとSが無関係だとした時に期待されるカテゴリー1の企業数である。これを期待値(E)と呼ぶ。同様にカテゴリー3の期待値は N×(1-R)×S として計算できる。各カテゴリー1~4の期待値(E)と実測値(O)との差をそれぞれ求める。この差を2乗した値を、それぞれの期待値で割った値 ({O-E}2/E) は、カテゴリー1~4についてそれぞれ2.4、(7) 、(8) 、(9) となる。この4つの値を総計した値はカイ2乗値と呼ばれる。このカイ2乗値の性質はよく調べられているので、統計学の教科書を参照すれば、P値を知ることができる。OがEと異なっているほど、カイ2乗値は大きく、P値は小さい。今回の場合、カイ2乗値が3.84を越えれば、P<0.05で有意、すなわち帰無仮説を捨て去ることができる。実際に表1のデータについてカイ2乗値を求めると、(10) となり、この値を上回るので、ネット広告を出した企業の方が売上が増えていると判断できる。しかし、(b) この検定結果は「ネット上に広告を出したか否か」と「売上が増えたか否か」という2つの要因の間に関係があることを示しているが、両者の間の因果については明らかにしていないことに注意が必要である。また、もしAさんが1/3の企業しか調査せず、カテゴリー1~4のOが全て1/3になった場合、カイ2乗値は (11) となる。たとえ傾向は同じでも、不十分なサンプル数では明確な結論を得ることが難しいことは直感的にも理解できよう。
 Aさんの研究に興味を持ったCさんは、似たような調査を行い、表2に示す結果を得た。この時、カイ2乗値は約5.1となり、結果はやはり有意である。しかもカテゴリー1および4においてO(それぞれ272、22)がE(それぞれ266、(12) )を上回るという傾向も一致している。この2人の研究から得られる結論は同じであるので、データを足し合わせてみよう(表2)。データを統合した結果、カイ2乗値は約2.7となり、3.84に満たないという一見不思議な結果が得られてしまう。(c) これは統計学上の有名なパラドックスの1つである。

表2.Cさんのアンケート調査の結果 および Aさんの結果と結合したデータ(実測値)
売上がカテゴリー1カテゴリー2カテゴリー3カテゴリー4合計
Cさんの結果272298822600
Aさん+Cさんの結果2933076288750

問1.本文および表1の空欄に適切な数字を入れよ。ただし(1)~(3)と(12)は整数値、
   (5),(6)は小数第2位まで、(7)~(11)は小数第1位まで、(4)は分数で答えよ。

問2.本文中の空欄(ア)に入る最も適切な帰無仮説を次の選択肢から選べ。
   1 アンケート調査票(質問紙)を送付する企業に偏りが生じた。
   2 アンケート調査票(質問紙)を送付する企業はランダム(無作為)に選択された。
   3 企業の売上が増えるか否かは確率0.5に従う。
   4 企業の売上が増えるか否かと、ネット広告の有無の間には関係がない。
   5 ネットに広告を出さなくとも、企業の売上は増える。
   6 ネットに広告を出した企業の半数で売上は増える。

問3.本文の末尾、下線部(c)に続く最も適切な一文を次の選択肢から選べ。
   1 昨今、ITを活用したビッグデータが注目されている最大の理由はここにあるのである。
   2 サンプル数が多くなり過ぎると、統計学的に基づく判断も間違うことがあるので注意を要する。
   3 条件の異なる調査結果を安易に統合するべきではないということを示している。
   4 データを客観的に取捨選択し、期待される結果を統計的に探る必要がある。
   5 データを統合した際は、帰無仮説も統合しない限り矛盾が生じるのである。
   6 二人の調査結果のいずれか一方に誤りがあったことを、この解析結果は示している。

問4.表1の結果については、下線部(a)に示されたAさん・Bさんの双方の意見と異なる解釈も可能である。可能性のある解釈の1つを60字以内で答えなさい。その際、本文中の下線部(b)の記述に注意を払い、解答の中に「因果」(もしくは「因果関係」)という語句を必ず用いなさい。

問5.下線部(c)について、なぜ「パラドックス」と呼ばれるのか。70字以内で答えなさい。ただし、「傾向」、「サンプル数」および「有意」という語句を必ず用いなさい。



≪解答例≫
問1.(1) 15 (2) 60 (3) 60 (4) 1/32 (5) 0.07 (6) 0.50
   (7) 2.4 (8) 0.6 (9) 0.6 (10) 6.0 (11) 2.0 (12) 16

問2.4

問3.3

問4.
(例1)全く別の要因が、ネット広告を出したか否か、売上が増えたか否かの両方に影響を与えたという因果関係があったことも考えられる。(60字)
(例2)因果関係が逆という可能性もある。すなわち「売上が増えた結果として、利益が出て、ネット広告の費用を出せた」とも考えられる。(60字)

問5.
サンプル数が十分で、傾向が似ていて、どちらも有意な結果を得ているにもかかわらず、2つのデータを統合すると、有意でないという結果になるから。(69字)

0 件のコメント:

コメントを投稿