2019年5月3日金曜日

一橋大2015(データ分析)

 2015年の高校3年生から数学のカリキュラムが変わって「データ分析」が入ったが、さっそく一橋大学の入学試験でデータ分析の問題が出た。浪人生は習っていないので、数列との選択問題だった。浪人生は迷うことなく数列を選んだことだろうが、現役生はどちらを選択するか迷ったかもしれない。



(一橋大 2015)
a , b , c は異なる3つの正の整数とする。次のデータは2つの科目 X と Y の試験を受けた10人の得点をまとめたものである。

科目X の得点acabbaccbc
科目Y の得点abbbaababa

 科目 X の得点の平均値と科目 Y の得点の平均値は等しいとする。

  1. 科目 X の得点の分散を sX2、科目 Y の得点の分散を sY2 とする。 sX2 / sY2 を求めよ。
  2. 科目 X の得点と科目 Y の得点の相関係数を、四捨五入して小数第1位まで求めよ。
  3. 科目 X の得点の中央値が 65、科目 Y の得点の標準偏差が 11 であるとき、a , b , c の組を求めよ。



では、さっそく答えてみよう。

(1) (3a+3b+4c)/10 = (5a+5b)/10 より c = (a+b)/2 つまり c が平均値。
  ここで |a-c| = |b-c| = d とすると、
      sX2 = 6d2/10 = 3d2/5 , sY2 = 10d2/10 = d2
  よって、sX2 / sY2 =3/5

(2) sXY = (d2-d2+d2-d2+d2+d2)/10 = d2/5 より
   r=sXY/sX・sY = (d2/5)/(√3/5d・d) = 1/√15 ≒ 0.3

(3) 要するに c=65 , d=11 ということだから
   (a , b , c) = (54 , 76 , 65) または (76 , 54 , 65)


結局のところ、データは右表のように分布しています。
公式を使って計算しようとするより、平均値や分散・標準偏差の意味を考えた方が答えは見えるでしょう。

0 件のコメント:

コメントを投稿