2019年3月18日月曜日

入試で2科目の得点が逆相関?

◇ X大学の受験科目は2科目で、その合計で合否が決まる。
  X大学の1年生を対象に「科目Aの得点と科目Bの得点の相関」を調べたら、になった。
   こんなことって、あるんだろうか?



 実はこれは大いにありそうなことなのだ。決して特殊な事情によるものではない。説明しよう。
 
 ポイントは「X大学の1年生を対象に」という点にある。この調査の母集団は「受験生のうち、合格して、かつ入学した人」である。すなわち、受験生の一部にすぎない。しかも、非常に偏った集団なのだ。
 全受験者を対象にすればおそらくの相関になるのだろうけれど、合格点を決めて対象を合格者に絞り込んだ時点で正の相関が崩れる。
 さらに入学を辞退する人がいることを想定するとますます崩れる。実際に入学を辞退するのは滑り止めで受験した受験生に多い。つまり、成績上位者ほど辞退する率が高いのが現実である。こうして入学者だけを対象にするとの相関になるのは十分にありうることなのだ。

受験番号科目A科目B
14756
25073
498694
508661
では、データをもとに試してみよう。全受験者の得点と想定して 50 人分のデータを用意した。まず、このデータから散布図を作り、相関係数を求めてみよう。
 次に、合格点を適当に決めて、合格者の散布図を作り、相関係数を求めてみよう。
 さらに、成績上位者が入学を辞退すると想定して、入学者の散布図を作り、相関係数を求めてみよう。

 まず、<実習3>と同じ手順で受験者の相関係数を求めてみたら 0.60 となった。の相関である。
 次に、適当に合格点を想定して、合格者の相関係数を求めよう。そのためには IF 関数を使うなどいろんな方法があるが、一番手っ取り早いのは合計点の高い順に並び替えて、ある行より下のデータを消去する方法である。消去した途端に、全受験者の相関係数が書かれていたセルの値が、合格者の相関係数に切り替わる。
 仮に 130 点未満のデータを消去(合格点を 130 点と想定)してみたら、相関係数は −0.20 になった。この時点ですでに弱いの相関になった。

 続いて同じように、ある得点以上のデータを消去すれば入学者の相関係数が求められる。160 点以上のデータを消去(第1志望の別の大学に進学と想定)してみたら、相関係数は −0.70 になった。かなり強いの相関である。
 
 上のように想定したときの 受験者・合格者・入学者の2科目の得点の散布図は次のようになった。
 

 散布図をみれば、なるほどと思うのではなかろうか。
 受験科目が2科目という大学は少ないが、入学者を母集団とすれば、国立大学で「センター試験と2次試験」の得点の相関が負になることは大いにありそうな話だし、あるいはウチの学校の中学受験でも「文系科目(国語・社会)と理系科目(算数・理科)」の得点が負の相関になったりすることも十分ありそう(統計をとったわけではない)な話である。

0 件のコメント:

コメントを投稿