X大学の1年生を対象に「科目Aの得点と科目Bの得点の相関」を調べたら、負になった。
こんなことって、あるんだろうか?
実はこれは大いにありそうなことなのだ。決して特殊な事情によるものではない。説明しよう。
ポイントは「X大学の1年生を対象に」という点にある。この調査の母集団は「受験生のうち、合格して、かつ入学した人」である。すなわち、受験生の一部にすぎない。しかも、非常に偏った集団なのだ。
全受験者を対象にすればおそらく正の相関になるのだろうけれど、合格点を決めて対象を合格者に絞り込んだ時点で正の相関が崩れる。
さらに入学を辞退する人がいることを想定するとますます崩れる。実際に入学を辞退するのは滑り止めで受験した受験生に多い。つまり、成績上位者ほど辞退する率が高いのが現実である。こうして入学者だけを対象にすると負の相関になるのは十分にありうることなのだ。
受験番号 | 科目A | 科目B |
1 | 47 | 56 |
2 | 50 | 73 |
: | : | : |
49 | 86 | 94 |
50 | 86 | 61 |
次に、合格点を適当に決めて、合格者の散布図を作り、相関係数を求めてみよう。
さらに、成績上位者が入学を辞退すると想定して、入学者の散布図を作り、相関係数を求めてみよう。
まず、<実習3>と同じ手順で受験者の相関係数を求めてみたら 0.60 となった。正の相関である。
次に、適当に合格点を想定して、合格者の相関係数を求めよう。そのためには IF 関数を使うなどいろんな方法があるが、一番手っ取り早いのは合計点の高い順に並び替えて、ある行より下のデータを消去する方法である。消去した途端に、全受験者の相関係数が書かれていたセルの値が、合格者の相関係数に切り替わる。
仮に 130 点未満のデータを消去(合格点を 130 点と想定)してみたら、相関係数は −0.20 になった。この時点ですでに弱い負の相関になった。
続いて同じように、ある得点以上のデータを消去すれば入学者の相関係数が求められる。160 点以上のデータを消去(第1志望の別の大学に進学と想定)してみたら、相関係数は −0.70 になった。かなり強い負の相関である。
上のように想定したときの 受験者・合格者・入学者の2科目の得点の散布図は次のようになった。
散布図をみれば、なるほどと思うのではなかろうか。
受験科目が2科目という大学は少ないが、入学者を母集団とすれば、国立大学で「センター試験と2次試験」の得点の相関が負になることは大いにありそうな話だし、あるいはウチの学校の中学受験でも「文系科目(国語・社会)と理系科目(算数・理科)」の得点が負の相関になったりすることも十分ありそう(統計をとったわけではない)な話である。
0 件のコメント:
コメントを投稿