2019年3月18日月曜日

データの変換

<実習5>
 x の平均と標準偏差を求めよう。

 得点 x  人数 f  u  uf  u2  u2f 
1002
753
502
251
02




<mission 5>
 変換して相関係数を求めるための公式を作り、それが正しいことを証明せよ。



<解説>
 ここでは2つのことを学習します。1つは「分散と標準偏差を求めるための公式」、もう1つは「データを変換して平均値と標準偏差を求めるやり方」です。生徒に配布した教材プリントには、それらと合わせて、その証明も載せています。
 まず<実習5>で公式を確認しながら練習問題を3題やります。そのためにまずデータを変換します。下表のように変数 u の値を、およそ平均に近いと思われるところを 0 として、それより大きいものは +1 , +2 , … とし、小さいものは -1 , -2 , … とします。下表では u=(x-50)/25 ⇔ x=25u+50 と変換したことになります。
 次に機械的に表を埋めます。
 得点 x  人数 f  u  uf  u2  u2f 
10022448
7531313
5020000
251−1−111
02−2−448
10220
表から、

  • m(u)=2/10=0.2
  • m(u2)=20/10=2

そして公式を使って、

  • su=√2-0.22=√1.96=1.4

となります。さらに公式を使って、

  • xの平均は m(x)=25m(u)+50=25×0.2+50=55点
  • 標準偏差は sx=25su=25×1.4=35点

です。データ数が多いときなど、変換が効果的に使えますので、使いこなしましょう。

 続いて<mission 5>。生徒たちは「与えられた公式を証明する」のには慣れていますが、「公式を作れ」と言われると困ってしまうようです。
 <実習2>で定義に従って標準偏差と相関係数を求め、<実習5>で変換して標準偏差を求めることをやったのですから、2つ合わせて考えれば「変換して相関係数を求める方法」が気になるんじゃないかと思うのですが、いかがでしょうか。その公式は高校数学では出てきませんが、これまでやったことから推測できるんじゃないでしょうか。でも、推測だけじゃ心許ないので、証明もお願いします。

 では、答えです。この場合、変数 x,y を変換したものを u,v として、x,y の相関係数をrx,y ,u,vの相関係数をru,v とすると「rx,y=ru,v」が成り立ちます。つまり「変換しても相関係数は変わらない」ということです。そのことを踏まえると、データの値をうまく変換して計算することの効果は大きいですね。ここでは証明は省略します。

0 件のコメント:

コメントを投稿