2019年3月17日日曜日

母集団が大きければ正規分布に近づくのか?

<実習>
右グラフの点線は本校の高校1年生のあるクラスの身長の分布で、実線は本校の高校1年生全体の身長の分布である。 ただし、階級の幅を5cmとして、相対度数で表した。 見ての通り、1クラス程度の人数ではきれいな正規分布にならなかったが、学年全体の人数では正規分布に近い形になった。
 さて、データ数をもっと増やしたらどうなるだろうか。 母集団のデータ数を増やせば増やすほど正規分布に近づくかというと、実はそうとも限らない。 たとえば、本校の中1から高3までの全生徒 (1) を母集団とすると、その分布はむしろ正規分布から遠ざかる。 また、日本の高校1年生全体 (2) を母集団としても、その分布はやっぱり正規分布から遠ざかる。 なぜだろうか?
 
(1) 下線部 (1) について、本校の中1から高3までの全生徒の身長の分布の概形を書き、
  それが正規分布にならない理由を1行で書きなさい。
 
(2) 下線部 (2) について、日本の高校1年生全体の身長の分布の概形を書き、
  それが正規分布にならない理由を1行で書きなさい。
 
(※注)この設問、ウチの学校が男女別学だから成り立つ設問です。
    男女共学校では取扱注意です。


(分布の概形)
(1)                  (2)





 ――――――――――――――→     ――――――――――――――→
 低             高     低             高

(正規分布にならない理由)

(1) ___________________________________

(2) ___________________________________


<mission> 上の答えが事実に即しているかどうかを検証せよ。



《解説・解答》
(1) 保健室からデータをもらって実際にグラフを描いてみました。その結果、学年ごとにグラフを描くと、どの学年もかなりきれいな正規分布になります。けれども、中高6学年分をまとめてグラフ化すると、偏るのです。なぜかと言うと、中学段階では成長が早い一方で、高校くらいになると成長が止まるからです。その結果、グラフのピークの左側(身長の低い方)の傾斜が緩やかなのに対して、ピークの右側(身長の高い方)は傾斜が急になるのです。

(2) 設問中の「本校の高校1年生全体」とは、全員男子です。一方、設問で言うところの「日本の高校生全体」には、当然女子も含みます。男子だけ、女子だけでグラフ化すればきれいな正規分布になるのですが、男子と女子では平均値が違います。ですから、その2つを合わせてグラフ化すると、ピークが2つできるのです。

 というわけで、答えは、

(分布の概形)

 (正規分布にならない理由)
(1) 中学では成長が早く、高校では成長が遅くなるから、上が詰まる。 (30字)
   中学では学年による差が大きいが、高校になると差が小さくなる。 (30字)

(2) 平均的に男性は背が高く、女性は背が低いから、山が2つできる。 (30字)
   男だけ、女だけなら正規分布に近い形になるが、ピークがずれる。 (30字)



 <mission>の(1)の検証のために保健室からもらったデータを生徒に渡しました。もちろん個人が特定されない形で、しかも数年前のデータを。(2)の検証のためのデータはネットで探してもらいましたが、ネット上でグラフは探せても、生データはなかなか見つからないようでした。


0 件のコメント:

コメントを投稿