2019年11月11日月曜日

寿命の平均値と中央値と最頻値(2018年)

 平均寿命は厚生労働省が毎年発表します。ところで、平均値があるということは、中央値も最頻値もあるはずです。でも、平均寿命という言葉はよく聞きますが、寿命の中央値、寿命の最頻値という言葉は聞きませんね。探ってみましょう。

 2018年の日本人の平均寿命は女性が87.32歳で、男性が81.25歳です。
 さて、寿命の中央値と最頻値は何歳くらいでしょうか? まず結果を予想(平均値より上か下か)し、2018年の年齢別死亡率のデータからエクセルで加工して求めてください。

 ところで、平均寿命とは何の平均値なのでしょうか。まずはそれを知らなければなりません。そしてそれがわかれば、寿命の中央値と最頻値もわかります。いや、データがそろえば、平均値を求めるより、中央値や最頻値を求める方が計算はむしろ簡単です。数値の最も大きいところが最頻値で、人数を足していってちょうど半分のところが中央値ですから。平均値は値を全部足して総人数で割るのですから、中央値や最頻値を求めるのに比べて計算は大変です。
 平均寿命は、その年の各年齢ごとの死亡率から算出します。値が男女で異なりますので、ここでは「女性」の値を元に平均寿命の計算法を説明しましょう。元データは2018年の「簡易生命表」です。厚生労働省のサイトからダウンロードできます。
 まず100,000人が生まれたとします。この数に0歳の死亡率を掛けると179人、これだけの人が0歳で亡くなることになります。残り99,821人が1歳の誕生日を迎えて、その数に1歳での死亡率を掛けて、28人が1歳の間に亡くなって、99,793人が2歳になります。この計算の繰り返しです。
 高齢になるとじわりじわりと死亡率が高くなっていきます。例えば100歳での死亡率は約30%です。なお、表では105歳以上はひとくくりになっていますが、105歳以上での死亡率は(当然のことながら)100%です。
 こうして出来上がった各年齢ごとの死亡者数、それはつまり「ある年に産まれた男女10万人ずつが、2018年の各年齢ごとの死亡率と同じ割合で亡くなると想定したときの、それぞれの人が生きた年数」でもありますが、その平均値が平均寿命です。一応申し上げますと、厚生労働省の資料では「死亡」という言葉を極力使わずに説明したり計算したりしているものですから無駄にややこしいのですが、結局のところ上の計算法と同じ結果になります。
 下図は、上の計算に従って「各年齢ごとの死亡者数」をグラフにしたものです。2018年の「寿命曲線」と呼ぶことにしましょう。


 平均値は女87歳・男81歳ですが、若くして亡くなる人が一定数いる一方で、120歳を超えて生きる人はまずいませんから、グラフは左方向(若い方)に長く伸びて、右方向(高齢側)は急激に落ち込みます。そしてこうなると、若くして亡くなる人の影響を受けて、平均値はその分低めになります。
 ここまで来れば、寿命の平均値だけでなく、中央値や最頻値を求めるのもすぐそこです。
 「最頻値」は、すでに求めた「各年齢ごとの死亡者数」の中で数が最大になるところ。つまり「女93歳、男88歳」が最頻値です。
 また「中央値」は「累積死亡者数」が5万人(10万人の半分)に達したところで、「女90歳、男84歳」となります。
 なお、このデータをもとに10万人の生きた年数の平均値を計算(期央で亡くなった考えて0.5歳分を調整)すると、女性が87.31歳、男性が81.25歳となりました。男性は厚生労働省発表ものと一致し、女性は0. 01歳の誤差が出ましたが、元の簡易生命表で「105歳以上」 が一括りになっていることなどが影響しているものと思われます。
女性男性
平均値87.3281.25
中央値9084
最頻値9388

 以上まとめると、次のようになります。
 平均寿命が平均的とは限りません。現実には「平均寿命よりもっと長生きする方がむしろ普通だ」とも言えるのです。
 このように統計は代表値によって、見え方が大きく変わります。ちなみに「家計の収入や貯蓄」は逆の傾向になります。すなわちグラフの左側の人数が多くて、右方向に長く伸びて、「最頻値<中央値<平均値」となります。
 ところで今生きている人にとって重要な指標は平均寿命より平均余命の方でしょう。そしてこれもまた余命の平均値だけでなく、中央値や最頻値を求めてみるとまた違った見方ができるかもしれません。お試しください。


0 件のコメント:

コメントを投稿