ドーピング検査の精度を99%とします。すなわち、ドーピングしていないのに陽性反応が出る確率が1%で、ドーピングしているのに陰性となる確率も1%です。さて、ある人がドーピング検査を受けたところ、陽性反応が出ました。この人がドーピングしている確率はどれくらいでしょうか。ただし、100人のうち実際にドーピングしているのは1人だとします。
「検査の精度が99%なら、実際にドーピングしている確率はかなり高いだろう」と思うのではないでしょうか。
でも、ちょっとこんな例を考えてみてください。ウチの学校には中高合わせて1,900人の生徒がいますが、彼ら全員がこの検査を受けたら、どういう結果になるでしょうか。
検査の精度が99%なら、たぶん19人くらいに陽反応が出るでしょう。検査が間違える確率が1%ですから、1,900人×1%=19人に陽性反応が出て普通なのです。ちなみに、ウチの学校の生徒たちはドーピングしていないはずです。動機がありません。ついでながら、ウチの学校でなくても、町のおじちゃん・おばちゃんを対象に検査しても、同じような結果になるでしょう。
さて、陽性反応が出た人は本当に疑わしいのでしょうか?
計算してみましょう。便宜上、競技者の人数を10,000人とします。このうちドーピングしているのは1%の100人…①で、ドーピングしていないのは9,900人…②です。検査で誤った判定が出る確率は1%ですから、①のうち1%(=1人)には陰性反応が出て、②のうち1%(=99人)には陽性反応が出ます。
以上から、競技者10,000人を「ドーピングしているか、否か」と「陽性反応か、陰性反応か」で4つに分類すると、右表のようになります。
表から、この検査で陽性反応が出るのは全部で198人で、そのうち実際にドーピングしているのは99人、実はドーピングしていない人も99人だということが分かります。ということは、「陽性反応が出た人が実際にドーピングしている確率」は50%です。意外と小さいと思いませんか。
興味のある方、練習したい方、おヒマな方は、
◇「 全体の10%の選手がドーピングしている」と仮定する
◇「 全体の0.1%の選手がドーピングしている」と仮定する
と条件を置き換えて、「陽性反応が出た人が実際にドーピングしている確率」を求めてみてください。条件付き確率は大きく変わりますよ。
ところで、先ほどは「全体の1%の選手がドーピングしている」ものと仮定して計算しましたが、実際には「全体の何%がドーピングしているか」は分からないのです。ドーピングしている選手もしていない選手も、みんな「私はやってない」というに決まってますから。「検査の精度が99%」というのも、実際には検証できないでしょう。陰性とされた選手が「検査結果、間違ってます」と自己申告するとは思えませんから。
そう、「実際には分からないことだらけ」なんです。だからこそ統計の出番なんですが、統計を使っても「絶対に正しいこと」なんて何も言えません。そういうものです。