知ってから語る「偏差値」
アメリカに住んでいるマイケルと日本に住んでいる花子の数学の能力を比較してみよう。二人は同じテストを受けることができないので、それぞれ別のテストを受けた。結果は以下の通りである。
マイケル:85点
花子:75点
さて、どちらが優秀といえるだろうか。点数が高いからマイケルのほうが優秀だ!といえるだろうか?二人は別々のテストを受けているので、テストの難易度は異なっていたかもしれない。よって、点数だけでは比較が難しい。では、平均点と比べた次の場合はどうだろうか。
マイケル:85点 全体の平均:50点
花子:75点 全体の平均:50点
全体の平均も等しいので、やはりマイケルのほうが優秀であると言えそうである。
こんな状況において、得点と平均では比較できないことに注目したのがカール・ピアソンである。彼が生み出したアイデアこそ、データのばらつきの大きさを表す標準偏差という考えである。
それぞれが受けたテストの得点の分布をみてみよう。
グラフを見ると、マイケルの受けたテストは、ばらつきが大きく、花子の受けたテストはばらつきが小さいことが分かる。そして、花子のほうがマイケルよりも集団から一歩飛び出している。そして、実際に偏差値を求めてみると‥
マイケル:64.3
花子:67.2
結果として、花子のほうが優秀であると言えるのである。
このように、得点と平均だけで優劣をつけることは難しい。このグラフから分かるように、データのばらつきによって優秀さは大きく変わってしまうからだ。そこで、得点と平均点に、標準偏差というデータのばらつきを考えることで、より正確に優秀さを比較することができる。そして、この3つを組み合わせたのが、まさに偏差値なのである。
では、実際に偏差値を求めてみよう。
A:80 B:60 C:60 D:90 (点)であったとする。
まずは平均を求める。
平均:
次に標準偏差を求める。
STEP1:各データの偏差を求める。
※偏差とは、各値から平均値を引いた値である。
Aの偏差:
Bの偏差:
Cの偏差:
Dの偏差:
STEP2:偏差の2乗の合計の平均を求める。
STEP3:二乗した分を平方根で元に戻す。
この値が標準偏差である。少し難しい計算かもしれないが、基本的にはデータのばらつきを数値化するために、平均との差を取り、それを正の数であらわすために2乗してルートをつけているだけである。この数値によって先ほどのグラフのような目で見えるデータのばらつきが数字で表されている。
そして、日本での偏差値は次のようにして求められる。
つまり、自分の得点が平均よりも大きいとき、そして、標準偏差が小さい(データのばらつきが小さい)ときに偏差値は大きくなる。また、平均点をとると偏差値は50になるようになっているのである。では、AからDの偏差値を計算すると‥
Aの偏差値:
Bの偏差値:
Cの偏差値:
Dの偏差値:
このようにして求めることができる。
標準偏差というデータのばらつきを考えることで、より正確な優劣をつけることが可能になり、現在も多くの試験などで使われているのである。
最後に意外と知られていないが、偏差値は負になったり、100を超えたりすることもありえることを伝えて終わりにしよう。
偏差値は100を超えることもあるし、負になることもある。(理論上) pic.twitter.com/aLSbpNLOGN
— math math マッスル (@mathmathmuscle) 2018年9月29日
これは、99人が100点で1人が0点の場合、99人が0点1人が100点の場合において、偏差値を求めたものである。