math math muscle!

数学を鍛えよう

知ってから語る「偏差値」

アメリカに住んでいるマイケルと日本に住んでいる花子の数学の能力を比較してみよう。二人は同じテストを受けることができないので、それぞれ別のテストを受けた。結果は以下の通りである。

 

マイケル:85点

花子:75点

 

さて、どちらが優秀といえるだろうか。点数が高いからマイケルのほうが優秀だ!といえるだろうか?二人は別々のテストを受けているので、テストの難易度は異なっていたかもしれない。よって、点数だけでは比較が難しい。では、平均点と比べた次の場合はどうだろうか。

 

マイケル:85点    全体の平均:50点

花子:75点      全体の平均:50点

 

 

全体の平均も等しいので、やはりマイケルのほうが優秀であると言えそうである。

 

こんな状況において、得点と平均では比較できないことに注目したのがカール・ピアソンである。彼が生み出したアイデアこそ、データのばらつきの大きさを表す標準偏差という考えである。

それぞれが受けたテストの得点の分布をみてみよう。

f:id:kanchan_math:20181003224810p:plain

グラフを見ると、マイケルの受けたテストは、ばらつきが大きく、花子の受けたテストはばらつきが小さいことが分かる。そして、花子のほうがマイケルよりも集団から一歩飛び出している。そして、実際に偏差値を求めてみると‥

 

マイケル:64.3

花子:67.2

 

結果として、花子のほうが優秀であると言えるのである。

このように、得点と平均だけで優劣をつけることは難しい。このグラフから分かるように、データのばらつきによって優秀さは大きく変わってしまうからだ。そこで、得点と平均点に、標準偏差というデータのばらつきを考えることで、より正確に優秀さを比較することができる。そして、この3つを組み合わせたのが、まさに偏差値なのである。

 

では、実際に偏差値を求めてみよう。

A:80 B:60 C:60 D:90 (点)であったとする。

まずは平均を求める。

平均:\frac{80+60+60+90}{4}=72.5

 

次に標準偏差を求める。

STEP1:各データの偏差を求める。

※偏差とは、各値から平均値を引いた値である。

Aの偏差:80-72.5=7.5 

Bの偏差:60-72.5=-12.5

Cの偏差:60-72.5=-12.5

Dの偏差:90-72.5=17.5

 

STEP2:偏差の2乗の合計の平均を求める。

\frac{(7.5)^2+(-12.5)^2+(-12.5)^2+(17.5)^2}{4}=168.75

 

STEP3:二乗した分を平方根で元に戻す。

\sqrt{168.75}=12.99‥≒13

 

この値が標準偏差である。少し難しい計算かもしれないが、基本的にはデータのばらつきを数値化するために、平均との差を取り、それを正の数であらわすために2乗してルートをつけているだけである。この数値によって先ほどのグラフのような目で見えるデータのばらつきが数字で表されている。

 

そして、日本での偏差値は次のようにして求められる。

偏差値=\frac{得点-平均点}{標準偏差}×10+50

 

つまり、自分の得点が平均よりも大きいとき、そして、標準偏差が小さい(データのばらつきが小さい)ときに偏差値は大きくなる。また、平均点をとると偏差値は50になるようになっているのである。では、AからDの偏差値を計算すると‥

Aの偏差値:\frac{80-72.5}{13}×10+50≒55.8

Bの偏差値:\frac{60-72.5}{13}×10+50≒40.4

Cの偏差値:\frac{60-72.5}{13}×10+50≒40.4

Dの偏差値:\frac{90-72.5}{13}×10+50≒63.5

このようにして求めることができる。

 

標準偏差というデータのばらつきを考えることで、より正確な優劣をつけることが可能になり、現在も多くの試験などで使われているのである。

 

最後に意外と知られていないが、偏差値は負になったり、100を超えたりすることもありえることを伝えて終わりにしよう。

これは、99人が100点で1人が0点の場合、99人が0点1人が100点の場合において、偏差値を求めたものである。