最近は少子化の影響で事情が少し違うかもしれませんが、自分が中高生だった頃の1クラスはおよそ40~45人でした。そしてクラスには「班」という制度?があり、クラスの中をいくつかのグループに分けて活動することが多くありました。自分の場合は1つの班に5~7人が割り当てられていたと記憶しています。
班は便利です。例えば掃除などのローテーションを行う単位になったり、ちょっとしたグループディスカッションを行う場合のグループになったりします。 これをあらかじめ決めておくことでグループ分けの時間が必要なくなるので先生としても便利だったと思っています。
が、1つわからなかったのが「何故1クラスは40人前後なのか?」、そして「何故1つの班は5~7人程度で構成するのか?」でした。ずっと疑問に思っていたわけではなく、まあそういうものだったんだろう、、という程度に考えていましたが、改めて考えると統一する理由はあまりないと思ってます。 ましてや1クラスの人数は(学校によって担任の負担が変わらないように、とかの理由で)わからなくもないけど、班の人数を決める必要性がどこにあるのか、別に3人でも4人でもいいと思うし、3人の班や7人の班が混在していてもいいのでは?? と考えていました。例えば仲のいい5人組とかがいて、その中にもう1人入っていくのはお互い嫌な気分とかにならないのかな・・・と。それでも班の人数を固定する理由があるのか・・・という感じでした。
ところが、これは統計を勉強するようになって気付きました。「理想を言えば1クラスは42~3人、1班は6~7人がいい」のです。適当な数字ではなかった、ということです。
この秘密の鍵は「正規分布」と「標準偏差」にあります。
「正規分布」は「平均値に近いほどそのサンプル数が多くなるような連続した確率の分布」のことです。わかりやすく言えばテストの得点が横軸、その点を取った人の人数が縦軸になるようなグラフを書いた時にこんな感じになるような分布のことです(この例だと平均点は50点あたりで一番多く、そこから離れるにしたがって人数が減っていくような分布):

学力テストなどでは、例えば全国模試など充分な数の受験生がいるような試験ではその結果は正規分布になります。精度が少し荒くはなりますが、1つの学校内での模擬試験などでも正規分布として考えることが多いです。
そして「標準偏差」。受験ではよく聞く「偏差値」というキーワードを耳にすると思いますが、「標準偏差」は偏差値と大きな関わりがあります。「標準偏差」は「バラつき度合い」を示すものです。要はグラフの形は上記のようになるけど、平均点付近にかなり固まっているのか、あるいは0点から100点までそれなりにバラついているのか、という数値の指標になるものです。標準偏差そのものはエクセルを使って簡単に(STDEV関数で)求めることが出来ます。
で、日本の受験で用いられる学力偏差値では標準偏差1を偏差値10とみなし、以下のような関係が成立します:
・平均点を偏差値50とする
・平均点よりも標準偏差1つぶん多い点数を偏差値60とする
・平均点よりも標準偏差2つぶん多い点数を偏差値70とする
:
・平均点よりも標準偏差1つぶん少ない点数を偏差値40とする
・平均点よりも標準偏差2つぶん少ない点数を偏差値30とする
:
要は、各個人の得点が平均点と比べて標準偏差いくつ分離れているのか?を数値化したものが偏差値なのです。
そして成績の分布が正規分布だった場合、偏差値にはおおまかに以下の関係が成立します:
・偏差値60以上は全体の15.6%(6~7人に一人)
・偏差値70以上は全体の2.275%(43~4人に一人)
・偏差値80以上は全体の0.135%(約740人に一人)
:
・偏差値40以下は全体の15.6%(6~7人に一人)
・偏差値30以下は全体の2.275%(43~4人に一人)
・偏差値20以下は全体の0.135%(約740人に一人)
:
言い方を変えると、
・偏差値60以上は班に一人、
・偏差値70以上はクラスに一人、
・偏差値40以下は班に一人、
・偏差値30以下はクラスに一人、
:
と言えるようにするには、1クラスを43~4人、1班を6~7人で構成するのが理想、という表現もできることになります。
さすがに1学年で740人というマンモス校は珍しいと思いますが、2つの学校の同学年を足すとこのくらいになることはあると思います。その場合は「偏差値80以上と、偏差値20以下は2つの学校で一人ずつ」とも言えますね。
これが本当にクラス編成、班分けの理由かどうかはわかりませんし、試験結果は必ずしも正規分布にならないこともあります。でも6~7人のグループや40数名のグループが集められることがあったら、それは統計目的でグルーピングされている可能性もある、のかも。 少なくとも、上記のような統計との関係はあるので。
班は便利です。例えば掃除などのローテーションを行う単位になったり、ちょっとしたグループディスカッションを行う場合のグループになったりします。 これをあらかじめ決めておくことでグループ分けの時間が必要なくなるので先生としても便利だったと思っています。
が、1つわからなかったのが「何故1クラスは40人前後なのか?」、そして「何故1つの班は5~7人程度で構成するのか?」でした。ずっと疑問に思っていたわけではなく、まあそういうものだったんだろう、、という程度に考えていましたが、改めて考えると統一する理由はあまりないと思ってます。 ましてや1クラスの人数は(学校によって担任の負担が変わらないように、とかの理由で)わからなくもないけど、班の人数を決める必要性がどこにあるのか、別に3人でも4人でもいいと思うし、3人の班や7人の班が混在していてもいいのでは?? と考えていました。例えば仲のいい5人組とかがいて、その中にもう1人入っていくのはお互い嫌な気分とかにならないのかな・・・と。それでも班の人数を固定する理由があるのか・・・という感じでした。
ところが、これは統計を勉強するようになって気付きました。「理想を言えば1クラスは42~3人、1班は6~7人がいい」のです。適当な数字ではなかった、ということです。
この秘密の鍵は「正規分布」と「標準偏差」にあります。
「正規分布」は「平均値に近いほどそのサンプル数が多くなるような連続した確率の分布」のことです。わかりやすく言えばテストの得点が横軸、その点を取った人の人数が縦軸になるようなグラフを書いた時にこんな感じになるような分布のことです(この例だと平均点は50点あたりで一番多く、そこから離れるにしたがって人数が減っていくような分布):

学力テストなどでは、例えば全国模試など充分な数の受験生がいるような試験ではその結果は正規分布になります。精度が少し荒くはなりますが、1つの学校内での模擬試験などでも正規分布として考えることが多いです。
そして「標準偏差」。受験ではよく聞く「偏差値」というキーワードを耳にすると思いますが、「標準偏差」は偏差値と大きな関わりがあります。「標準偏差」は「バラつき度合い」を示すものです。要はグラフの形は上記のようになるけど、平均点付近にかなり固まっているのか、あるいは0点から100点までそれなりにバラついているのか、という数値の指標になるものです。標準偏差そのものはエクセルを使って簡単に(STDEV関数で)求めることが出来ます。
で、日本の受験で用いられる学力偏差値では標準偏差1を偏差値10とみなし、以下のような関係が成立します:
・平均点を偏差値50とする
・平均点よりも標準偏差1つぶん多い点数を偏差値60とする
・平均点よりも標準偏差2つぶん多い点数を偏差値70とする
:
・平均点よりも標準偏差1つぶん少ない点数を偏差値40とする
・平均点よりも標準偏差2つぶん少ない点数を偏差値30とする
:
要は、各個人の得点が平均点と比べて標準偏差いくつ分離れているのか?を数値化したものが偏差値なのです。
そして成績の分布が正規分布だった場合、偏差値にはおおまかに以下の関係が成立します:
・偏差値60以上は全体の15.6%(6~7人に一人)
・偏差値70以上は全体の2.275%(43~4人に一人)
・偏差値80以上は全体の0.135%(約740人に一人)
:
・偏差値40以下は全体の15.6%(6~7人に一人)
・偏差値30以下は全体の2.275%(43~4人に一人)
・偏差値20以下は全体の0.135%(約740人に一人)
:
言い方を変えると、
・偏差値60以上は班に一人、
・偏差値70以上はクラスに一人、
・偏差値40以下は班に一人、
・偏差値30以下はクラスに一人、
:
と言えるようにするには、1クラスを43~4人、1班を6~7人で構成するのが理想、という表現もできることになります。
さすがに1学年で740人というマンモス校は珍しいと思いますが、2つの学校の同学年を足すとこのくらいになることはあると思います。その場合は「偏差値80以上と、偏差値20以下は2つの学校で一人ずつ」とも言えますね。
これが本当にクラス編成、班分けの理由かどうかはわかりませんし、試験結果は必ずしも正規分布にならないこともあります。でも6~7人のグループや40数名のグループが集められることがあったら、それは統計目的でグルーピングされている可能性もある、のかも。 少なくとも、上記のような統計との関係はあるので。