期末テストで頑張って成績を上げた中学生の娘。そのかいあり、これまで500円だった月々のお小遣いが12月から1000円に上がることになりました。
しかし、ここへ来て娘がお小遣いに関する疑義を呈して来ました。疑義があるときは甲乙協議のもと調整することにしておりますので、週末はずっとその問題に取り組んでおりました。
娘の主張は以下の通り
- お小遣いの額は本来、合計点ではなく学年順位によって設定されている
- 1年生の間は学年順位が知らされていないが、各科目のおおよその順位はわかる
- そこから5科目合計学年順位を推定できるのではないか?
- そうすれば、お小遣い額はワンちゃん上がるはずである
私の主張は以下の通り
- 各科目の順位がわかっても、各科目の標準偏差も科目間相関もわからないから推定することは困難(計算めんどくさい)
- 順位がわからないときのために点数で割り付ける表も別途作成してあるので、今回もそちらに従うべきである
- (実は想定よりも学年平均点がだいぶ低いので、点数で額を設定した表を基準にした方がお小遣い額が低くなるのでありがたい)
しかし、粘り強く食い下がる娘。(なぜこういうときだけ粘り強いのか?)
娘「チャッピー使っていいから!」
私「はいはい。しょーがないなーもう。」
ということで自分で計算する能力も気力もないのでChatGPT先生に聞きました。
手順(実務的・分かりやすい方法)
前提:各科目は同じ満点(例:100点)で等重み。学年の人数を N
-
順位 → パーセンタイルに変換
各科目の学年順位 をパーセンタイル に変換します(上位ほど大きい値になる)。(※上位1位ならほぼ1、最下位ならほぼ0になります)
-
パーセンタイル → 推定得点
単純に満点をS ^ = p × M \hat{S} = p \times M (より現実的には正規分布を仮定してパーセンタイル→ z 値→得点に変換する方法もあります)
-
5科目合計得点を出す
各科目の推定得点を合計して を得ます(満点500点ならT ^ \hat{T} /500)。T ^ \hat{T} -
合計得点の学年分布を仮定して順位を推定
合計の母集団分布を正規で近似するのが実用的です。合計の平均 と標準偏差μ T \mu_T を仮定(または過去データで推定)し、σ T \sigma_T z = T ^ − μ T σ T z = \frac{\hat{T}-\mu_T}{\sigma_T} 正規分布の累積分布関数(CDF)を使って上位パーセンタイル
推定順位P = Φ ( z )を求め、 ≈上位人数= ( 1 − P ) × N (1-P)\times N
面倒くさそう...
各科目の標準偏差はChatGPT先生の提案に従って15とすると、5科目合計の標準偏差は
sqrt(5)*15≃33.54(ただし科目間の相関はゼロと仮定)だから、これと5科目学年平均点と学年人数を入力して、えーと、、、
■ 結果
はい!?
(そんなわけない。 こんな結果を娘に見せるわけにはいかない!)
これは各科目の標準偏差の仮定が合っていないに違いない。科目ごとに分布はバラバラだし、分布の広がりも大きいので。
もう一回、ChatGPT先生に相談です。
私:各科目の10点刻みの人数分布データはあります。ここから各科目の標準偏差は概算できますか?
先生:はい。簡単です。データを入力してください。
私:これでどうですか?
あ、画像を貼り付けたら先生が固まってしまった。無料時間は終了してしまいました。
(翌日)
私:今度はテキストデータで入れますね。これでどうですか?
先生:各科目の標準偏差が出そろいました。
■ 各科目の標準偏差(SD)【確定値】
| 科目 | 標準偏差 SD |
|---|---|
| 国語 | 17.39 |
| 社会 | 22.57 |
| 数学 | 26.09 |
| 理科 | 21.26 |
| 英語 | 22.74 |
あー、やっぱり15より全然大きい。ということは順位はもっと下がるはず(わくわく)。
先生:結果が出ました。
■ 1. 各科目の z 値を計算
各科目のデータ
(平均・SD はあなたの度数分布から計算した確定値)
| 科目 | 得点 | 平均 | SD | z値 = (得点−平均)/SD |
|---|---|---|---|---|
| 国語 | 60 | 56.3 | 17.39 | +0.212 |
| 社会 | 78 | 59.7 | 22.57 | +0.813 |
| 理科 | 74 | 55.8 | 21.26 | +0.858 |
| 数学 | 60 | 58.1 | 26.09 | +0.073 |
| 英語 | 75 | 61.0 | 22.74 | +0.615 |
■ 2. 合計得点の z 値を計算
科目間の相関が不明なため、独立と仮定(推定として一般的)
5科目合計の平均
5科目合計の分散
SD(標準偏差)
■ 3. 合計点 347 の z 値
■ 4. z = 1.127 の累積確率(上位何%か)
標準正規分布より:
→ 上位 12.97%(約上位13%)
■ 5. 学年 79 名中の推定順位
✔ 推定順位:およそ 10 位前後
(統計的推定:8〜13 位の範囲に入ると考えられます)
■まとめ
-
合計得点 347 点
-
合計 z = 1.127
-
上位 約13%
-
推定順位 約 10 位
はい!?
(そんなわけない。 こんな結果を娘に見せるわけにはいかない!)
やっぱり、この方法では駄目なのだ。最後に5科目合計の分布として正規分布を仮定してるから駄目なのだ。そうに違いない。
私の直感では347点はせいぜい40位くらいになるはずなのだ。
あまりにも私の実感と乖離しすぎているので、ChatGPT先生の順位推定は不採用です(AIはよく間違えるらしいですし)。
しかたないので、「これ以下にはならんだろう」という安全側で順位を推定します。


決めました。今回、娘の5科目合計順位は「44位以上」とします。実測データに基づく値なので良しとしましょう。

私:結果を発表します!
娘:はい!(わくわく)
私:今回の順位は44位以上、従いまして月3000円を支給いたします!
娘:ひゃっほー!やったー!いぇーい!🎆🎆🎆 あ、このまえブログに「1000円」て書いてたでしょ。訂正しておいてっ!
私:はい...

というわけでお小遣いの額は12月から3000円ということで本日めでたく支給されました。最新の試験結果もグラフ化して再掲しておきます。
