出願が早いほうが合格しやすい?【一橋大学入試】

こんにちは,一橋大学シラバス大好きマンです.

自身の勉強にもなればと思い,「夏休みの自由研究」と称してブログをはじめてみました(継続できるかはわかりませんが…).

今回はその第1弾として,以下の質問に答えてみたいと思います.

f:id:hit_syllabus:20210731021842p:plain

一橋大学の二次試験では,第一段階選抜,いわゆる「足切り」を通過した人に対して,出願が早い順に受験番号が割り振られます.(ただし,受験番号はあくまでも先着順に決まるというだけなので,受験番号の間隔から出願日時の間隔を読み取ることはできません.)

「受験番号の大小によって合格者の割合に差は生じるのか」というのが今回の質問の趣旨です. 質問文をみて「なるほど~」と思ったので,ちゃんと(?)調べてみることにしました.

分析方法

令和3年度の前期入試を対象にしたいと思います.分析に必要となる合格者の受験番号は,以下のURLから入手できました.

https://admission.telemail.jp/shingaku/topics_g/assets/pdf_sys/successes/file_6046bc5b9e5e8.pdf

また,志願者数などのデータは以下に掲載されています.

令和3年度一般選抜 出願・選抜状況 | 入試データ(志願・選抜状況、合格点等) | 学部入試情報 | 一橋大学で学びたい方へ | 一橋大学

今回は,統計学計量経済学でしばしば登場する統計的仮説検定を用います.

統計的仮説検定に関しては,以下のサイトなどを参照してください.

ai-trend.jp

ここでは,カイ二乗適合度検定(Chi-square goodness of fit test)を用います.これは,観測されたデータの分布がある特定の分布に一致しているかどうかを調べるのに適しています.

カイ二乗適合度検定に関しては,以下のサイトなどを参照してください.

www.jmp.com

bookdown.org

今回の場合,帰無仮説H_0は「受験番号に対する前期入試の合格者の分布は一様分布に従う」とします.したがって,対立仮説H_1は「受験番号に対する前期入試の合格者の分布は一様分布に従わない」となります.

一様分布は,完全にランダムな事象を表現する確率分布です.例えば,さいころを振った時に1から6の目が出る確率はそれぞれともに\frac{1}{6}です.特定の区分における偏りはなく,均一に分布しているということです.

一様分布に関しては,以下のサイトなどを参照してください.

bellcurve.jp

H_0が棄却されると,分布が(離散)一様分布でない,すなわち受験番号によって偏りが生じているという主張ができます.

それでは,具体的な数値を用いて検定をおこなっていきましょう.

商学部

まずは商学部のデータで試してみます.

商学部では,第一段階選抜合格者は697人,合格者数は268人でした.

今回は便宜上,受験番号の小さい順に7つのグループに分けようと思います.

  • C_1:受験番号10001~10100 (100人)
  • C_2:受験番号10101~10200 (100人)
  • C_3:受験番号10201~10300 (100人)
  • C_4:受験番号10301~10400 (100人)
  • C_5:受験番号10401~10499 (99人)
  • C_6:受験番号10500~10598 (99人)
  • C_7:受験番号10599~10697 (99人)

これで,第一段階選抜合格者を(ほぼ)均等に割り振ることができました.

もしH_0が正しいなら,あるグループに含まれる合格者の数はそのグループの人数に比例するはずです.例えば,

  • C_1に含まれる合格者は 100\times\frac{268}{697} \fallingdotseq 38.5 (人)

  • C_5に含まれる合格者は 99\times\frac{268}{697} \fallingdotseq 38.1 (人)

となります.表にまとめると以下の通りです.

C_1 C_2 C_3 C_4 C_5 C_6 C_7 合計
38.5 38.5 38.5 38.5 38.1 38.1 38.1 268

次に,実際のデータを見ていきましょう.

C_1 C_2 C_3 C_4 C_5 C_6 C_7 合計
48 45 40 38 42 30 25 268

1つ目の表の値は期待度数Exp_i),2つ目の表の値は観測度数Ob_i)と呼ばれます(iはグループの添え字に対応します).

C_1 C_2 C_3 C_4 C_5 C_6 C_7 合計
期待度数 Exp_i 38.5 38.5 38.5 38.5 38.1 38.1 38.1 268
観測度数 Ob_i 48 45 40 38 42 30 25 268

まずは,観測度数(Ob_i)と期待度数(Exp_i)の差をそれぞれのiについて求めます. 例えば,Ob_1-Exp_1=48-38.5=9.5です.

これらを付け加えた表は以下の通りです.

C_1 C_2 C_3 C_4 C_5 C_6 C_7 合計
Exp_i 38.5 38.5 38.5 38.5 38.1 38.1 38.1 268
Ob_i 48 45 40 38 42 30 25 296
Ob_i-Exp_i 9.5 6.5 1.5 -0.5 3.9 -8.1 -13.1 0

次に,いま計算した差の二乗をそれぞれのiについて求めます.

C_1 C_2 C_3 C_4 C_5 C_6 C_7 合計
Exp_i 38.5 38.5 38.5 38.5 38.1 38.1 38.1 268
Ob_i 48 45 40 38 42 30 25 296
Ob_i-Exp_i 9.5 6.5 1.5 -0.5 3.9 -8.1 -13.1 0
(Ob_i-Exp_i)^2 91.19 42.90 2.40 0.20 15.48 65.06 170.72 387.95

検定に必要なカイ二乗統計量は,\chi^2=\displaystyle\sum_{i=1}^{k}\dfrac{(Exp_i-Ob_i)^2}{Exp_i}で求められます.今回の場合,グループは7つなので,k=7です.

したがって,差の二乗を期待度数で割った値をそれぞれのiについて求める必要があります. 例えば,\frac{(Exp_1-Ob_1)^2}{Exp_1}=\frac{91.19}{38.5}\fallingdotseq 2.37です.

C_1 C_2 C_3 C_4 C_5 C_6 C_7 合計
Exp_i 38.5 38.5 38.5 38.5 38.1 38.1 38.1 268
Ob_i 48 45 40 38 42 30 25 296
Ob_i-Exp_i 9.5 6.5 1.5 -0.5 3.9 -8.1 -13.1 0
(Ob_i-Exp_i)^2 91.19 42.90 2.40 0.20 15.48 65.06 170.72 387.95
\frac{(Ob_i-Exp_i)^2}{Exp_i} 2.37 1.12 0.06 0.01 0.41 1.71 4.48 10.16

よって,カイ二乗統計量は10.16となります.

今回の場合,自由度はk-1=7-1=6なので,有意水準\alpha=0.05での臨界値は12.59です.

臨界値を求める際には,カイ二乗分布表を用います.

bellcurve.jp

カイ二乗統計量10.16は臨界値12.59よりも小さいので,帰無仮説を棄却することができません.したがって,令和3年度の商学部前期入試において,受験番号による合格者の偏りは統計的に有意でないことになります.

それでは,経済学部,法学部,社会学部についても調べてみましょう.

経済学部

第一段階選抜合格者は585人,合格者数は208人でした.

  • E_1:受験番号20001~20084 (84人)
  • E_2:受験番号20084~20168 (84人)
  • E_3:受験番号20169~20252 (84人)
  • E_4:受験番号20253~20336 (84人)
  • E_5:受験番号20337~20419 (83人)
  • E_6:受験番号20420~20502 (83人)
  • E_7:受験番号20503~20576 (83人)
E_1 E_2 E_3 E_4 E_5 E_6 E_7 合計
Exp_i 29.9 29.9 29.9 29.9 29.5 29.5 29.5 208
Ob_i 33 40 36 33 23 28 15 208
Ob_i-Exp_i 3.1 10.1 6.1 3.1 -6.5 -1.5 -14.5 0
(Ob_i-Exp_i)^2 9.82 102.68 37.62 9.82 42.39 2.28 210.57 415.19
\frac{(Ob_i-Exp_i)^2}{Exp_i} 0.33 3.44 1.26 0.33 1.44 0.08 7.14 14.00

カイ二乗統計量は14.00となります.

先ほどと同様に,有意水準\alpha=0.05での臨界値は12.59です.

カイ二乗統計量はこれよりも大きいので,帰無仮説を棄却することができます.したがって,令和3年度の経済学部前期入試において,受験番号による合格者の偏りは統計的に有意であることになります.

法学部

第一段階選抜合格者は466人,合格者数は163人でした.

  • L_1:受験番号30001~20067 (67人)
  • L_2:受験番号30068~20134 (67人)
  • L_3:受験番号30135~20201 (67人)
  • L_4:受験番号30202~20268 (67人)
  • L_5:受験番号30269~20334 (66人)
  • L_6:受験番号30335~20400 (66人)
  • L_7:受験番号30401~20466 (66人)
L_1 L_2 L_3 L_4 L_5 L_6 L_7 合計
Exp_i 23.4 23.4 23.4 23.4 23.1 23.1 23.1 163
Ob_i 29 28 27 20 25 18 16 163
Ob_i-Exp_i 5.6 4.6 3.6 -3.4 1.9 -5.1 -7.1 0
(Ob_i-Exp_i)^2 30.96 20.83 12.70 11.80 3.66 25.87 50.21 156.04
\frac{(Ob_i-Exp_i)^2}{Exp_i} 1.32 0.89 0.54 0.50 0.16 1.12 2.17 6.71

カイ二乗統計量は6.71となります.

先ほどと同様に,有意水準\alpha=0.05での臨界値は12.59です.

カイ二乗統計量はこれよりも小さいので,帰無仮説を棄却することができません.したがって,令和3年度の法学部前期入試において,受験番号による合格者の偏りは統計的に有意でないことになります.

社会学

第一段階選抜合格者は662人,合格者数は230人でした.

  • S_1:受験番号40001~40095 (95人)
  • S_2:受験番号40096~40190 (95人)
  • S_3:受験番号40191~40285 (95人)
  • S_4:受験番号40286~40380 (95人)
  • S_5:受験番号40381~40474 (94人)
  • S_6:受験番号40475~40568 (94人)
  • S_7:受験番号40569~40662 (94人)
S_1 S_2 S_3 S_4 S_5 S_6 S_7 合計
Exp_i 33.0 33.0 33.0 33.0 32.7 32.7 32.7 230
Ob_i 39 36 39 40 25 24 27 230
Ob_i-Exp_i 6.0 3.0 6.0 7.0 -7.7 -8.7 -5.7 0
(Ob_i-Exp_i)^2 35.93 8.96 35.93 48.92 58.65 74.97 32.02 295.38
\frac{(Ob_i-Exp_i)^2}{Exp_i} 1.09 0.27 1.09 1.48 1.80 2.30 0.98 9.00

カイ二乗統計量は9.00となります.

先ほどと同様に,有意水準\alpha=0.05での臨界値は12.59です.

カイ二乗統計量はこれよりも小さいので,帰無仮説を棄却することができません.したがって,令和3年度の社会学部前期入試において,受験番号による合格者の偏りは統計的に有意でないことになります.

まとめ

今回の分析では,経済学部でのみ受験番号の大小による合格者の割合の差が存在するという結論が得られました.

このようなばらつきが生じる原因として私が思いついたのは,「学力水準が高い(=本命)の学生は悩むことなく出願する一方,共通テストで思うように点数が取れなかった学生は出願先を慎重に選ぶ」ということです.

二次試験の出願期間中には,各予備校が第一段階選抜のボーダー予想を発表します.また,大学による志願者数の中間発表も随時行われます. 共通テストの点数がボーダーぎりぎり(=学力水準が低い?)の学生は,こうした動向を見ながらじっくりと出願先を決めるパターンが多いのではないかと思います.(経済学部志願者の方が足切りをシビアに考えるものなのですかね…?)

以上,拙い分析でしたが参考になればと思います.(誤りなどがございましたら,ご指摘いただけますと幸いです.)

ここまでお読みいただきありがとうございました.