出願が早いほうが合格しやすい？【一橋大学入試】

こんにちは，一橋大学シラバス大好きマンです．

自身の勉強にもなればと思い，「夏休みの自由研究」と称してブログをはじめてみました（継続できるかはわかりませんが…）．

今回はその第１弾として，以下の質問に答えてみたいと思います．

f:id:hit_syllabus:20210731021842p:plain

一橋大学の二次試験では，第一段階選抜，いわゆる「足切り」を通過した人に対して，出願が早い順に受験番号が割り振られます．（ただし，受験番号はあくまでも先着順に決まるというだけなので，受験番号の間隔から出願日時の間隔を読み取ることはできません．）

「受験番号の大小によって合格者の割合に差は生じるのか」というのが今回の質問の趣旨です．質問文をみて「なるほど～」と思ったので，ちゃんと(？)調べてみることにしました．

分析方法

令和３年度の前期入試を対象にしたいと思います．分析に必要となる合格者の受験番号は，以下のURLから入手できました．

https://admission.telemail.jp/shingaku/topics_g/assets/pdf_sys/successes/file_6046bc5b9e5e8.pdf

また，志願者数などのデータは以下に掲載されています．

令和3年度一般選抜出願・選抜状況 | 入試データ（志願・選抜状況、合格点等） | 学部入試情報 | 一橋大学で学びたい方へ | 一橋大学

今回は，統計学や計量経済学でしばしば登場する統計的仮説検定を用います．

統計的仮説検定に関しては，以下のサイトなどを参照してください．

ai-trend.jp

ここでは，カイ二乗適合度検定（Chi-square goodness of fit test）を用います．これは，観測されたデータの分布がある特定の分布に一致しているかどうかを調べるのに適しています．

カイ二乗適合度検定に関しては，以下のサイトなどを参照してください．

www.jmp.com

bookdown.org

今回の場合，帰無仮説 $H_0$ は「受験番号に対する前期入試の合格者の分布は一様分布に従う」とします．したがって，対立仮説 $H_1$ は「受験番号に対する前期入試の合格者の分布は一様分布に従わない」となります．

一様分布は，完全にランダムな事象を表現する確率分布です．例えば，さいころを振った時に $1$ から $6$ の目が出る確率はそれぞれともに $\frac{1}{6}$ です．特定の区分における偏りはなく，均一に分布しているということです．

一様分布に関しては，以下のサイトなどを参照してください．

bellcurve.jp

$H_0$ が棄却されると，分布が(離散)一様分布でない，すなわち受験番号によって偏りが生じているという主張ができます．

それでは，具体的な数値を用いて検定をおこなっていきましょう．

商学部

まずは商学部のデータで試してみます．

商学部では，第一段階選抜合格者は697人，合格者数は268人でした．

今回は便宜上，受験番号の小さい順に７つのグループに分けようと思います．

$C_1$ ：受験番号10001~10100 (100人)
$C_2$ ：受験番号10101~10200 (100人)
$C_3$ ：受験番号10201~10300 (100人)
$C_4$ ：受験番号10301~10400 (100人)
$C_5$ ：受験番号10401~10499 (99人)
$C_6$ ：受験番号10500~10598 (99人)
$C_7$ ：受験番号10599~10697 (99人)

これで，第一段階選抜合格者を(ほぼ)均等に割り振ることができました．

もし $H_0$ が正しいなら，あるグループに含まれる合格者の数はそのグループの人数に比例するはずです．例えば，

$C_1$ に含まれる合格者は $100\times\frac{268}{697} \fallingdotseq 38.5$ （人）
$C_5$ に含まれる合格者は $99\times\frac{268}{697} \fallingdotseq 38.1$ （人）

となります．表にまとめると以下の通りです．

$C_1$	$C_2$	$C_3$	$C_4$	$C_5$	$C_6$	$C_7$	合計
38.5	38.5	38.5	38.5	38.1	38.1	38.1	268

次に，実際のデータを見ていきましょう．

$C_1$	$C_2$	$C_3$	$C_4$	$C_5$	$C_6$	$C_7$	合計
48	45	40	38	42	30	25	268

１つ目の表の値は期待度数（ $Exp_i$ ），２つ目の表の値は観測度数（ $Ob_i$ ）と呼ばれます（ $i$ はグループの添え字に対応します）．

	$C_1$	$C_2$	$C_3$	$C_4$	$C_5$	$C_6$	$C_7$	合計
期待度数 $Exp_i$	38.5	38.5	38.5	38.5	38.1	38.1	38.1	268
観測度数 $Ob_i$	48	45	40	38	42	30	25	268

まずは，観測度数（ $Ob_i$ ）と期待度数（ $Exp_i$ ）の差をそれぞれの $i$ について求めます．例えば， $Ob_1-Exp_1=48-38.5=9.5$ です．

これらを付け加えた表は以下の通りです．

	$C_1$	$C_2$	$C_3$	$C_4$	$C_5$	$C_6$	$C_7$	合計
$Exp_i$	38.5	38.5	38.5	38.5	38.1	38.1	38.1	268
$Ob_i$	48	45	40	38	42	30	25	296
$Ob_i-Exp_i$	9.5	6.5	1.5	-0.5	3.9	-8.1	-13.1	0

次に，いま計算した差の二乗をそれぞれの $i$ について求めます．

	$C_1$	$C_2$	$C_3$	$C_4$	$C_5$	$C_6$	$C_7$	合計
$Exp_i$	38.5	38.5	38.5	38.5	38.1	38.1	38.1	268
$Ob_i$	48	45	40	38	42	30	25	296
$Ob_i-Exp_i$	9.5	6.5	1.5	-0.5	3.9	-8.1	-13.1	0
$(Ob_i-Exp_i)^2$	91.19	42.90	2.40	0.20	15.48	65.06	170.72	387.95

検定に必要なカイ二乗統計量は， $\chi^2=\displaystyle\sum_{i=1}^{k}\dfrac{(Exp_i-Ob_i)^2}{Exp_i}$ で求められます．今回の場合，グループは７つなので， $k=7$ です．

したがって，差の二乗を期待度数で割った値をそれぞれの $i$ について求める必要があります．例えば， $\frac{(Exp_1-Ob_1)^2}{Exp_1}=\frac{91.19}{38.5}\fallingdotseq 2.37$ です．

	$C_1$	$C_2$	$C_3$	$C_4$	$C_5$	$C_6$	$C_7$	合計
$Exp_i$	38.5	38.5	38.5	38.5	38.1	38.1	38.1	268
$Ob_i$	48	45	40	38	42	30	25	296
$Ob_i-Exp_i$	9.5	6.5	1.5	-0.5	3.9	-8.1	-13.1	0
$(Ob_i-Exp_i)^2$	91.19	42.90	2.40	0.20	15.48	65.06	170.72	387.95
$\frac{(Ob_i-Exp_i)^2}{Exp_i}$	2.37	1.12	0.06	0.01	0.41	1.71	4.48	10.16

よって，カイ二乗統計量は $10.16$ となります．

今回の場合，自由度は $k-1=7-1=6$ なので，有意水準 $\alpha=0.05$ での臨界値は $12.59$ です．

臨界値を求める際には，カイ二乗分布表を用います．

bellcurve.jp

カイ二乗統計量 $10.16$ は臨界値 $12.59$ よりも小さいので，帰無仮説を棄却することができません．したがって，令和３年度の商学部前期入試において，受験番号による合格者の偏りは統計的に有意でないことになります．

それでは，経済学部，法学部，社会学部についても調べてみましょう．

経済学部

第一段階選抜合格者は585人，合格者数は208人でした．

$E_1$ ：受験番号20001~20084 (84人)
$E_2$ ：受験番号20084~20168 (84人)
$E_3$ ：受験番号20169~20252 (84人)
$E_4$ ：受験番号20253~20336 (84人)
$E_5$ ：受験番号20337~20419 (83人)
$E_6$ ：受験番号20420~20502 (83人)
$E_7$ ：受験番号20503~20576 (83人)

	$E_1$	$E_2$	$E_3$	$E_4$	$E_5$	$E_6$	$E_7$	合計
$Exp_i$	29.9	29.9	29.9	29.9	29.5	29.5	29.5	208
$Ob_i$	33	40	36	33	23	28	15	208
$Ob_i-Exp_i$	3.1	10.1	6.1	3.1	-6.5	-1.5	-14.5	0
$(Ob_i-Exp_i)^2$	9.82	102.68	37.62	9.82	42.39	2.28	210.57	415.19
$\frac{(Ob_i-Exp_i)^2}{Exp_i}$	0.33	3.44	1.26	0.33	1.44	0.08	7.14	14.00

カイ二乗統計量は $14.00$ となります．

先ほどと同様に，有意水準 $\alpha=0.05$ での臨界値は $12.59$ です．

カイ二乗統計量はこれよりも大きいので，帰無仮説を棄却することができます．したがって，令和３年度の経済学部前期入試において，受験番号による合格者の偏りは統計的に有意であることになります．

法学部

第一段階選抜合格者は466人，合格者数は163人でした．

$L_1$ ：受験番号30001~20067 (67人)
$L_2$ ：受験番号30068~20134 (67人)
$L_3$ ：受験番号30135~20201 (67人)
$L_4$ ：受験番号30202~20268 (67人)
$L_5$ ：受験番号30269~20334 (66人)
$L_6$ ：受験番号30335~20400 (66人)
$L_7$ ：受験番号30401~20466 (66人)

	$L_1$	$L_2$	$L_3$	$L_4$	$L_5$	$L_6$	$L_7$	合計
$Exp_i$	23.4	23.4	23.4	23.4	23.1	23.1	23.1	163
$Ob_i$	29	28	27	20	25	18	16	163
$Ob_i-Exp_i$	5.6	4.6	3.6	-3.4	1.9	-5.1	-7.1	0
$(Ob_i-Exp_i)^2$	30.96	20.83	12.70	11.80	3.66	25.87	50.21	156.04
$\frac{(Ob_i-Exp_i)^2}{Exp_i}$	1.32	0.89	0.54	0.50	0.16	1.12	2.17	6.71

カイ二乗統計量は $6.71$ となります．

先ほどと同様に，有意水準 $\alpha=0.05$ での臨界値は $12.59$ です．

カイ二乗統計量はこれよりも小さいので，帰無仮説を棄却することができません．したがって，令和３年度の法学部前期入試において，受験番号による合格者の偏りは統計的に有意でないことになります．

社会学部

第一段階選抜合格者は662人，合格者数は230人でした．

$S_1$ ：受験番号40001~40095 (95人)
$S_2$ ：受験番号40096~40190 (95人)
$S_3$ ：受験番号40191~40285 (95人)
$S_4$ ：受験番号40286~40380 (95人)
$S_5$ ：受験番号40381~40474 (94人)
$S_6$ ：受験番号40475~40568 (94人)
$S_7$ ：受験番号40569~40662 (94人)

	$S_1$	$S_2$	$S_3$	$S_4$	$S_5$	$S_6$	$S_7$	合計
$Exp_i$	33.0	33.0	33.0	33.0	32.7	32.7	32.7	230
$Ob_i$	39	36	39	40	25	24	27	230
$Ob_i-Exp_i$	6.0	3.0	6.0	7.0	-7.7	-8.7	-5.7	0
$(Ob_i-Exp_i)^2$	35.93	8.96	35.93	48.92	58.65	74.97	32.02	295.38
$\frac{(Ob_i-Exp_i)^2}{Exp_i}$	1.09	0.27	1.09	1.48	1.80	2.30	0.98	9.00

カイ二乗統計量は $9.00$ となります．

先ほどと同様に，有意水準 $\alpha=0.05$ での臨界値は $12.59$ です．

カイ二乗統計量はこれよりも小さいので，帰無仮説を棄却することができません．したがって，令和３年度の社会学部前期入試において，受験番号による合格者の偏りは統計的に有意でないことになります．

まとめ

今回の分析では，経済学部でのみ受験番号の大小による合格者の割合の差が存在するという結論が得られました．

このようなばらつきが生じる原因として私が思いついたのは，「学力水準が高い（＝本命）の学生は悩むことなく出願する一方，共通テストで思うように点数が取れなかった学生は出願先を慎重に選ぶ」ということです．

二次試験の出願期間中には，各予備校が第一段階選抜のボーダー予想を発表します．また，大学による志願者数の中間発表も随時行われます．共通テストの点数がボーダーぎりぎり（＝学力水準が低い？）の学生は，こうした動向を見ながらじっくりと出願先を決めるパターンが多いのではないかと思います．（経済学部志願者の方が足切りをシビアに考えるものなのですかね…？）

以上，拙い分析でしたが参考になればと思います．（誤りなどがございましたら，ご指摘いただけますと幸いです．）

ここまでお読みいただきありがとうございました．