芸能人格付けチェックをチェックする(その2)

 前回は芸能人格付けチェックで正解数が少ないことを知って、2枚買った宝くじが2枚とも当たるくらいの確率であることを確認してみました。もう少し深堀してみたいと思います。 

 もう一度、この表を見てみます。すると、全問不正解で写す価値なし(番外)となったグループが49もあることが分かります。毎回5問に挑戦しているので、勘で答えても全問不正解になる確率は1/32になります。181チームが勘で挑戦したら、181×1/32=5.7から、全問不正解のグループ数はだいたい6グループになります。

そこで前回と同様に、次の問題を考えます。

 181グループが2択の問題5問に勘で答えたとき、全問不正解のグループ数が49以上となる確率を求めよ。

 勘で答えたときに全問不正解になる確率は、1/32であることから、全問不正解のチーム数が49以上になる確率は、次のように表すことができます。

$${}_{181}C_{49}\left(\frac{1}{32}\right)^{49}\left(\frac{31}{32}\right)^{132}+{}_{181}C_{50}\left(\frac{1}{32}\right)^{50}\left(\frac{31}{32}\right)^{131}+\cdots+\left(\frac{1}{32}\right)^{181}$$

になります。数列の\(\Sigma\)記号を使えば、次のように表現することができます。

$$\sum_{i=49}^{181}{}_{181}C_{i}\left(\frac{1}{32}\right)^{i}\left(\frac{31}{32}\right)^{181-i}$$

 Wolfram Alphaに頼って計算すれば、だいたい\(1.56×10^{-31}\)という値になります。
sum(combination(181,i)*(1/32)^i*(31/32)^(181-i),(i,49,181)) – Wolfram|Alpha (wolframalpha.com)

 その1で計算した確率\(3.60×10^{-14}\)の2乗よりもはるかに小さい値になっています。宝くじで考えると宝くじを4枚買ったときに4枚とも当たる確率よりも小さな値になります。またガンジス河にある砂粒の数が\(10^{20}\)個という推定(恒河沙という位は\(10^{52}\)を表し、ガンジス河のほとりの砂粒の数を意味しているといわれていますが、ちょっと盛りすぎです。)がありますが、その逆数よりもはるかに小さい値です。

 つまりガンジス河(どうせなら地球上)に落とした砂粒1つを見つける確率よりもはるかに小さい確率ということになります。僕らは神仏でしか起こせないような奇跡を今目の前で目撃しているのです。浪漫がありますよね。さらにこの奇跡を伸ばしていってほしいと思います。

(その1)と(その2)を共通テスト風対話形式の授業教材にしたものが次のファイルです。

芸能人格付けチェックをチェックする(その1)

 定期的に、芸能人格付けチェックという番組で、2択の問題で某芸能人が連勝記録をのばしていることが話題になっています。手元にある記録では76連勝でした。

 とりあえず、その芸能人がどれだけの正解率をもっていないといけないかを考えてみましょう。76連勝だから100%というご意見もあると思いますが、本人は答えを知っていない以上、不正解を選択する可能性が必ずあります。そのため、まず各問題の正解率を\(p\)としておき、仮定の下で、\(p\)の大きさを評価したいと思います。

 まず、5%くらいの確率でこの奇跡が起きていると仮定します。すると \(p^{76}=0.05\) を解いて、\(p=0.961\)くらいの正解率がないと5%の確率であっても76連勝は達成できないことになります。

 さらに、50%くらいの確率でこの奇跡を起こせるくらいの実力があると仮定します。すると \(p^{76}=0.50\)を解いて、\(p=0.991\)くらいの正解率がないと50%の確率であっても76連勝は達成できないことが分かります。

 もっと余裕で95%くらいの確率で76連勝を起こせるくらいの実力があると仮定します。すると \(p^{76}=0.95\)を解いて、\(p=0.999\)くらいの正解率がないと95%の確率で76連勝は達成できないことになります。

 超高級な一流品と量販品みたいなものの比較とは言え、一流品と量販品を区別する客観的な基準も無いようなものもが多く、個人の嗜好に左右されそうなものばかりなのに、この正解率を達成するとは凄いですね。さすが一流芸能人です。

 よくよく調べたら、wikipediaに過去データが乗っているので、ちょっと簡単な数学を使って探究してみようと思います。

 とりあえず、データをまとめたら次のようになりました。全部で21回放送されて、340チームが挑戦しています。番組では5問出題されて全問正解なら一流芸能人、一問だけ間違えたら普通芸能人、全問不正解なら写す価値なしとランクされますが、表では著作権に配慮して、横綱、大関、・・・、番外としています。もともと授業教材から流用しているので、芸能人番付チェックという架空の番組を想定しています。

 まず気が付いたことは正解率の低さです。のべ181チームが毎回5問の問題に挑戦しているので、のべ905問に回答したことになります。一方で横綱(一流芸能人)だと5問正解、大関(普通芸能人)だと4問正解となるので、正解した問題数は340問になります。つまり正解率は、\(340/905=0.376\)になります。コイン投げや勘で答えたとしても、確率0.5で正解すると思いますが、それよりもはるかに小さい数です。この数字をもう少し調べてみましょう。

 具体的には、次の問題を考えます。

 2択の問題905問に勘で答えたとき、正解数が340問以下となる確率を求めよ。

 ここで340問とせずに340問以下としたのは、ピンポイントで340になることは珍しいので、より起きにくい正解数が339問や338問・・・のケースを含めた確率で計算した方がいいと考えて、そのように設定しました。

 正解数が340になる確率はまさに条件付確率を使えば次のように表すことができます。

$${}_{905}C_{340}\left(\frac{1}{2}\right)^{340}\left(\frac{1}{2}\right)^{565}$$

 こんなの手では計算できませんが、Wolfram Alphaというサイトを使えば簡単に計算できます。だいたい\(1.45×10^{-14}\)という値です。
 combination(905,340)*(1/2)^340*(1/2)^565 – Wolfram|Alpha (wolframalpha.com)

 求めたいものはさらに正答数が少なくなった場合の確率を足し合わせて、

$${}_{905}C_{340}\left(\frac{1}{2}\right)^{340}\left(\frac{1}{2}\right)^{565}+{}_{905}C_{339}\left(\frac{1}{2}\right)^{339}\left(\frac{1}{2}\right)^{566}+\cdots+\left(\frac{1}{2}\right)^{905}$$

になります。数列の\(\Sigma\)を習っていたら、次のように表現することもできます。

$$\sum_{i=0}^{340}{}_{905}C_{i}\left(\frac{1}{2}\right)^{i}\left(\frac{1}{2}\right)^{905-i}$$

 こんなのは手計算ではとてもできませんが、やっぱりWolfram Alphaというサイトを使えば簡単に計算できてしまい、だいたい\(3.60×10^{-14}\)という値になります。
sum(combination(905,i)*(1/2)^i*(1/2)^(905-i),(i,0,340)) – Wolfram|Alpha (wolframalpha.com)
先ほどの値と比較して、さらに339項を足しても桁は変わらないというのがなかなか凄いと思います。より正解数が小さくなると確率はさらに小さくなるのでその影響がいかに小さいかということです。

 勘で答えたら、半分位の452問くらいは当たることが期待できますが、この番組では340問となっています。仮に勘で答えたときに、正解数が340問以下となる確率は、\(3.60×10^{-14}\)です。だいたい宝くじの1等に当たる確率が\(10^{-7}\)位と言われています。つまり、大雑把に言って、宝くじを2枚買ったら2枚とも1等が当たったような奇跡を、日本中が共有していることになります。すごくないですか?!

 奇跡はこれだけにとどまらないので、その2に続きます。