第1回はこちら
プリキュアで学ぶ統計学①---パンプキン王国の回帰分析
えーと、
プリキュアを知らない人には何を言っているのかわからないと思いますが、
かつて「キュアピース」と「サザエさん」は1年間じゃんけん対決をしていました。
(画像引用:じゃんけんポンで日曜日より)
で。
思うのです。
ぴかりんじゃんけんに不正はあったのか?
これが2012年2月から2013年1月、約1年にわたって繰り広げられてきた
「ぴかりんじゃんけん」vs「サザエさん」の勝敗表です。
(途中、キュアピースの反則無効試合などもありましたが)
(グッチョッパーは反則です)
最終的には35回戦って、キュアピースの10勝9敗16分けで終わりました。
で、思うわけです。
引き分け多すぎない?
35回戦って16回引き分けって・・半分くらい引き分けじゃん。
アニメ界の闇ネットワーク組織が日曜アニメ界に波風立たせないように引き分け多くしたんじゃないの!?
この2人をスパイにして!
というわけで、
まずは「このじゃんけんに不正はあったのか?」を調べました。
今回は「カイ二乗検定」ってのを行いました。
カイ二乗検定ってのは、「観測値(この場合、実際のじゃんけんの結果)と、理論値の分布がほぼ同じとみなして良いか」を調べるものです。
うん、何言っているかわかりませんよね。
例によって理屈はすっとばします。最後の参考リンクにあると思います。
ちなみにカイ二乗のカイは
χ
こう書きます。(ギリシア文字のXです)
プリキュアファンであれば、この形どこかで見たことがありますよね。
これです。
χ=スイートセッションアンサンブル
少しの間、真面目に解説します。
今回のカイ二乗検定を行うにあたり、
まずは帰無仮説ってのを立てます。この場合は
帰無仮説=「ぴかりんじゃんけんに不正はない」とします。
(帰無仮説ってのは通常○○は無いって定義することが多いです。
これに対するのが「対立仮説:ぴかりんじゃんけんに不正があった」になるのですが、
この帰無仮説、対立仮説の概念も言及すると長くなるので省略します。(ググるといくらでも出てきます。)
まあ、そういうものだと思っておいてください。
計算式は下記の通りです。
ざっと計算すると、
今回のカイ二乗値は 2.457です。
あと、「自由度」ってのを求めておきます。
これは(項目数ー1)で求まるので
今回は項目は、「勝ち」、「負け」、「引き分け」の3つなので
自由度は(3-1)=2ですね。
ついでに有意水準ってのを決めておきます(まあ、普通は5%=0.05です。)
最後に、
付表:カイ2乗分布表 chi-square distribution — 中川雅央(滋賀大学)
ってのを見ます。
ここで、自由度2、有意水準0.05の所を観ると、
5.99146、って数字がありますね。
で、下記の判定式に当てはめます。
カイ二乗値≧表の値 :帰無仮説が棄却される
カイ二乗値<表の値 :帰無仮説が棄却されない
今回は
(カイ二乗値)2.46 < 5.99(表の値)
なので、5%有意水準で今回の帰無仮説は棄却されない、ってなります。
で、この
「5%有意水準で、帰無仮説は棄却されない」
統計よく知らない人からすると、この時点でも何をいっているのかわかりませんよね。
これは、こういうことです。
まあ、要は今回のぴかりんじゃんけん対決は
「不正があったとはいえない」ということですね。
正確には、
「不正の証拠が出たわけではないので、まあ、不正はなかったんじゃないの」
くらいのニュアンスですけどね。
統計の世界って、簡単な事でもなんだか難しく説明して分かりにくくするんですよね。
もう一つの方法(かんたん)
じつは、カイ二乗検定は、もう一つ求め方があって、
(なんだか最近はこっちが主流みたいです)
こっちはP値を使います。
P値ってのは「帰無仮説が正しいという条件の下で、検定統計量の値より大きな値が得られる確率」のことですが、意味不明ですよね。
前回同様、キュアP値(ピーチ)だと思いましょう。
ほら、意味不明だったP値があっというまに愛おしいものになりました。
こっちも、ざっとやり方だけ簡単に図解しますと、
(コンピューターが普及する前は、この方法は手計算が死ぬほどめんどくさくてあんまりやってこなかったみたいですけど、最近はエクセルとかで簡単に出せるのでコッチが主流になりつつあるようです。)
どっちを使っても良いのですが、
スイートプリキュアを取るか、
フレッシュプリキュアを取るか、
贅沢な悩みですよね。
(最近、ツイッターなんかで、個人でアンケートを取れるようになってきましたが、
どうも、みんな「こっちの方が多い、少ない」で終わらせていてもったいないな、と思います。こういった検定を利用すると、2つの答えに有意差が本当にあるのかどうか、が解って分析が面白くなっていくと思います。)
どのみち、キュアピースの疑いは晴れました。
ここまでは序盤。
で、じつはここからが、今回、自分がもっとも言いたい事です。
大数の法則とは
大数の法則です。確率論、統計学には「大数の法則」ってのがあります。
これ大数の法則 - Wikipediaですね。
「大数」は「たいすう」って読みます。
大数の法則ってのは、今回のぴかりんじゃんけんに例えると、
インチキの無い公平な条件でぴかりんじゃんけん対決を行えば、
最初のうちは3連勝とかしても、何回も何回もじゃんけんをし続ければ、
最終的には1勝1敗1分けになっていくよ、ということですね。
今回は10勝9敗16引き分けですが、これは回数を重ねていけば、
確実に1勝1敗1分けの割合になっていきます。
でもね
小さな子供はそう思いません。
大数の法則は下記式により証明されますが、
(引用;大数の法則の具体例と証明 | 高校数学の美しい物語)
当然、小さな子供にこんな難しい式理解できるわけがありません。
(ぼくも良く理解できません)
ゆえに小さな子供は、
「じゃんけんは、ひきわけが、おおいんだよ。だってキュアピースがそうだったもん」
こういう考えに至るのです!!
今やプリキュアは小さな女の子の約半数が見ているのです。
これは大変です!!。
このままでは、プリキュアを観て育った小さな女の子が
「大数の法則」を理解できないまま育ってしまいます。
こんな状態のままでは、将来の子供たちが
統計リテラシが身につかず、インチキグラフに騙される大人になってしまいます。
このままでは日本の未来が危ない!!
では、
これを防ぐにはどうすればよいのでしょうか。
方法はひとつしかかありませんよね。
そう、キュアピースとサザエさんのじゃんけんの試行回数を増やして
大数の法則を実証すれば良いのです。
せめてあと50回。
もう1年間キュアピースとサザエさんがじゃんけんをし続ければ、
おそらく勝敗は、1勝1敗1分けに収束され、大数の法則が実証できるでしょう。
その時初めて、小さな女の子は大数の法則の意味を知るのです。
大数の法則をその目で見て正しく理解した子供はさぞや立派に成長し、
日本をより良い国にしていくのでしょう。
つまりです。
小さな子供のために、
そう。
ただ、小さな子供のためだけに、
ひいては日本の将来のために、
スマイルプリキュアの2期をやるべきじゃないのかな!!(OVAでもいいよ!!)。
(おわり)
次回は
「プリキュアで学ぶ統計学③:星空育代と「母集団」
<プリキュアで学ぶ統計学>
第1回:プリキュアで学ぶ統計学①---パンプキン王国の回帰分析
第2回:プリキュアで学ぶ統計学② ぴかりんじゃんけんに不正はあったのか?
第3回:プリキュアで学ぶ統計学③ 星空育代と「母集団」 (←予定)
<おすすめ記事>
(参考リンク:こことは違いためになる真面目なサイトです)