サンクトペテルブルクのパラドックス

サンクトペテルブルクのパラドックス（おかしな話）

―期待値から経済学へ―

１、ギャンブルで必ず勝てる方法

S：ギャンブルで必ず儲ける方法を見つけたよ。
S：ほんとぉ。どんな方法なの？

S：例えば、ルーレットで赤と黒に賭けるだろ。勝つ確率は１／２。賞金は賭けた金額の２倍。それで最初に100円賭ける。もし負けたら、次は２倍の200円を賭ける。さらに負けたら次は400円。こうやって負けたら倍々とかけていって、勝った所でやめるんだ。そうすれば、必ず100円は儲かる。

S：どうして？
S：だって、ｎ回まで負けたとすると、

合計金額＝100円＋200円＋400円＋…＋２ⁿ×100円
　　　　＝100（1＋2＋4＋…＋2ⁿ）
　　　　＝100（2⁽ⁿ⁺¹⁾－1）

でしょ。だから、その次に勝てば、２⁽ⁿ⁺¹⁾－(２⁽ⁿ⁺¹⁾－１)＝１となり、100円の儲けとなるよ。
S：100円では少ないよ。
S：だから、最初に100円の代わりに100万円にすれば、必ず100万円儲かるということになる。それに、たとえ少ない金額でも何回も繰返せば大きなお金になるよ。
S：なんか変な気がするな。勝つまでのお金が大量に必要だよ。
S：でも、確率１／２なら、何回も負け続けることはないよ。
S：実際にやってみたの？　いつ勝てるのかわからないから、お金が無くなったらアウトだよ。この方法は、金持ちでないとダメだよ。
S：３回負けたら次は８００万円だ。合計１５００万円必要だよ。

T：面白いねぇ。つい試してみたくなるような方法だね。実はこれとよく似ている賭けの問題が昔からある。考えた人はダニエル・ベルヌーイ。

２、サンクトペテルブルクのパラドックス

T：ベルヌーイは、次のようなコイン投げゲームを考案した。

『ある人が、公平なコインを、オモテが出るまで投げ続けるとする。オモテが出たらゲームは終わる。オモテが出たのが第１回目ならば２００円、第２回目ならば４００円、第３回目ならば８００円、…ｎ回目ならは１００×２ⁿ円、というように、賞金額が倍々に増大する。さて、この賭けの参加料として、いくらまで支払ったらよいか。』

S：金額の増え方は、さっきと一緒だな。
S：参加料として１０００円ぐらいなら出してもいいかな。
S：１回やるだけでしょ。せいぜい２・３回で表が出るよ。５００円ぐらいだ。
S：じゃあ、ゲームから得られる利得の期待値を計算してみよう。
　200円をもらえる確率は、1/2
　400円をもらえる確率は、1/4
　800円をもらえる確率は、1/8
　・・・　
S：金額が高くなるにしたがって確率も下がるわけだ。
T：では、期待値を出してみよう。

期待値＝200×1/2＋400×1/4＋800×1/8＋…＋100×2ⁿ×(1/2)ⁿ＋…
　　　＝100(2×1/2＋4×1/4＋8×1/8＋…＋2ⁿ×(1/2)ⁿ＋…)
　　　＝100(1+1+1+1+…)＝∞　　　・・・(1)

S：えっ、無限大！。どうして？
T：そうなんだ。期待利得の大きさから判断すれば、「どれだけ参加料を払ってもゲームに参加すべし」となる。
S：おかしいよ。例えば１万円払って２００円しかもらえないという事があるよ。
S：いや、１０回目に表が出れば、１０万２４００円。２０回だと１億４８５万７６００円だよ。これすごくない。
S：でも、９回も裏が出続けることはないよ。
S：いや、（1/2)⁹≒0.002＝0.2％ほどあるよ。
S：でも、無限大はないんじゃない？
S：この期待値がおかしいんだ。
S：期待値が無限大ということは、何回もやっていれば必ず１万円以上の儲けがあるということなの？
S：1万円どころか何億円以上だよ。
S：でもさ、賭ける度に１万円必要なんだろ。掛け金も増えていくよ。無限に儲かるとは思えないよ。

T：この問題はあまりに変なので「サンクトペテルブルクのパラドックス」と呼ばれている。ロシアの都市の名前なんだけど、そこでベルヌーイがこの問題を発表したからだ。
S：期待値が無限大なのに参加料をどれだけにするのかと聞くと、無限大にできないというところがパラドックスなんですね。
S：私ならどう考えても６００円以上は出せないな。

３、実際に実験してみよう

S：どうも不思議だ。実験してみよう。十円玉でやってみるよ。

　　回目　金額　　回数　合計金額
　　 1　　　200　　　32　　 6400
　　 2　　　400　　　20　　 8000
　　 3　　　800　　　10　　 8000
　　 4　　 1600　　　 3　　 4800
　　 5　　 3200　　　 1　　3200
　　 6　　 6400　　　 1　　6400
　　 7　　12800　　　 0　　　　0
　　 8　　25600　　　 1　　25600

合計回数　６８回で、合計金額　６２，４００円。平均９１８円

S：５００円の参加料だと、２８４００円の儲けか。
S：でも、参加料が１万円だと完全に損でしょう。
S：期待値から言えば、回数を増やしていくたびに平均金額はどんどん増えていくということなんですね。これ不思議。胴元になったら大変だ。

S：回数を指定すれば、期待値を求めることができるから問題ないのじゃない。
T：無限回やることは人間にとって不可能だよね。でも、回数を指定しないとやっぱりパラドックスは残るね。

S：ベルヌーイさんは、この問題をどう解いたのですか？

４、ベルヌーイの解法

T：ベルヌーイは、賭けに支払う料金が同じ金額でも、その人の持つ財産との関係で値うちが違うということが数学的期待値の定義では無視されたので、パラドックスが生じたものだと考えた。
S：意味がわからない。
T：例えば、同じ１万円アップといっても、所得ゼロからの１万円アップの値うちと、所得10万円からの１万円アップの値うちとは同じではないだろ。だから、賭けの期待金額は∞だけど、参加者が賞金から受ける満足の度合いは∞ではないと考えたのだ。

S：確かに、無限大にお金があっても、満足も無限大になるとは言えないもんね。
T：実際に、この賭けでいくらなら賭けますかという調査をすると、６００円という答えが一番多いらしい。期待値が無限大になることを教えても変わらないという。
S：それ心理学の問題として面白そう。

T：ベルヌーイはこの満足の度合いを、資産の高さによって変化し同じ増加金額の与える満足度は資産額に反比例して減少すると仮定した。そうすると、満足度は金額の対数をとることで表現できる。
S：なぜ対数をとるの？
T：これは、フェヒナーがウエーバーの法則を数式化するときにとった方法と全く同じなんだ。

【１０１、人間の五感は対数に変換されている】を参照

《簡単な説明（証明）》　　――――――――――――――――

資産額：Ｗ、その増分：ΔＷ、Ｗの与える満足度：Ｕ（Ｗ）、その増分：ΔＵとする。
資産の増分に対する満足度の増分は、資産額に反比例し資産の増分に比例するから、
　ΔＵ＝k・ΔＷ／Ｗ
微分で近似すると、
　ｄＵ／ｄＷ＝k／Ｗ
これを積分すると、
　Ｕ＝k・logＷ＋Ｃ　　・・・(2)
―――――――――――――――――――――――――――
S：人間の感覚は刺激が大きくなると感じ方が鈍くなってくるというのを、お金の金額にも応用したのですね。

T：そうすると、資産Ｗの人が参加料ｇを払ってこの賭けに参加した時、表がｉ回目に出れば、その資産は（Ｗ－ｇ＋２ⁱ）百円となる。（今までのゆきがかり上、百円単位になっている）
そして、
満足度Ｕ_ｉ＝ｋ・log（Ｗ－ｇ＋２ⁱ）＋Ｃ

期待満足はこの値に確率をかけてたす。（期待値と同じ）

　ＥＵ＝(Ｕ₁×1/2＋Ｕ₂×1/4＋Ｕ₃×1/8＋…＋Ｕ_n×(1/2)ⁿ＋…)
　　　　 ∞
　　　＝Σ（１／２）^ｉ×[ｋ・log（Ｗ－ｇ＋２ⁱ）＋Ｃ]
　　　　ｉ=1
　∑（１／２）^ｉＣ＝Ｃ　だから、
　　　　　 ∞
　ＥＵ＝ｋΣ[（１／２）^ｉ×log（Ｗ－ｇ＋２ⁱ）]＋Ｃ　　・・・(3)
　　　　　ｉ=1

　一方、この人が賭けに参加しない時の満足度は(2)で表わされるから、(2)の値と(3)の値が等しい時、参加料ｇの値は公平であるといえる。
そこで、(2)と(3)を等しいとおいて、kとＣを消去すると、

　logＷ＝∑(１／２)ⁱ・log(Ｗ－ｇ＋２^ｉ）　　・・・(4)

資産額Ｗ＝1000百円（＝十万円）とすると、

　log１０³＝∑(１／２)ⁱ・log(１０００－ｇ＋２^ｉ）

を解くと、ｇ＝６　　（６００円）になる。【エクセルを使うもとめ方】この式で求めたら、約１１（１１００円）になった。

S：ほとんどの人の調査結果と等しくなるね。パラドックスは消えたわけか。
S：こう考えると、(4)の値は無限にならないのですね。
T：ベルヌーイはこれを精神的期待値と呼んだ。これは、「期待効用」の最初の表現だと言われている。
S：効用って？
T：効用とは、人が財（商品や有料のサービス）を消費することから得られる満足の水準を表わす。ベルヌーイは、「資産増の金額ではなく、それがもたらす満足の増加が合理的な行為決定にとって重要だ」ということを最初に言った。ここからミクロ経済学が始まる。

S：むしろこちらの方が不思議です。期待値（の理論）がおかしいから、人間の金銭感覚を修正するということですか？
T：そうですね。期待値そのものは考慮しないで、人間の感じ方（くじをいくらで買うか）の方を修正したといっても良い。
S：この計算は、数学に人間を合わせるのではなく人間の感覚に数学を合わせたと考えられますね。
T：ある意味では「数学の人間化」ですね。でも、これはやはり数学の方に人間の感覚を合わせる「人間の理性化」の視点が強いですね。そして、この視点が経済学に導入されるきっかけだとすると、そうやって「数理化された仮説」が、数理的な合理性の中に組み込まれていくという点に「人間の理性化」が証明されているような気がします。

S：ところで、その人の持っている財産によって満足度が変わると言っても、１万円の購買力は、その人の財産に関係なく同じだよね。
S：それに、最初にいくら持っているのかで期待値（くじの参加料）が変わるなんて変だよ。
S：それから胴元と賭ける人は違うよ。やっぱり期待値そのものを無視するわけにはいけないと思う。
T：そうだよね。そこで、この期待値の方を修正する考え方をした人がいる。
　W.フェラー(1893～1990)「確率論とその応用」という人だ。

５、フェラーの解法

T：彼は、この賭けを標本抽出という確率論の文脈においた。無限に試行できない人間が賭けをするのを、標本と考えたのだ。普通は標本の大きさが増すにつれて、標本平均値は母集団平均値に近づいていく。
　この場合、期待値は母集団の平均値であり、賭けの参加者が実際に獲得する賞金額は標本値である。そうすると、標本平均値はどのようにして母集団平均値（∞）に近づいていくのか、参加料はどう変化するのかを考察できる。

　このことを例によってエクセルで調べてみよう。
試行回数を１０の累乗とし、確率を四捨五入することで分布を表わす。実際にはそうはいかないが、大数の法則で理想的な分布に近寄っていくと考える。

回　金額　　確率　参加回数10 100 1000 10000 100000 1000000 10000000
1　 200　　　0.5　　　　　 5　50　500　5000　50000　500000　5000000
2　 400　　　0.25　　　　　3　25　250　2500　25000　250000　2500000
3　 800　　　0.125　　　　 1　13　125　1250　12500　125000　1250000
4 　1600　　 0.0625　　　 1　 6　 63　 625　 6250　 62500　 625000
5 　3200　　 0.03125　　　 0　 3　 31　 313　 3125　 31250　 312500
6 　6400　　 0.015625　　　0　 2　 16 　156　 1563　 15625　 156250
7　 12800　　0.0078125　　 0　 1　　8　　78　　781　　7813　　78125
8　 25600　　0.00390625　　0　 0　　4　　39　　391　　3906　　39063
9　 51200　　0.001953125　 0　 0　　2　　20　　195　　1953　　19531
10　102400　 0.000976563　 0　 0　　1　　10　　 98　　 977　　 9766
11　204800 　0.000488281　 0　 0　　0 　　5　　 49　　 488　　 4883
12　409600　 0.000244141　 0　 0　　0 　　2　　 24　　 244　　 2441
13　819200　 0.00012207　　0　 0　　0 　　1　　 12　　 122　　 1221
14　1638400　6.10352E-05　 0　 0　　0 　　1　　　6　　　61　　　610
15　3276800　3.05176E-05　 0　 0　　0 　　0　　　3　　　31　　　305
16　6553600　1.52588E-05　 0　 0　　0 　　0　　　2　　　15　　　153
17　13107200 7.62939E-06　 0　 0　　0 　　0　　　1　　　 8　　　 76
18　26214400 3.8147E-06　　0　 0　　0 　　0　　　0　　　 4　　　 38
19　52428800 1.90735E-06　 0　 0　　0 　　0　　　0　　　 2　　　 19
20　104857600 9.53674E-07　0　 0　　0 　　0　　　0　　　 1　　　 10
21　209715200 4.76837E-07　0　 0　　0 　　0　　　0　　　 0　　　　5
22　419430400 2.38419E-07　0　 0　　0 　　0　　　0　　　 0　　　　2
23　838860800 1.19209E-07　0　 0　　0 　　0　　　0　　　 0　　　　1
24　1677721600 5.96046E-08 0　 0　　0　　 0　　　0　　　 0　　　　1
25　3355443200 2.98023E-08 0　 0　　0　　 0　　　0　　　 0　　　　0
　　　　　期待値＝平均　 460 752 1012　1435　 1756　　2019　　 2444

S：本当にこうなるの？
T：こんなにきれいに結果が出ることはないだろうけど、一つのモデルにはなると思う。

これを見ると、期待値が増加し発散することは予測できる。
では、その増え方はどうなっているのだろうか。
回数と期待値だけを取り出すと、

　回数(ｎ)　　 10　100　1000　10000　100000　1000000　10000000
　期待値　　　460　752　1012 　1435　　1756　　 2019　　　2444
　100・log₂ｎ 332　664　 997　 1329　　1661　　 1993　　　2325

回数ｎの桁数と期待値が等比的なので、期待値は回数の対数関数で表わされることが予測できる。
実際にこれを片対数グラフにするとほぼ直線になる。

これを見ると、期待値は１００・ｌｏｇ₂ｎ近づいていくことが予測できる。

まとめてみよう。

この賭けを独立にｎ回繰返すとする。各回の獲得賞金額は偶然によって変動するから確率変数と考えて、第ｋ回目の試行における賞金額をＸ_kで表わすと、
ｎ回の賞金額の総計は、Ｓ_n＝Ｘ₁＋Ｘ₂＋・・・＋Ｘ_n
という確率変数で表わされる。（表の期待値は、Ｓ_ｎ／ｎで求めている）
対応して、参加料もｎ回の総計＝Ｇ_nとする。

このとき公平な参加料は、大数の法則により
　∀ε＞０に対してｎ→∞のとき
　Ｐr（｜Ｓ_ｎ／Ｇ_ｎ－１｜＞ε）→０　（ｎ→∞）　・・・(5)

ｎが十分大きい時，｜Ｓ_ｎ／Ｇ_ｎ－１｜＜εであれば、
これは通常の数列の収束で、比　Ｓ_ｎ／Ｇ_ｎが１に収束することを意味する。

｜Ｓ_ｎ／Ｇ_ｎ－１｜＞εになる確率が０であるようなＧ_ｎはどういう関数だろうか？
実は、先ほどの表とグラフから、Ｇ_ｎ／ｎ＝１００・ｌｏｇ₂ｎと予測できる。

フェラーが証明したのは、(5)を満足する関数Ｇｎが存在し，それは
　　　Ｇ_ｎ＝ａｎ・log₂ｎ　　　（ａ＝１００円）　・・・(6)
であるということだ。
このことをフェラーはチェビシェフの不等式を使って証明した。

T：これで、一回あたりの公平な参加料が無限大になるのは、この賭けを無限回繰返す場合に限るのであって、有限回のくり返しではありえないことを示したことになる。
S：期待値∞は、一回あたりの儲けと思っていたけど、何回挑戦するかで期待値が違ってくるということなのですね。
S：では、試行回数が決まっている時の具体的な数値はどうなるんですか？
T：上の表からもわかると思うけど、計算で出そうとすれば、期待値（平均参加料）は１００・log₂ｎで求めることができる。
S：こうなると、何回賭けを行うかで掛け金が決まるわけだから、ある程度合理的に考えることができる。
T：でも、回数を多くすると参加料Ｇ_ｎがあまりにも多くなりすぎるのでこの賭けをやろうとする人はいないのです。
S：やっとパラドックスがなくなりましたね。

【参考文献】
「感情：人を動かしている適応プログラム　東京大学出版会　戸田正直」の中の高垣洋一郎氏の論文「効用と適用」より

　　　　　目次へもどる