サンクトペテルブルクのパラドックス(おかしな話)

―期待値から経済学へ―

1、ギャンブルで必ず勝てる方法

S:ギャンブルで必ず儲ける方法を見つけたよ。
S:ほんとぉ。どんな方法なの?

S:例えば、ルーレットで赤と黒に賭けるだろ。勝つ確率は1/2。賞金は賭けた金額の2倍。それで最初に100円賭ける。もし負けたら、次は2倍の200円を賭ける。さらに負けたら次は400円。こうやって負けたら倍々とかけていって、勝った所でやめるんだ。そうすれば、必ず100円は儲かる。

S:どうして?
S:だって、n回まで負けたとすると、

合計金額=100円+200円+400円+…+2n×100円
    =100(1+2+4+…+2n
    =100(2(n+1)−1)

でしょ。だから、その次に勝てば、2(n+1)−(2(n+1)−1)=1となり、100円の儲けとなるよ。
S:100円では少ないよ。
S:だから、最初に100円の代わりに100万円にすれば、必ず100万円儲かるということになる。それに、たとえ少ない金額でも何回も繰返せば大きなお金になるよ。
S:なんか変な気がするな。勝つまでのお金が大量に必要だよ。
S:でも、確率1/2なら、何回も負け続けることはないよ。
S:実際にやってみたの? いつ勝てるのかわからないから、お金が無くなったらアウトだよ。この方法は、金持ちでないとダメだよ。
S:3回負けたら次は800万円だ。合計1500万円必要だよ。

T:面白いねぇ。つい試してみたくなるような方法だね。実はこれとよく似ている賭けの問題が昔からある。考えた人はダニエル・ベルヌーイ。

2、サンクトペテルブルクのパラドックス

T:ベルヌーイは、次のようなコイン投げゲームを考案した。

『ある人が、公平なコインを、オモテが出るまで投げ続けるとする。オモテが出たらゲームは終わる。オモテが出たのが第1回目ならば200円、第2回目ならば400円、第3回目ならば800円、…n回目ならは100×2n円、というように、賞金額が倍々に増大する。さて、この賭けの参加料として、いくらまで支払ったらよいか。』

S:金額の増え方は、さっきと一緒だな。
S:参加料として1000円ぐらいなら出してもいいかな。
S:1回やるだけでしょ。せいぜい2・3回で表が出るよ。500円ぐらいだ。
S:じゃあ、ゲームから得られる利得の期待値を計算してみよう。
 200円をもらえる確率は、1/2
 400円をもらえる確率は、1/4
 800円をもらえる確率は、1/8
 ・・・ 
S:金額が高くなるにしたがって確率も下がるわけだ。
T:では、期待値を出してみよう。

期待値=200×1/2+400×1/4+800×1/8+…+100×2n×(1/2)n+…
   =100(2×1/2+4×1/4+8×1/8+…+2n×(1/2)n+…)
   =100(1+1+1+1+…)=∞   ・・・(1)

S:えっ、無限大!。どうして?
T:そうなんだ。期待利得の大きさから判断すれば、「どれだけ参加料を払ってもゲームに参加すべし」となる。
S:おかしいよ。例えば1万円払って200円しかもらえないという事があるよ。
S:いや、10回目に表が出れば、10万2400円。20回だと1億485万7600円だよ。これすごくない。
S:でも、9回も裏が出続けることはないよ。
S:いや、(1/2)9≒0.002=0.2%ほどあるよ。
S:でも、無限大はないんじゃない?
S:この期待値がおかしいんだ。
S:期待値が無限大ということは、何回もやっていれば必ず1万円以上の儲けがあるということなの?
S:1万円どころか何億円以上だよ。
S:でもさ、賭ける度に1万円必要なんだろ。掛け金も増えていくよ。無限に儲かるとは思えないよ。

T:この問題はあまりに変なので「サンクトペテルブルクのパラドックス」と呼ばれている。ロシアの都市の名前なんだけど、そこでベルヌーイがこの問題を発表したからだ。
S:期待値が無限大なのに参加料をどれだけにするのかと聞くと、無限大にできないというところがパラドックスなんですね。
S:私ならどう考えても600円以上は出せないな。

3、実際に実験してみよう

S:どうも不思議だ。実験してみよう。十円玉でやってみるよ。

  回目  金額  回数 合計金額
   1   200   32   6400
   2   400   20   8000
   3   800   10   8000
   4   1600    3   4800
   5   3200    1   3200
   6   6400    1   6400
   7  12800    0    0
   8  25600    1  25600

合計回数 68回で、合計金額 62,400円。平均918円

S:500円の参加料だと、28400円の儲けか。
S:でも、参加料が1万円だと完全に損でしょう。
S:期待値から言えば、回数を増やしていくたびに平均金額はどんどん増えていくということなんですね。これ不思議。胴元になったら大変だ。

S:回数を指定すれば、期待値を求めることができるから問題ないのじゃない。
T:無限回やることは人間にとって不可能だよね。でも、回数を指定しないとやっぱりパラドックスは残るね。

S:ベルヌーイさんは、この問題をどう解いたのですか?

4、ベルヌーイの解法

T:ベルヌーイは、賭けに支払う料金が同じ金額でも、その人の持つ財産との関係で値うちが違うということが数学的期待値の定義では無視されたので、パラドックスが生じたものだと考えた。
S:意味がわからない。
T:例えば、同じ1万円アップといっても、所得ゼロからの1万円アップの値うちと、所得10万円からの1万円アップの値うちとは同じではないだろ。だから、賭けの期待金額は∞だけど、参加者が賞金から受ける満足の度合いは∞ではないと考えたのだ。

S:確かに、無限大にお金があっても、満足も無限大になるとは言えないもんね。
T:実際に、この賭けでいくらなら賭けますかという調査をすると、600円という答えが一番多いらしい。期待値が無限大になることを教えても変わらないという。
S:それ心理学の問題として面白そう。

T:ベルヌーイはこの満足の度合いを、資産の高さによって変化し同じ増加金額の与える満足度は資産額に反比例して減少すると仮定した。そうすると、満足度は金額の対数をとることで表現できる。
S:なぜ対数をとるの?
T:これは、フェヒナーがウエーバーの法則を数式化するときにとった方法と全く同じなんだ。

101、人間の五感は対数に変換されている】を参照

《簡単な説明(証明)》  ――――――――――――――――

資産額:W、その増分:ΔW、Wの与える満足度:U(W)、その増分:ΔUとする。
資産の増分に対する満足度の増分は、資産額に反比例し資産の増分に比例するから、
 ΔU=k・ΔW/W
微分で近似すると、
 dU/dW=k/W
これを積分すると、
 U=k・logW+C  ・・・(2)
―――――――――――――――――――――――――――
S:人間の感覚は刺激が大きくなると感じ方が鈍くなってくるというのを、お金の金額にも応用したのですね。

T:そうすると、資産Wの人が参加料gを払ってこの賭けに参加した時、表がi回目に出れば、その資産は(W−g+2i)百円となる。(今までのゆきがかり上、百円単位になっている)
そして、
満足度U=k・log(W−g+2i)+C

期待満足はこの値に確率をかけてたす。(期待値と同じ)

 EU=(U1×1/2+U2×1/4+U3×1/8+…+Un×(1/2)n+…)
     ∞
   =Σ(1/2)×[k・log(W−g+2i)+C]
     i=1
 煤i1/2)C=C だから、
      ∞
 EU=kΣ[(1/2)×log(W−g+2i)]+C  ・・・(3)
      i=1

 一方、この人が賭けに参加しない時の満足度は(2)で表わされるから、(2)の値と(3)の値が等しい時、参加料gの値は公平であるといえる。
そこで、(2)と(3)を等しいとおいて、kとCを消去すると、

 logW=(1/2)i・log(W−g+2)  ・・・(4)

資産額W=1000百円(=十万円)とすると、

 log103=(1/2)i・log(1000−g+2

を解くと、g=6  (600円)になる。【エクセルを使うもとめ方】この式で求めたら、約11(1100円)になった。

S:ほとんどの人の調査結果と等しくなるね。パラドックスは消えたわけか。
S:こう考えると、(4)の値は無限にならないのですね。
T:ベルヌーイはこれを精神的期待値と呼んだ。これは、「期待効用」の最初の表現だと言われている。
S:効用って?
T:効用とは、人が財(商品や有料のサービス)を消費することから得られる満足の水準を表わす。ベルヌーイは、「資産増の金額ではなく、それがもたらす満足の増加が合理的な行為決定にとって重要だ」ということを最初に言った。ここからミクロ経済学が始まる。

S:むしろこちらの方が不思議です。期待値(の理論)がおかしいから、人間の金銭感覚を修正するということですか?
T:そうですね。期待値そのものは考慮しないで、人間の感じ方(くじをいくらで買うか)の方を修正したといっても良い。
S:この計算は、数学に人間を合わせるのではなく人間の感覚に数学を合わせたと考えられますね。
T:ある意味では「数学の人間化」ですね。でも、これはやはり数学の方に人間の感覚を合わせる「人間の理性化」の視点が強いですね。そして、この視点が経済学に導入されるきっかけだとすると、そうやって「数理化された仮説」が、数理的な合理性の中に組み込まれていくという点に「人間の理性化」が証明されているような気がします。

S:ところで、その人の持っている財産によって満足度が変わると言っても、1万円の購買力は、その人の財産に関係なく同じだよね。
S:それに、最初にいくら持っているのかで期待値(くじの参加料)が変わるなんて変だよ。
S:それから胴元と賭ける人は違うよ。やっぱり期待値そのものを無視するわけにはいけないと思う。
T:そうだよね。そこで、この期待値の方を修正する考え方をした人がいる。
 W.フェラー(1893〜1990)「確率論とその応用」という人だ。

5、フェラーの解法

T:彼は、この賭けを標本抽出という確率論の文脈においた。無限に試行できない人間が賭けをするのを、標本と考えたのだ。普通は標本の大きさが増すにつれて、標本平均値は母集団平均値に近づいていく。
 この場合、期待値は母集団の平均値であり、賭けの参加者が実際に獲得する賞金額は標本値である。そうすると、標本平均値はどのようにして母集団平均値(∞)に近づいていくのか、参加料はどう変化するのかを考察できる。


 このことを例によってエクセルで調べてみよう。
試行回数を10の累乗とし、確率を四捨五入することで分布を表わす。実際にはそうはいかないが、大数の法則で理想的な分布に近寄っていくと考える。

回 金額  確率 参加回数10 100 1000 10000 100000 1000000 10000000
1  200   0.5      5 50 500 5000 50000 500000 5000000
2  400   0.25     3 25 250 2500 25000 250000 2500000
3  800   0.125     1 13 125 1250 12500 125000 1250000
4  1600   0.0625     1  6  63  625  6250  62500  625000
5  3200   0.03125    0  3  31  313  3125  31250  312500
6  6400   0.015625   0  2  16  156  1563  15625  156250
7  12800  0.0078125   0  1  8  78  781  7813  78125
8  25600  0.00390625  0  0  4  39  391  3906  39063
9  51200  0.001953125  0  0  2  20  195  1953  19531
10 102400  0.000976563  0  0  1  10   98   977   9766
11 204800  0.000488281  0  0  0   5   49   488   4883
12 409600  0.000244141  0  0  0   2   24   244   2441
13 819200  0.00012207  0  0  0   1   12   122   1221
14 1638400 6.10352E-05  0  0  0   1   6   61   610
15 3276800 3.05176E-05  0  0  0   0   3   31   305
16 6553600 1.52588E-05  0  0  0   0   2   15   153
17 13107200 7.62939E-06  0  0  0   0   1    8    76
18 26214400 3.8147E-06  0  0  0   0   0    4    38
19 52428800 1.90735E-06  0  0  0   0   0    2    19
20 104857600 9.53674E-07 0  0  0   0   0    1    10
21 209715200 4.76837E-07 0  0  0   0   0    0    5
22 419430400 2.38419E-07 0  0  0   0   0    0    2
23 838860800 1.19209E-07 0  0  0   0   0    0    1
24 1677721600 5.96046E-08 0  0  0   0   0    0    1
25 3355443200 2.98023E-08 0  0  0   0   0    0    0
     期待値=平均  460 752 1012 1435  1756  2019   2444

S:本当にこうなるの?
T:こんなにきれいに結果が出ることはないだろうけど、一つのモデルにはなると思う。

これを見ると、期待値が増加し発散することは予測できる。
では、その増え方はどうなっているのだろうか。
回数と期待値だけを取り出すと、

 回数(n)   10 100 1000 10000 100000 1000000 10000000
 期待値   460 752 1012  1435  1756   2019   2444
 100・log2n 332 664  997  1329  1661   1993   2325

回数nの桁数と期待値が等比的なので、期待値は回数の対数関数で表わされることが予測できる。
実際にこれを片対数グラフにするとほぼ直線になる。



これを見ると、期待値は100・log2n近づいていくことが予測できる。

まとめてみよう。

この賭けを独立にn回繰返すとする。各回の獲得賞金額は偶然によって変動するから確率変数と考えて、第k回目の試行における賞金額をXkで表わすと、
n回の賞金額の総計は、Sn=X1+X2+・・・+Xn
という確率変数で表わされる。(表の期待値は、S/nで求めている)
対応して、参加料もn回の総計=G nとする。

このとき公平な参加料は、大数の法則により
 ∀ε>0に対してn→∞のとき
 Pr(|S/G−1|>ε)→0 (n→∞) ・・・(5)

nが十分大きい時,|S/G−1|<εであれば、
これは通常の数列の収束で、比 S/Gが1に収束することを意味する。

|S/G−1|>εになる確率が0であるようなGはどういう関数だろうか?
実は、先ほどの表とグラフから、G/n=100・log2nと予測できる。

フェラーが証明したのは、(5)を満足する関数Gnが存在し,それは
   G=an・log2n    (a=100円) ・・・(6)
であるということだ。
このことをフェラーはチェビシェフの不等式を使って証明した。

T:これで、一回あたりの公平な参加料が無限大になるのは、この賭けを無限回繰返す場合に限るのであって、有限回のくり返しではありえないことを示したことになる。
S:期待値∞は、一回あたりの儲けと思っていたけど、何回挑戦するかで期待値が違ってくるということなのですね。
S:では、試行回数が決まっている時の具体的な数値はどうなるんですか?
T:上の表からもわかると思うけど、計算で出そうとすれば、期待値(平均参加料)は100・log2nで求めることができる。
S:こうなると、何回賭けを行うかで掛け金が決まるわけだから、ある程度合理的に考えることができる。
T:でも、回数を多くすると参加料Gがあまりにも多くなりすぎるのでこの賭けをやろうとする人はいないのです。
S:やっとパラドックスがなくなりましたね。


【参考文献】
「感情:人を動かしている適応プログラム 東京大学出版会 戸田正直」の中の高垣洋一郎氏の論文「効用と適用」より

     目次へもどる