数学と心理学  〜ベイズの定理の理解の仕方〜

《心理学と数学》

T:ずっと前から「心理学と数学」というテーマで授業をしようと思っていたんだけど、構想がね、なかなかまとまらなかった。
S:心理学って心の問題でしょ。心の問題と数学なんて一番遠いような気がするけど、どうしてこのテーマを選んだの?
T:きっかけは、「考えることの科学」(市川伸一著・中公新書)という本を読んだから。
S:また本の紹介か。このごろ自分で考え出すことがなくなったんじゃない?
T:痛いところを突くねえ。でも、この本はとても面白かった。
S:そういえば、先生は教育相談をやっていたね。カウンセリングと数学は何か関係があるの?
T:僕がカウンセリングをやっていたわけじゃないけど、僕は教育相談では心理学よりも「空の仏教」(縁起の思想)を使って分析や実践をしていたね。心の問題は、関係性の問題なんだ。
S:関係性??(【日本の数学。0の発見】を参照)
S:数学と心理学の関係でしょ。心理の分析のとき、いろいろな人のデータを集めて統計を使うからじゃない。
T:そういう場合もあるけど、ここで扱いたいのは、確率の問題の中には心理的な問題が多いということなんだ。さらに、数学では理論(計算)ではそうなるけど、心では納得のいかないという問題もある。
S:理屈はそうかもしれないけど、なんか納得いかないということありますね。
S:僕なんか、数学自体に納得がいかない。
S:そういえば、数学で納得するというのは、自分の心の心理学をやっているということかな。
T:いい表現だねぇ。このページで少しでも数学と心理学との結びつきを示せたらいいな。では、具体的に問題を出してみようか。

問題1 100円の行方
『ホテルで3人の客が、一人1000円ずつ合計で3000円払った。でも、本当は2500円だったので、ボーイが500円を返そうとした。500円を3人で分けることができなかったので、3人はボーイにチップとして200円を渡したことにして、一人ずつ100円をもらった。ボーイに200円を渡したので、3000円−200円=2800円使ったことになる。ところが、一人100円もらったので、900円を払ったことになり、3人の合計は900円×3=2700円。さて、100円はどこへいったのだろう?』

S:なんだかわかりにくいな。問題を理解するだけで時間がかかるよ。
S:あれ?確かにおかしいなぁ。
S:それは当然だよ。3000円−500円+200円=2700円だよ。200円は渡したんじゃないよ。
S:えっ? 意味わからん。
S:だって、払ったお金は3000円と200円で3200円。そこから500円が戻ったとすると、3200-500=2700円が正解だよ。つまり、200円は引くのでなく足すんだ。
S:あっ、そうか。「渡した」と言うから、つい引いてしまうんだ。
T:これなんか思い込みによる間違いだね。でもね、こういう間違いは、人間だからしてしまうともいえるんだ。
S:(数学で)人がマチガイをするのはなぜかを考えるんですね。


《ヒューリステックスとアルゴリズム》

T:『考えることの科学』の中に、この2つの言葉が紹介されている。「ヒューリステックス」というのは「うまいやり方」のことで、簡便法と訳される。それに対して、「アルゴリズム」というのは「計算の手続き」のことで、その通りにやっていけば、必ず答えにたどり着くという方法のこと。
S:「アルゴリズム」って、コンピュータが得意なやつだね。
T:だけど、ヒューリステックス(うまいやり方)の方は間違いをやりやすい。
S:うまいやり方をやろうとするから間違えるんだ。地道にやるのが一番。
S:計算なら機械だってできるんだよ。人間は、機械じゃないから間違いをするんだ。
T:そういえば、最近はコンピュータに間違えさせるためにはどうすればいいのかと、研究されているらしい。
S:人間はヒューリステックを求めるから、間違いを犯すと言えるのかもしれないね。
S:それくらい人間は思い込みやすいんだ。そして、いったんそう思い込むと抜けられない。
S:それは、「バカの壁」だよ。自分で壁を作ってしまうんだ。
S:だから人間なんだ。
T:さあ、次の問題は…

問題2 『10円玉を投げたら、表が連続10回出た。次は表が出るか?裏が出るか?』

S:ずっと表が出続けることはないから、そろそろ裏になるんじゃないかな。
S:連続10回出たとしても、次にどっちが出るかわからないよ。
T:これを「数学」で考えてみよう。
 ア、連続で11回表が出る確率は1/(2^11)=1/2048。
   つまりめったに出ない。だから、今度は裏が出る方が多いはず。
 イ、連続で10回も出るのは偏りがあるからだ。10回も表が出たから次も表。
 ウ、表が出る確率は何回目であろうが同じ。表が出る確率は1/2で変わらない。
と、3つの考え方が出てくる。さて、みんなはどの考え方を支持するか?
S:どれも正しそうだな。
T:ここで、どれが正しいかと聞くのが数学。それに対して、3つの考え方が出てきてそれぞれが正しそうなのに、どうしてこれが正しいと納得するのだろうかと考えるのが心理学。
S:えっ、それも数学じゃないの。
S:確率って未来を予測するでしょ。だから、確率は心理的な要素が大きいくなるんじゃない。
S:でもさ、未来なんて絶対わからないよ。
T:じゃどうして、確率では「これが正しい」という結論が出るんだろう。
S:数学ってそうやって結論を出すのが好きなんじゃない。
S:これって実験すればどれが正しいか出るでしょ。だったら、やっぱり、考え方も正しい考え方と間違った考え方があるということじゃない。
S:だったら実験をしなくても、どう考えたら正しいのかがわかるにはどうしたらいいの?
S:そうだよね。いつも実験しなくっちゃいけないなんてめんどくさいよ。
S:それにさ、思い込んでそれが正しいという時に、どうやったら間違いを正せるの?
S:数学の答えを、直感的に納得できるようにすればいいんだ。
T:そうだね。やっぱり直感的にわかるということは大事なんだ。さっきの問題で言うと、直感的に言えば、前提が問題。ア、イ、ウはそれぞれ前提が違うんだ。アは、連続して11回表が出る確率を問題にしているし、イは、偏りのあるコインだということを前提にしている。
S:それなら、アとイは間違いでしょ?
T:実は、イは間違っているとはいえない。実際に私たちは、過去の経験をもとに未来を予測しようとする。これをベイズ理論】という。グーグルの検索システムなどは、この理論を使っているんだ。
S:未来の出来事の確率は、その出来事の過去の発生頻度を求めることで計算できるということですね。
S:いずれにしても、前提が違っていたら答えも違うということでしょ。
T:それについて、こんな例があるんだけど…

問題3 『事前テストで成績の上位群と下位群に分けた。そして、一定の授業(トレーニング)をやった後、再びテストをやった。そうすると、どんな結果が出るか?』

S:下位群は上昇するけど、上位群は下降する。
T:そうなんだ。たいていこういう結果が出て、成績の悪い人には効果があったけど、成績のよい人には逆効果だったという結論になる。
S:そんなの当たり前だよ。点数が低い人たちは、上がる可能性が高いし、高い人たちは下がる可能性が高いからね。
S:点数の低い人たちが、あきらめて何もしなかったら変わらないよ。
T:これは、上がる下がるがバラバラであっても、同じように下位群が上がり、上位群が下がるんだ。(回帰効果)
S:とすると、成績が良い人(背の高い人)の子どもは、成績が良い(背が高い)とは言えないということですか?


《確率はなぜ約分できるのか》

S:問題4 『確率100/600は1/6と約分しますよね。1/6は、6回のうちに1回出るということではないから、100/600の方が正確だと思うけど、なぜ約分するのですか。』
S:そうだよな。大数の法則で何回もやっていくうちに1/6=0.1666…に近づいていくということだから、100/600という方が近いような気がするんだ。それを約分してしまうと、6回のうちに1回は1が出るというふうに誤解してしまうよ。
S:確率の値を約分できるというのは、おかしいんじゃないかな。
S:6回に1回出ることと、6本のくじで1本が当たりということは違うよ。
S:A)6本のくじで当たりが1本と、B)12本のくじで当たりが2本と、C)60本のくじで当たりが10本。これらのくじの当たりやすさを同じとみなすのが、確率の定義じゃない。
S:ア)明日雨になる確率は50%、イ)10円玉を投げて表が出る確率50%、という2つの確率が同じとは思えないよ。
S:そうだよな。50%と予想が出れば、たいてい傘を持っていくもんな。
S:こう考えればどう。ア)は、二本のくじがあって、一本は雨。イ)は、二本のくじがあって、一本は表。これなら同じことと考えられない。
S:なるほど。わかりにくいのは、「くじ」に置き換えればいいというわけか。

T:こんな事例があるよ。
問題5 『警察が来て、あなたのDNAが被害者から発見されたものと一致した。専門家は「この一致が偶然である可能性は10万分の1だ。」と言っている。あなたが犯人である可能性は極めて高い(99.999%だ)。』

T:こんなことを言われたら、どうする?
S:この確率を「くじ」に置き換えればいい。10万分の1の確率と言うことは、10万人に1人と言う事だ。100万人の都市なら、当たりが(一致するDNAの人が)10人はいるということだから、犯人とは決め付けれない。
S:そうか。こうやって置き換えていけばいいのか。でも、数字って人をだます道具に使われやすいよね。


《「同じ」ものと「違う」もの》

T:ところで、
問題6 『2枚の10円を投げたとき、表表が出る確率はいくつだろう。

          2枚のコイン
        /  |  |  \     
      表表 表裏 裏表 裏裏

S:裏表と表裏は一緒だから、1/3です。
S:でもさ、裏表と表裏は違うよ。1/4じゃない。
S:一緒だよ。反対側から見れば、裏表は表裏になるよ。
S:2枚の10円玉は良く見ると違うよ。製造年号やキズ。色も汚れ具合も違う。
S:でも、値段は同じ10円だよ。違うとしたら買い物ができないよ。本当に違うの。
S:どんなものでもよく見ると違うんじゃない。平成9年の10円が表で平成18年の10円が裏なのと、平成9年の10円が裏で平成18年の10円が表なのとでは違うでしょう。
S:ということは1/4か。

S:コインは違うけど、電子は同じなんでしょ。
T:同じでなかったら、電子を区別できるものがあるということだから、新しい素粒子がまた出てくることになるよ。
S:この電子とその電子は違うものと考えるのが普通のような気がするけど、同じと考えるのが物理でしょ。そういえば、科学は違うものを同じものと考えるくせがあるよね。
T:普通、この10円玉とその10円玉は違うなんて考える人はいないよね。
S:本当は違うのに同じと考えてるんだ。
S:そうすると、電子も本当は違うのに同じと考えているの?
T:この問題の解決方法は、一つ一つの電子はみんな違うと考えるか、一つの電子がいろいろ現れているだけだと考えるかだけど、僕にはまだ結論が出ていない。

T:もう一つ問題…
問題7 『私には二人の子どもがあります。一人は男の子です。二人とも男の子である確率はいくつですか。』

S:そんなの1/2に決まっているよ。だって、もう一人は男か女のどちらかだろ。
S:違うよ。二人の子どもがいる場合の男女の組み合わせは4通りで、それぞれ確率は同じ。

          2人の子ども
        /  |  |  \     
      兄弟 兄妹 姉弟 姉妹

このうち一人が男の場合は、(兄弟・兄妹・姉弟の)3通り。そのうちもう一人が男であるのは(兄弟の)1通り。だから1/3。
S:へー。なるほど。男女は、兄妹と姉弟の2通りあることを忘れていけないんだね。
S:二枚のコインと同じだよ。こちらだと違いが良くわかるね。

T:でも、この問題を、
問題8 『私には二人の子どもがいます。今日は、たまたま男の子と一緒でした。二人とも男の子である確率はいくつですか。』
というように変えると、男の子を連れてくる確率も考慮しなければいけなくなり、

  2人の子どものうち一人を連れてくる場合(を8本のくじとする)
      /    |     |    \     
   兄弟(2)  兄妹(2) 姉弟(2) 姉妹(2)  (それぞれ同じ確率で出現するから当たりの本数は同じ)
     |     |     |     |
    2回    1回    1回    0回  (上の場合を仮定したとして、男の子と一緒である場合は)

となり、もう一人が男である確率=兄弟/(兄弟+兄妹+姉弟)=2/(2+1+1)=1/2となるよ。
S:どうして?さっきとどう違うの?
S:前提(確率空間)が違うんだよ。


《モンティ・ホールのジレンマ》

T:アメリカでこんなクイズ番組があったらしい。クイズの正解者が商品を選べる場面で…
問題9 『あなたの前に3つのドアがあります。1つのドアの後ろには車があって、あとの2つのドアの後ろにはヤギがいます。あなたが、たとえば1番のドアを選んだとします。番組の司会者は残ったドアの1つ、例えば3番のドアを開けます。司会者は、それぞれのドアの後ろに何があるのかを知っています。3番のドアにはヤギがいました。ここで司会者はあなたに、「2番のドアに変えますか」と聞きます。さて、2番のドアに変えた方がいいでしょうか。』

S:そんなの、確率は1/3で一緒なんだから、変えても同じだよ。初志貫徹。
S:違うよ。3番目のドアはヤギだから、2番目は2/3の確率になっている。だから変えたほうが良い。
S:3番目を開いたら、今度は確率が1番も2番も1/2になる。どっちでも変わらないよ。
S:あれ、わからなくなってきた。
T:さっきのくじに置き換えたらどうなるのかな。
S:こう考えたらダメなの?3番ははずれだから、その当たりは2番に移る。2番のはずれは3番に移る。

     1番(3)           2番(3)           3番(3)
    / \           / \          / \  
当たり(1)−はずれ(2) 当たり(2)−はずれ(1) 当たり(0)−はずれ(3)

となり、2番で車が当たる確率は2/3となり、当たる確率は高くなる。
S:何で、当たりやはずれが移るの?
S:だって、3番の当たりはどこかへ動かなければいけないだろ。開けた瞬間に移動するんだ。
S:そんなの変だよ。

T:車が当たる確率は1/3だから、本数が6本でそれぞれ2本ずつ番号がついている「くじ」を引くことと同じだと考えたらどうだろう。ここで司会者は、2番か3番しか開かない。しかも、司会者はドアの後ろに何があるか知っている。
S:そうだよ。司会者は、はずれがどれか知っていて開けたわけだから、次のようになる。

        それぞれ番号がついているくじ(6本とする)
          /       |         \
   1番(2本)が当たり  2番(2本)が当たり  3番(2本)が当たり
    /  \        /  \         /  \     (それぞれが当たりだと仮定したときに、
2番を開く 3番を開く 2番を開く 3番を開く 2番を開く 3番を開く    司会者が〜を開く確率は)
  1本     1本    0本    2本     2本     0本

S:1番目が当たりなら、2番目を開くか3番目を開くかは五分五分だから、1本ずつ。2番目が当っているとしたら3番目を必ず開くから、2本。もちろん自分が開かれたら当たりは0本。3番目が当たりなら必ず2番を開くから2本。開かれたら0本。
S:そうすると、3番を開いた状態で1番が当たる確率は、1/(1+2+0)=1/3となり変わらない。ところが、2番が当たる確率は、2/(1+2+0)=2/3となる。
S:つまり、変えた方が、変えないよりも当たる確率が2倍高くなるんですね。
S:この問題は、心理学の問題というよりは、純粋の数学の問題だよ。
S:でも、なんだか納得できないな。
S:そういう時は、問題をもっと極端にするんだ。ドアが5つあって、1つが当たりで、司会者は3つまで開けたとする。そのときも、確率は1/5と言って、変えないの?


《ベイズの定理》

T:ここで、「ベイズの定理」を紹介しよう。上の問題では、「3番目のドアを開けたとき、2番目が当たる確率」というように、条件(情報)がついている。このように条件(情報)がついたときに、どうやって確率を求めるか。たいてい、事前の確率は情報(条件)によって変わる。この変わった事後確率を求める公式がベイズの定理。例えば、このような問題を考えてみよう。

問題10 『ある街のタクシーの15%は青で、85%は緑である。あるときタクシーによるひき逃げ事件が起きた。一人の目撃者によると、ひいたのは青のタクシーであるという。ところが現場は暗かったこともあり、目撃者は色を間違えることもある。そこでこの目撃者がどれくらい正確かを同様の状況下でテストしたところ、80%の場合は正しく色を判断できるが、20%の場合は実際の色と逆の色を言ってしまうことがわかった。さて、証言どおり青タクシーが犯人である確率はどれだけだろうか。』

S:8割正解なんだから、80%の確率で青タクシーだよ。
S:もう少し少ないんじゃないかな。70%くらい。
T:このように、条件がついた時の確率を求める方法が、ベイズの定理なんだ。
S:どうやって求めるんですか。
T:さっきやった、「くじ」に当てはめるという方法を使うとわかりやすいよ。街のタクシーの台数を100台とすると、15台は青、85台が緑。さらに、証人が間違える確率を入れると、次のようになる。

         その街のタクシー(100台)
          /          \
      青(15台)          緑(85台)
      /  \           /  \    (この中で20%間違える)
 正(青)12台 誤(緑)3台  正(緑)68台 誤(青)17台 ←(これがあることを忘れてしまう)

S:わかった。青タクシーのうちで正しい場合は12台で、青タクシーと思い込む場合も含めると12+17=29台。そこで、正しい青タクシーである確率は、12/29=0.414となり、青タクシーである確率は41%だ。
S:えーっ。そんなに小さいの。
S:緑のタクシーを青と間違える場合を忘れているから、多く見積もってしまったんだ。
T:ベイズの定理は、直感を裏切る場合が多い。でもそれは、思い込みをしている場合が多い。次の問題なんかもっと違和感を感じるよ。


《三囚人問題》

問題11 『3人の囚人、A,B,Cがいる。1人が恩赦になって釈放され、のこり2人が処刑されることがわかっている。だれが恩赦になるか知っている看守に対し、Aが「BとCのうちすくなくとも1人処刑されるのは確実なのだから、2人のうち処刑される1人の名前を教えてくれても私についての情報を与えることにはならないだろう。1人を教えてくれないか」と頼んだ。看守はAの言い分に納得して、「Bは処刑される」と答えた。さて、この答えを聞いたあと、Aの釈放される確率はいくらになるか。』

S:Bが処刑されるということは、AかCかだから、助かる確率は1/2になる。
S:いや、例えBが処刑されるとわかったとしても最初からどちらかが処刑されることはわかっていたから、1/3だ。
S:わからなくなったよ。
S:じゃあ、さっきの方法でやってみよう。まず、名前の入っている「くじ」が6本あるとする。その名前のくじが選ばれたら恩赦。それぞれが恩赦に選ばれている場合に看守が「Bが処刑される」と言う確率と、「Cが処刑される」と言う確率(場合)は、次のようになる。

        印のついたくじ (6本)…選ばれたら恩赦
         /        |          \
    A(2本)が恩赦   B(2本)が恩赦     C(2本)が恩赦
    / \          / \          / \     (それぞれが恩赦になると仮定した時に、
Bが処刑−Cが処刑 Bが処刑−Cが処刑 Bが処刑−Cが処刑    看守が〜と答える場合)
  (1)     (1)     (0)     (2)     (2)     (0)

S:さて、Bが処刑されるという条件の下でAが選ばれる確率は、1/(1+0+2)=1/3となり、Cが恩赦になる確率は2/3となる。
S:Aは変わらないけど、Cは確率が高くなる。
S:当たり前じゃない。だって、Aが言っているように、BとCのどちらかが処刑されるわけだから、どちらが処刑されるかがわかっても、Aの確率は変わらないよ。
S:さっきのモンティ・ホールのジレンマと同じだよ。
S:何が同じなの?
S:問題も、答えも、解き方も同じだよ。比べてみて。構造が同じことに気がつくよ。

T:次は《変形した三囚人問題》だよ。
問題12 『3人の囚人、A,B,Cがいる。一人が恩赦になって釈放され、のこり2人が処刑されることがわかっている。恩赦になる確率はABCそれぞれ、1/4,1/4,1/2であった。だれが恩赦になるか知っている看守に対し、Aが「BとCのうちすくなくとも1人処刑されるのは確実なのだから、2人のうち処刑される1人の名前を教えてくれても私についての情報を与えることにはならないだろう。1人を教えてくれないか」と頼んだ。看守はAの言い分に納得して、「Bは処刑される」と答えた。さて、この答えを聞いたあと、Aの釈放される確率はいくらになるか。』

S:さっきの方法でやれるかな。まず、それぞれABCの印のついた「くじ」が8本あるとしよう。自分のくじが引かれたら釈放だ。ABCそれぞれが恩赦になると仮定して、B、Cが処刑されると看守から言われる場合(本数)は、

        印のついたくじ (8本)…選ばれたら恩赦
        /          |          \
    A(2本)が恩赦     B(2本)が恩赦    C(4本)が恩赦
    / \          / \         / \     (それぞれが恩赦になると仮定した時に、
Bが処刑−Cが処刑 Bが処刑−Cが処刑 Bが処刑−Cが処刑   看守が〜と答える場合)
  (1)    (1)      (0)    (2)      (4)    (0)

S:えっと、看守がBかCか選ぶ確率は半々なんですか?
T:そうだね。看守は恩赦になる確率を知らないとしよう。では、Bが処刑されると答える場合に、Aが助かる確率は?
S:Bが処刑されると答える場合は、全部で(1+4)。そのうちAが助かるのは1通り。
S:へー、Bが処刑されるという条件の下でAが助かる確率は、1/5だ。確率が下がるんだ。反対にCが恩赦になる確率は4/5。
S:Bが処刑されるとわかったら、かえって助かる確率が減るなんておかしいな。
T:不思議だろ。なぜこんなことが起きるんだろう。
S:3囚人問題のときは、Aの確率は変わらなかったけど、それは事前確率が同じの時だけで、事前確率が違ったら影響を受けるんだ。
S:この場合、Cが処刑されると言われたら、どうなるんだろう。
S:Aが助かる確率は1/3で増える。

          助かる確率
          A  B  C
条件なし      1/4  1/4  1/2
Bが処刑と聞いた時  1/5   0   4/5
Cが処刑と聞いた時  1/3  2/3   0

S:ということは、確率の小さい方が処刑されると言われたときに、事前確率よりも事後確率が小さくなるんだ。
S:そうか。よく考えると、当たり前のような気がしてきた。

T:最後の問題は自分で解いてみよう。
問題13 『40歳の女性が乳がんにかかる確率は1%。また、乳がん患者が、X線検査で陽性になる確率は90%である。乳がんではなかったとして、それでも検査結果が陽性になる確率は9%である。さて、あなたの検査結果が陽性と出た場合、実際に乳がんである確率は?』

S:わかりにくいから「自然頻度」に置き換えてみよう。「10000人の女性のうち100人は乳がんで、検査で陽性と出る人は90人。乳がんではない9900人のうち891人(9%)が陽性と出る。」よし、これを樹形図にしてみよう。
          10000
        /     \
      100       9900
     /  \     /  \
    10    90  

S:なんだ。心配するほどではないな。

参考文献 「数学に弱いあなたの驚くほど危険な生活」ゲルト・ギーゲレンツァー著・早川書房。
       「考えることの科学」市川伸一著・中公新書。

目次へもどる