Books-Science: 2004年4月アーカイブ

確率的発想法~数学を日常に活かす
4140019913.09.MZZZZZZZ.jpg

■ベイズ推定

最近、ベイズ理論がインターネット技術でクローズアップされている。

・グーグル、インテル、MSが注目するベイズ理論
http://japan.cnet.com/special/story/0,2000050158,20052855,00.htm

18世紀にトーマスベイズが発案した統計理論。この本の前半で大きく取り上げられていた。

サイコロを振って1がでる確率は6分の1。2回目も連続して1がでる確率は36分の1で、3回連続は216分の1である。実際に何度か振ってみると、その確率と違ったりする。だが、100回や1000回繰り返せば、正確にその数字に近づいていく(大数の法則)。であるから、100回も繰り返せば、次に1がでる確率はかなり正確に予想できるようになる。

では、無差別に選んだ大量のホームページを連続して見て回る時、次のページが面白いページである確率はいくらだろうか?。

この確率を計算するのがベイズ推定である。

ベイズ推定では次に開くページが面白い確率、あるいは面白くない確率を、最初にエイヤっと適当に決めてしまう。例えば2分の1で面白いページが見られるとしたら、初期値=先入観を0.5として与える。そして、実際にホームページを1ページ見て確認する。面白かったならば、その次のページも面白いとする先入観が強くなり、そうでなければ低くなる。これを繰り返すことで、0.5が上下し、ホームページの面白い確率が次第に、正確に予想できるようになる。

私たちは、サイコロの構造について知識があり、1が出る確率は6分の1だと事前に知っている。もし、知らなくてもサイコロを振るのは簡単だから実際に100回も1000回も振ってみれば6分の1だと分かる。

だが、結婚相手の幸福な選択だとか、儲かる株式投資だとか、企業の重要な戦略意思決定は、事前に構造を知らないし、100回も1000回もやってみるわけにはいかない。結婚ともなれば、一般的な統計の値がどうであれ、自分の一回限りの人生である。自分の少ない経験からであっても、自身の気持ちで決めたい。そういうときに、主観的な確率を求める計算方法として、ベイズ推定は実用性がある。

ベイズについての詳しい解説をしているサイトがある。

・入門者向け解説 - ベイジアンってどういう考え方なんだろう
http://hawaii.aist-nara.ac.jp/~shige-o/cgi-bin/wiki/wiki.cgi?%c6%fe%cc%e7%bc%d4%b8%fe%a4%b1%b2%f2%c0%e2

テクノロジーの世界では、スパムフィルタリングや情報の分類サービスに応用されている。メールに含まれる単語のパターンから、スパムらしさを計算する。実際に分類しながら、学習によって、フィルタリングの精度が向上していく。

・POPFILE
http://popfile.sourceforge.net/manual/jp/manual.html
スパムメールをベイズ推定で発見するソフトウェア。

・コメントを用いた書籍の分類
http://www.tokuyama.ac.jp/IE/Pages/sotu2003/paper/fujitomi.pdf
ベイズを使って書籍を分類する

・コメントを用いた映画の分類
http://www.r.dl.itc.u-tokyo.ac.jp/~nakagawa/academic-res/abebe0207.pdf
映画を分類する

・The International Society for Bayesian Analysis
http://www.bayesian.org/国際ベイズ推定協会

■人間的な確率論

この本は、経済学者が書いた確率論の本であるが、著者はもともと企業人であり、消費者や経営者の人間心理と関わる確率論を重視している。

例えば、普通のサラリーマンならば、次の二つの選択肢のうち、

A 五分五分の確率で100万円かゼロ万円の給与がもらえる会社
B 固定で40万円の給与がもらえる会社

Bを選ぶ、という。数学上は期待値50万円のAの方が得であるにも関わらず、安定した生活という、外部の要素を求めているからだと分析している。

あるいは、ひとつボールを取り出して色を当てる賞金ゲームにおいて、

C 赤と黒のボールが50:50で100個入っている箱
D 赤と黒の比率はわからないがとにかく100個入っている箱

のふたつでは、多くの人がCを選ぶという。本当はどちらを選んでも戦略に優劣がないにも関わらず。何かが起きる確率と起きない確率を足しても100%にならないような計算を、人間のこころは行っている。そんな具体例を多数引き合いに出して、数学モデルとこころのモデルの違いを、丁寧に説明している。(エルスドールのパラドクス)

こうした不条理な考え方もする人間の織り成す社会や経済を、どう確率論でモデル化していくか、がテーマである。

この本は、確率のトリビア本のような宣伝文句が書かれていたが、まったくそうではない本だった。もっと志が高い。後半では、確率というキーワードを使って、正義や社会的平等、理想的な経済や政治という大きな問題にまで言及し、政策の矛盾や統計経済学者から見た、あるべき姿までを提案する。

数学については文系でも理解できる範囲に抑えられていて、確率論の本にしては読みやすい。統計理論を俯瞰する入門書としておすすめ。