心理学者は確率計算が苦手? 138
ストーリー by yosuke
大抵の人は「確率」と変換するのが苦手 部門より
大抵の人は「確率」と変換するのが苦手 部門より
あるAnonymous Coward 曰く、
New York Timesの記事、本家/.記事によると心理学の実験の分析結果の間違いをエール大学の経済学者Keith Chenが指摘したとのこと。
問題の実験方法は、1956年にJack Brehmが行なったものなどを改良したものでfree-choice paradigmと呼ばれ、心理学の認知的不協和の実証に使われている。
元の実験では、まず猿に赤と青のM&Mのどちらかを選ばせ、赤を選んだ場合、次に青と緑から1つ選ばせる。この場合、青と緑では緑のM&Mを選ぶ確率が高くなることから、赤と青では赤の方が好みだっただけなのに「青が好きじゃなかった」と自身に思い込ませることから青の順位を下げてしまうと結論づけられている。
しかし、Chen博士が執筆中の論文によると、これは確率の計算で簡単に説明できる現象であるとのこと。
赤、青、緑の3色を好みの順番に並べるときに順列の数は3 P 3=6通りであり、そのうち青よりも赤が前にくるものはの3通りだけで、青が緑よりも好まれる確率は元々1/3しかない。よって、このような実験で認知的不協和を実証したとするのは間違いであるとのことである。
- 赤→青→緑
- 赤→緑→青
- 緑→赤→青
この間違いは、「モンティ・ホール問題」と呼ばれる確率問題で起きがちな誤解と同類とのことで、過去に行われてきた認知的不協和の実験にも多くの間違いがあるのではないかと指摘している。
M&M (スコア:2, 参考になる)
# ま、真っ先に絵師コンビを連想したりなんかしてないんだからねっ:P
このストーリーは釣り (スコア:2, おもしろおかしい)
「サルの実験はどうみても正しいだろ!」
というコメントを大量につけてしまい、モンティ・ホール問題と同じような
騒動になるように誘導しようとしている。
・・・と思うのは、考えすぎですね、ごめんなさい。
最初に猿が青を選んだらどうするのか (スコア:1)
それが不明だと
>青と緑では緑のM&Mを選ぶ確率が高くなることから
と言われてもよくわからない。
したがってChen博士が証明していることは正しいかどうかは不明。
情報が欠落している
青を選んだ猿は実験の対象外にしてしまうのなら博士の指摘はわかる。
M&Mってマーブルチョコレートのことだよね。
Re:最初に猿が青を選んだらどうするのか (スコア:1)
猿の好みがはじめから決まっているとして、A>B>Cだったとする。
実験者はこれを知らないので、どれか適当に二つのものを猿に見せる。
このとき
1.AとB
2.BとC
3.CとA
の組み合わせが考えられる。
1.AとBのときはAがえらばれ、次に実験者はBとCを出す。すると、Bが選択される。
2.BとCのときはBがえらばれ、次に実験者はCとAを出す。すると、Aが選択される。
3.CとAのときはAがえらばれ、次に実験者はBとCを出す。すると、Bが選択される。
二回目に選択されるものが、一回目の選択肢になかったものである場合は2と3。
だから順序を調べるのにこに実験はないんじゃないの? というのが論旨だと思う。
読んでないけど。
/.jの人らにわかりやすく言えば、
“3個の数字を降順ソートするのにif文は何回実行されるか?”
ということではないかと。
Re:最初に猿が青を選んだらどうするのか (スコア:1)
最大(小)値を求めよ、のほうがよかったかな。
Re:最初に猿が青を選んだらどうするのか (スコア:1)
>青の順位を下げてしまうと結論づけられている
ということからすると、
「猿が好きな色の順序は決まっていない」というのが実験の前提なのでは。
Re:最初に猿が青を選んだらどうするのか (スコア:2, すばらしい洞察)
・「猿の好きな色の順序は決まっていない」+「認知的不協和」
・「猿の好きな色の順序は決まっている」(+普通の確率論)
の、どちらでも説明できる結果だと無意味ですよね。「猿の好きな色の順序は決まっていない」ことを示す別の実験なり、順序が決まらないようにする実験条件なりを考えなくてはいけない。
Re:最初に猿が青を選んだらどうするのか (スコア:1)
という条件でも確率論で同じ結果を導ければ
数学者の主張は認められるでしょう。
「心理学者は確率計算が苦手」と断じるためには
証明が不足していますね。
それでは本当の大前提が抜けているような (スコア:1)
#そもそも、好きな色もないような動物での心理実験結果を
#人間様に当てはめられてもねえ。
心理や認知神経の分野でマウスやラットを使う実験がありますが、
それが人間と共通であるという保証はどこでされているんでしょうかね。
Re:それでは本当の大前提が抜けているような (スコア:1)
猿って緑と青を区別しているんでしょうか? いや, 生物学的に区別する能力はあると思いますが, それこそ心理的にと言うか概念として別の色として取り扱うのでしょうか?
例えば古代の日本では緑と青を区別せず, 両方をまとめて「あお」と認識していました. 生物としての生活様式からも, 赤と緑/青系の色とを区別することは果実などの食べごろを識別するために重要となると言われていますが, 青と緑の区別にはそれほどの切実さはなさそうですし. 事前に青と緑を区別する訓練を行っていたとしたら, それが後の本試験に影響を与えるということはないのでしょうか?
Re:それでは本当の大前提が抜けているような (スコア:1, すばらしい洞察)
疑問を持つのはいいが、そういう指摘が過去に一切なかったとでも言うつもりか
Re:それでは本当の大前提が抜けているような (スコア:1)
間違った前提から得られる結論に意味はありません。
実験自体が時間の無駄です。
良く分からなかったがこれであってる? (スコア:1)
M&MってのはM&M'sチョコレートのこと。
たとえば猿は色の好みが
赤>青>緑の順番の猿は
赤と青のM&M'sを見せたら赤を選ぶし、青と緑のM&M'sを見せた青を選ぶという前提条件がある
猿が好む色の順番は以下の6通りがある。
(1) 赤>青>緑
(2) 赤>緑>青
(3) 青>赤>緑
(4) 青>緑>赤
(5) 緑>赤>青
(6) 緑>青>赤
最初に赤と青のM&M'sを見せたとき、
赤を選ぶ猿は、上記6パターンのうち、
(1) 赤>青>緑
(2) 赤>緑>青
(5) 緑>赤>青
の3通りになる。この3通りの好みのいずれかを持つ猿に
青と緑を選ばせたとき、緑を選ばせると
(2) 赤>緑>青
(5) 緑>赤>青
の2通りになるから、猿の色の好みが均等なら当然緑が多いのは当たり前。
ということでOK?
Re:良く分からなかったがこれであってる? (スコア:1)
Re:良く分からなかったがこれであってる? (スコア:2, すばらしい洞察)
固定してない場合に「好み」の適切な定義が可能とは思われませんが。
ん~と、 (スコア:1)
1)最初に赤青緑と3色提示しておいて、そのうちから1色を選ばせる。
2)赤もしくは青を選んだ群に対して、赤と青を提示して、1色を選ばせる。
3)先ほど選ばなかった1色と、緑の2色を提示して、1色を選ばせる。
という手順にすればいい……?
#思いつくままに書いてみたので、いろいろと問題がある気がする……。
#1)の手順で1色を選ぶことによって、以降の選択にどのような影響が起こるのかとか。
勝つて言はず、敗れて語らず、
謙譲を崇ぶ者は君子也、怨怒を起す者は小人也。
Re:ん~と、 (スコア:1)
せっかくだから俺はこの赤い(余計なもの) (スコア:1, すばらしい洞察)
好きな物から先に食べるサル
嫌いな物から先に食べるサル
好き嫌いのないサル
をどのように判別したのかが不明確だ。
追試することも評価することも出来ないと言わざるを得ない。
Re:こういう (スコア:3, すばらしい洞察)
致命的では。
Re:こういう (スコア:1, 興味深い)
Re:こういう (スコア:1, 興味深い)
ソーカル事件のような意図的な”乱用”とは異なる問題でしょう。
#テストの平均点なんて分布が分からなくちゃ何の情報ももたらさないのに
Re:こういう (スコア:1, すばらしい洞察)
Re:日本語 (スコア:1)
統計学基礎/確率 [wikibooks.org]
Re:日本語 (スコア:3, 興味深い)
件の認知的不協和の実証実験(今回Chen博士が批判しているもの)は、統計学の検定の考えに基づくならば
1.認知的不協和が起こっていないという前提で数学的モデルを建てると、最後に緑が選ばれる確率は50%と導出される
2.実験の結果、最後に緑が選ばれた回数は全体の63%程度であった(63%というのはリンク先の論文で見かけた数値、斜め読みなので間違ってたらすみません)
3.確率50%の事象が全体の63%の割合で起こることなんてめったにない
4.ということは、「認知的不協和が起こっていない」という前提が間違っている可能性が高い
という流れになっているものと推測されます。(「そもそも1.の確率計算が間違っている」というのが今回のChen博士の主張。)
冒頭に挙げた箇所の「確率」は、実際には2.の「緑が選ばれた回数の実験結果全体に占める割合」を指しているのでしょう。だとするとそれはあくまで「測定値」であって、数学的な意味での「確率」とは似て非なるものなので、冒頭に挙げた箇所は「この場合、青と緑では緑のM&Mを選んだ割合が高かったことから、」などと書いてほしかったと私は思います。
勿論、日常用語としてこの手の「結果の割合」を「確率」と称することはよくあることですが、科学的な話をするときぐらいは用語をちゃんと使ってほしいな、というのが親コメのACさんのお気持ちなのでは。
Re:主張がよくわからない。 (スコア:1)
元ネタを取り上げた本家のタレコミ人が何か間違っているのか。。。?
「せっかくだから、俺はこの赤いM&Mを選ぶぜ!」と言ったサルが次に緑を選んだ確率が、
青を選んだサルより有意に多いのなら、そこに何かの心理的影響があるようにも思えるのですが。
つまり、統計の母数を「最初に赤を選んだサル」に限定した場合、その次の選択肢は
# 赤→青→緑
# 赤→緑→青
の2つになりますよね。それで青を選ぶサルが多いって、そう言う事じゃないの?
うーん、何が間違って居るんだろう。
Re:主張がよくわからない。 (スコア:2, 参考になる)
心理的影響云々は最初の選択のせいで青が嫌いになった
という理論です。
しかし、最初に赤と青のどちらが好きかを選ばせて、赤が好きなサルを集めてきた場合、次に青を引く確率は当然低くなります。つまりそれは、心理的要素でもなんでもなく、母集団の集め方にバイアスをかけるのと同じことだからです。ロボットのように心理学的な影響を全く受けない個体群を考えてみるとよいでしょう。このロボットたちが全て同様に確からしく好みを持っている場合、最初のふるい(赤or青)を赤でクリアしたロボット(理想的なサンプルでは半分になります)が、次のふるい(緑or青)で緑を引く確率は2/3です。
Re:主張がよくわからない。 (スコア:1)
その理論は、
「すべての猿に(少なくとも実験に使った3色について)好みの順序が存在する」
という前提が必要なんですよ。その前提があれば緑を選ぶ確率が2/3になるのは正しい。
ただし、この心理学実験だと、多分初期状態で「猿の色の好みは均等とする」のが前提になっていて、
最初の選択で「猿の心理の方に」バイアスがかかってしまうというという結論を導いているのだと。
初期状態で猿の色の好みが均等で、試行によって変化しないのであれば、2回目の試行でも
色の選択確率は50%ずつになりますよね?
# まぁ、心理学実験として「好みが均等である」ことを前提に置くというのが、
# そもそも正しいのかどうかはさておき(w
Re:主張がよくわからない。 (スコア:1)
あくまで、提示された赤と青の中では、赤の方がより好き、というだけです。
つまり、赤を選んだ猿の色の好みは
赤→青→緑
赤→緑→青
に加えて
緑→赤→青
である可能性もあるということです。
この「赤>青グループ」の猿に青と緑を選ばせたら、当然、緑を選ぶ猿が青を選ぶ猿の倍程度になるでしょう。
これは、モンティ・ホール問題に代表される、条件付確率を直感的に処理することの難しさを示す良い例の1つだと思います。
Re:主張がよくわからない。 (スコア:1, 参考になる)
「決勝戦で当たる相手は、なぜかいつも強豪なんだよね。
もしかして、今まで苦労して戦ってきたからそう感じるのかな?」
数学者:
「弱い奴は決勝戦まで出てこないだけだよ」
この実験を、コンピュータにやらせてみると良いんです。
もちろん、6通りの色の選び方がそれなりに均等になるようにプログラムしましょう。
第二段階で青を選ぶ方が 1/3 になりますよ
猿での実験結果が、1/3 に対して有意な差があれば、それは心理的なものかもしれませんが
1/2 に対しての有意な差で「心理的な影響だ」というのは間違いだという話です。
1が出たら1000円上げますよ、といって被験者にサイコロを振らせると
1が出る確率は、1以外の数字が出る確率よりも低くなった。これは心理的な影響に違いない
なんていうと、一蹴されるでしょ?
ネコでもわかるモンティホールジレンマ [fc2.com]
Flashでモンティホール・ジレンマが分かりやすく解説してあります。
Re:主張がよくわからない。 (スコア:1, おもしろおかしい)
> 「決勝戦で当たる相手は、なぜかいつも強豪なんだよね。
> もしかして、今まで苦労して戦ってきたからそう感じるのかな?」
マスコミ:
「嘘でも強豪と言わなきゃ、決勝戦が盛り上がらないだろ。
無理があるなら『並み居る強豪を打ち破ってきた』と言えばいいのさ」
Re:主張がよくわからない。 (スコア:3, 参考になる)
赤、青、緑の3色を好みの順番に並べると、可能性は
1.赤>青>緑
2.赤>緑>青
3.青>赤>緑
4.青>緑>赤
5.緑>赤>青
6.緑>青>赤
の6通りだというのはよろしいでしょうか(話がややこしいので「同じぐらい好き」という場合は除いています)。
これら6通りの中から、「赤と青では赤が好き」というものを抜き出してみると
1.赤>青>緑
2.赤>緑>青
5.緑>赤>青
の3通りが残りますよね。で、その3通りの中から改めて「青と緑では青が好き」というもの(集団1)を抜き出してみると
1.赤>青>緑
という1通りだけが残ります。一方、「青と緑では緑が好き」というもの(集団2)を抜き出してみると
2.赤>緑>青
5.緑>赤>青
の2通りが残ります。
とすると、元々6通りの順番が同程度に分布していたら、集団1が集団2の半分、つまり「集団1+集団2」の1/3になるのは不思議でも何でもないですよ、というのが今回の話の内容と思います。
Re:主張がよくわからない。 (スコア:2, 参考になる)
>したがって、「緑→赤→青」なんていうルートはあり得ないのに、それを含めた6通りとあるから、
「緑→赤→青」はルートではなく好きな順番
「赤と青のM&Mのどちらかを選ばせ」の時点で、赤を選ぶのは
・青より赤が好き
ということ(だと仮定される)
この時点では、「赤>青」ということだけがわかりますから
「緑>赤>青」or「赤>緑>青」or「赤>青>緑」の、3パターンの嗜好をもった固体がまとめて抽出されます
「赤を選んだ場合、次に青と緑から1つ選ばせる」の時点で、緑を選ぶのは
・青より緑が好き
ということ(だと仮定される)
この時点で、「緑>青」という条件が追加されるので、
上記3パターンの嗜好のうち、「緑>赤>青」「赤>緑>青」の2パターンの嗜好の固体がまとめて抽出されるのです
なので、最初に赤を選んだ固体の中で、二度目も青を残す固体がの2/3の割合になるのは
確率的に何の不思議もない事だということになります。
ψアレゲな事を真面目にやることこそアレゲだと思う。
Re:主張がよくわからない。 (スコア:2, 参考になる)
そこがモンティホールジレンマと類似の落とし穴です。
確率の根底となるのは「3色の色が、どんな順序に好きか。」という組み合わせであり、6通りです。
RGB, RBG, GRB, GBR, BRG, BGR の6人が居ます。
この6人に「赤と青どっちが好き?」と聞いても
聞いた瞬間に、彼らがRB, BRの2タイプに変質するわけではありません。
RGB, RBG, GRB の3人は「赤が好き」と答え
GBR, BRG, BGR の3人は「青が好き」と答えます。
全体として3色を扱う場合は、その3色の組み合わせにおいて均等な母集団を考えなきゃいけないんです。
質問が2色を扱う場合でも、3色についてポリシーを持ってる者が、そのポリシー通りに行動して2色に対しての結果を出しています。
決して、2色に対しての考えを急に持ち始めて行動するわけではありません
この実験の第二段階では、6タイプの人物のうち3タイプの人物についてのみ取り上げてしまっています。
それは別に悪い事ではないのですが、それならばその事を考慮に入れて考察しなきゃなりません。
Re:主張がよくわからない。 (スコア:1, 興味深い)
>RGB, RBG, GRB, GBR, BRG, BGR の6人が居ます。
その仮定には問題ありませんか?
青と赤を比較して赤をとり、緑と青を比較して青をとったからと言って、赤と緑を比較した場合に必ず赤をとるとは限りませんよ。それが「好み」のあやふやさです。
私はこの実験自体に意味がないと思う。
Re:主張がよくわからない。 (スコア:1)
少なくとも統計的には、「好み」のあやふやさがないのと同じ結果になったみたいです。
「好み」のあやふやさがあると主張するなら、
それが統計的に見て有意な差となって出てくるような実験を考えればいいのでは。
1を聞いて0を知れ!
Re:主張がよくわからない。 (スコア:3, 参考になる)
『「好みのあやふやさ」を仮定しなくても説明出来る結果』
であったにもかかわらず、それを心理学者が正しく理解出来なかった結果
『「好みのあやふやさ」を証明した実験』
であると誤解されていた、ってことだと思う。
Re:主張がよくわからない。 (スコア:1, 興味深い)
まぁ、6タイプが8タイプに増えるだけなんですけどね。
Re:主張がよくわからない。 (スコア:1, すばらしい洞察)
R/B, R/G, G/B それぞれの好みが独立であると仮定するならば
この実験(それらの色を独立ではなく関連付けている)では何も測れない。
というのが正解ですね。
「あれ、66%なんて数字出るか?」と思って手を動かしたら、危うく罠にはまるところでした。
独立と仮定すれば、50%にしかなりません。
元のコメントはマイナスしといてください。
# 蛇足ですが、この仮定はChen博士の指摘に影響を与えるものではありません。
Re:主張がよくわからない。 (スコア:1)
「この猿は、本当は『青より赤のほうが好き』なだけなのに、
『自分は青が嫌いだ』と勘違いして緑のM&Mを取った」
という結論を導く過程のほうが、私にはよく分らない。
Re:主張がよくわからない。 (スコア:3, 興味深い)
木の実だったら赤か緑だろ。
何で人間じゃなくて猿で実験したのか、私にはよく解らない。
#ブルーべリーがあったか…
Re:主張がよくわからない。 (スコア:2, おもしろおかしい)
どうしても、食べ物の色とは思えないのですが、この違いがどこから来るのか不明。
Re:主張がよくわからない。 (スコア:1, すばらしい洞察)
6匹の猿を用意する。
ただし、各々の猿は、色の好みが違って、
猿1 赤>青>緑
猿2 赤>緑>青
猿3 青>赤>緑
猿4 青>緑>赤
猿5 緑>赤>青
猿6 緑>青>赤
とする。
その猿にアンケートを取った。
1. 赤か青、どっちが好きですか?
猿1 赤
猿2 赤
猿3 青
猿4 青
猿5 赤
猿6 青
2. (1に赤と答えた猿のみ)青か緑、どっちが好きですか?
猿1 青
猿2 緑
猿3 回答権なし
猿4 回答権なし
猿5 緑
猿6 回答権なし
さて、このように「認知的不協和」とやらを起こさず、明確に何色が好きかの意志を持っている猿を対象に、
「赤>青」と答えた猿の中で「緑>青」と答えた猿の割合を調べると、約66.7%(>50%)となる。
#1328642 [srad.jp]によると、心理学者の論文では「認知的不協和」を起こした結果、
「赤>青」と答えた猿の中で「緑>青」と答えた猿の割合は63%となったらしい。
「認知的不協和」を一切起こさない場合を考えた理論値が約66.7%であるにもかかわらず、結果は63%。
心理学者の実験は「認知的不協和」を起こしたとの証明を何一つしていない。
1を聞いて0を知れ!
Re:心理学の論文をいくつか読んだ感想 (スコア:2, 興味深い)
計量経済分析だって非常に洗練された手法が用いられているわけですが、数字をこねくり回しているだけで無意味な分析と評されたり・・・
工学だって「これで上手くいった」を積み重ねただけだろうとか言われたり・・・医学なんて「これで上手くいった」を収集した最たるもの。
門外漢がある体系をコケにすることほど楽なことは無いかと。
#杜撰な論文があるということ自体は否定しないけど。
Re:心理学の論文をいくつか読んだ感想 (スコア:2, 興味深い)
「努力している」人文学の一分野であると思っています。
ご覧になった論文が心理学のどの分野(認知系・発達教育系・社会系・臨床系)なのか
判りませんので何なのですが、特に後者3領域は実体のないものを数値化して
(数値化についても賛否ありますが)統計処理しますので、データの誤差、説明できない結果の
部分が何であるのかが全く推定できず、恐らくその辺りが「科学らしくない」のでは
ないのかと思います。
また、自分も含め数学を不得手とする研究者が多いことに加え、実体のない概念を
説明するためにやたら統計手法が高度で、誤りは起きやすいといえます。
(今回の統計の誤りは初歩的ですが)
どうしても統計パッケージソフトに頼らざるを得ませんし、その実そのパッケージが
どういう数式でデータを処理しているのか知らなかったり(「わかりやすい」説明書ですと
数式はあまり記載されていません)。
私も比較的信頼している書籍の「心理尺度の因子数の決定方法(=血液型性格尺度なら
血液型の1因子、更に男女差があるなら2因子、加えて年齢が関係するなら3因子。
説明不能な部分は誤差扱)」を純粋数学系の友人に見て貰いましたが、あまり同意できないとのことでした。
Re:とりあえず表題だけに反応すると (スコア:1, すばらしい洞察)
血液型性格分類が心理学の世界から出てきたものだっていう説は初めてだなあ。
医学、心理学両方から否定されたって言う事実はあるんだけど。
>特にマーケティング分野ではその手の奇妙な研究調査に出くわす可能性が高いです。
ここでいう「可能性」の意味はが不明。
経験的な過去の実績なのか、思い込みの予測なのか。
Re:今後、 (スコア:1)
「まさかのスペイン宗教裁判! この理論には3つの違いがある!
ひとつ! (個人的理由で時間ないので以下略
Re:今後、 (スコア:2, おもしろおかしい)
>「まさかのスペイン宗教裁判! この理論には3つの
違い間違いがある!Re:今後、 (スコア:1)
1を聞いて0を知れ!
Re:今後、 (スコア:2, おもしろおかしい)
最初に緑のジャケットを選んだルパンは
二度めは赤いジャケットを選んだ。
Re:心理学者だけなの? (スコア:2, すばらしい洞察)
もし、科学研究の基本である、批判的に実験結果を見るということをちゃんとやっていれば、数学的な落とし穴に気づかずとも、提唱されている心理学的偏向なしでも同じ結果がえら得れる、といった検証をしていたように思います。
しかも、ほとんど参照されないような泡沫論文ならともかく、ひとつの学説の基礎となるような論文に大きな間違いを含んだまま、反証的追試が行われなかったのか、というのが大きな疑問点ですね。