心理戦で互いの思考の読み合いが無限ループしない理由

心理戦で互いの思考の読み合いが無限ループしない理由 88

ストーリー by hylom 2020年03月17日 7時00分
時間と能力的制約もありますしね部門より

対人ゲームでは、相手の思考を読んだうえでそれに対応することが求められることが多い。しかし、相手もこちらの思考を読んだ上で行動するとすると、こちらはさらに相手がこちらの思考を読むだろうと想定してその対策を取らなければならない。これを繰り返すと無限ループになるようにも思えるのだが、実際にはそうならない。その理由は、ゲームに参加するすべてのプレイヤーが常に最適解を選択するとは限らないからだという（Quora）。

過去に行われた実験では、一般人はほかのプレイヤーの思考を読まないか、読んだとしてもその思考を読んだ上でほかのプレイヤーが行動を変えるということはあまり想定しない、という結果になったそうだ。そのため、その実験ではいわゆる「裏の裏をかく」行動が最適になったという。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索88コメント Log In/Create an Account

ループじゃなくて再帰 (スコア:5, 興味深い)

by 90 (35300) on 2020年03月17日 9時33分 (#3780398) 日記

これ、ループじゃないですよね。
状態 k を関数 f(k) と評価して、関数の返り値 kintermediate を相手の出方の予想関数に g(f(k)) と与えると状態 k1 が得られて、f(k) - g(f(k)) が心地よく小さくなるまでこれを n 回にわたって再帰的に呼ぶと理想の状態に達するわけですよね? でも、この状態 kn って常に kn-1 との差分方程式の形でしか表現できないので、状態 k0 から kn までのすべての状態を保持しないといけなくないですか?
純粋なループなら g(f(k)) の一般項なので、kn-1 を捨てながらイテレーションを続ければ平衡状態まで思考を続けられるはず。ところがこれは再帰なので、"計算"を続けるといずれかの地点でスタック領域が埋まって、関数の最終行で例外が飛び、思考が打ち切られて行動を決定せざるを得なくなるんじゃないでしょうか。
で、リンク先を読むと一般人は n = 0～1 でそれが発生するよ、と書いてありますね。なるほど。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  相手が取る手は最終的に一つだから、この手を取ってくる(から対応する手を取ろう)と考えた時点で破棄してOK。
  knやkn-1は常に確定している。
  ただf(k)やg(f(k))には再帰が含まれているかもしれないし、一般人はf(k)やg(f(k))をn=0～1ぐらいしか計算しない。
  で最適化としてせいぜいnを2～3に設定すれば充分だろうということになるんじゃない？
  メモリは破棄できても計算時間(やそのリソース)はかかるんだから。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  再帰だから＝＞差分方程式のでしか表現できないから＝＞状態 k0 から kn までのすべての状態を保持しないといけない、
  のロジックがよくわからない。
  - Re:ループじゃなくて再帰 (スコア:1)
    
    by Anonymous Coward on 2020年03月17日 15時50分 (#3780748)
    
    多分、末尾再帰で書けるよね（ループにできる）。
    
    シェア
    
    親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  定式化の方針次第じゃないかな。
  1. 自分がグーチョキパーをそれぞれ1/3の確率で出すとする(数値をとりあえず適当に決める)
  2. 相手がそれぞれの手を読んだとすると、自分が出すべき手は…
  3. 2を何かしらの収束を迎えるまで繰り返す
  ならループになる。
  1. 自分がグーチョキパーを出す確率をp1, p2, p3とする
  2. 相手が自分の手を読んでる確率を…
  からスタートすると、繰り返し毎に数式が複雑になって行く。
- - Re:ループじゃなくて再帰 (スコア:2)
    
    by 90 (35300) on 2020年03月17日 19時15分 (#3780868) 日記
    
    ループと再帰が可換であることは理解してますか？
    なんとなーく昔そんなことを聞いたかなとは思ってました。ただ、実際には「相手がこう出てくるはずだから、それに対して……」処理は人の頭ではループ処理にはなってなくて、常に途中の状態も評価しながら最終行でオブジェクトが増えていっていると思うんですよね。その辺が「ループじゃなくて再帰」の含意でした。
    人の頭にはメモリがないからオブジェクトを参照する度にコンストラクタも走るし渡されたオブジェクトのコンストラクタも走る、だから計算量が爆発する、みたいな考え方の方が正確だったかな。
    
    シェア
    
    親コメント
  - - Re:ループじゃなくて再帰 (スコア:1)
      
      by Anonymous Coward on 2020年03月17日 20時59分 (#3780931)
      
      無い人が多いでしょうね。
      ここ日本では、学歴不問でソフトウェアエンジニアとかITエンジニアになれるから。
      
      シェア
      
      親コメント
つい最近現実で実験していたやつだ (スコア:2, 興味深い)

by Anonymous Coward on 2020年03月17日 7時45分 (#3780341)

「すべてのプレイヤーが最適行動を取ればトイレットペーパーが売り切れることはない。しかし他のプレイヤは俺様ほど賢くないから買い占めに走るに違いない。と見せかけて…」
- Re: (スコア:0)
  
  by Anonymous Coward
  
  相場の世界でもよく見る。
  こんな糞株買うやつおらへんやろーじゃなくて、イナゴがどう動くかを読まないといけない。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    為替の世界でもよく見る。
    こんな糞国の通貨買うやつおらへんやろーじゃなくて、イナゴがどう動くかを読まないといけない。
    - Re:つい最近現実で実験していたやつだ (スコア:1)
      
      by nim (10479) on 2020年03月17日 10時10分 (#3780441)
      
      オフトピだけど、「為替」＝「外国為替」前提の言説を見るたび、
      いつもお世話になっているのに忘れられがちな内国為替が可哀想になる。
      
      シェア
      
      親コメント
      - Re:つい最近現実で実験していたやつだ (スコア:1)
        
        by monyonyo (43060) on 2020年03月17日 12時46分 (#3780566)
        
        そもそもそういう場合の為替＝外国為替は2通貨の交換を意味しており、内国為替(≒国内送金)と対比される意味での外国為替(≒国際送金)とは違う意味。
        
        シェア
        
        親コメント
無限ループ (スコア:2)

by hahahash (41409) on 2020年03月17日 9時41分 (#3780408) 日記

Eカードのようなルールであれば、
最善手検討が無限ループになるのはルールのうちだろう。
何段階目で検討を打ち切ったか、なんていう話ではなく、
A>B>C>A...のような無限ループになるところまでは、
お互いが大前提として検討・認識した上で、
その後、ループ内の検討段階のどれを採用するか。という話でしかない。
最適解を必ず選択する場合でも、思考の読みあいは無限ループしない (スコア:1)

by akiraani (24305) on 2020年03月17日 9時29分 (#3780391) 日記

　最適解が存在するなら、最適解を選ぶことがベストであるので、そもそも思考を読む意味はない。
　じゃんけんのような、選択に有利不利が存在しない場合であっても、思考を無限に読むと最適解は「相手の誘導をシャットアウトしての完全ランダム勝負」になるだろ。
　故に、思考の読みあいはいずれにしても無限ループしないと思うがね……。

--
しもべは投稿を求める →スッポン放送局がくいつく →バンブラの新作が発売される
いまさらながらの納得感 (スコア:1)

by Anonymous Coward on 2020年03月17日 10時09分 (#3780436)

これだけの話でさえロクに内容を理解せずに
見当外れな疑問を呈す輩がこんなに湧くんだから
そりゃ最適解なんて望むべくもないな
単に時間や能力が有限だからじゃないの？ (スコア:0)

by Anonymous Coward on 2020年03月17日 7時05分 (#3780328)

昔の囲碁や将棋なんかでは何十時間もの大長考なんてものもあったわけで、
単に、考えるのに使える時間や能力が有限だから打ち切るだけじゃないの？
- リンク先見ろや (スコア:0)
  
  by Anonymous Coward
  
  最適解がわかってるゲームでの実験だ
  どちらかというと囚人のジレンマに近い話
  - Re:リンク先見ろや (スコア:2)
    
    by hahahash (41409) on 2020年03月17日 8時58分 (#3780371) 日記
    
    元記事の元記事の実験（平均値の2/3に近いものが勝者）についてなら、
    全員が最適解を知っていて最適解を書けるなら全員勝利する、
    というジレンマを含まないテストでなので、
    読みという話をするなら、
    『この形式でテストに参加した人間で、最適解まで考えないヤツがどのくらい混ざるか？』
    という話でしかなく、
    『考える時間や能力が不足している』で正しいと思うぞ。
    
    シェア
    
    親コメント
    - Re:リンク先見ろや (スコア:1)
      
      by hahahash (41409) on 2020年03月17日 10時39分 (#3780466) 日記
      
      参加人数がある程度限定され、勝者の数が少ないほど報酬が多く、
      自分以外の参加者と相談できる、等の条件があれば、
      複数人で組んで、平均値を押し上げる役と平均値を書く役になり、報酬を山分けする。
      みたいな戦略が発生するかもしれない。
      ＃状況を想像したら福本氏の絵で再現された。
      
      シェア
      
      親コメント
      - Re:リンク先見ろや (スコア:2)
        
        by rurusonic (47233) on 2020年03月19日 10時09分 (#3781855) 日記
        
        それを出し抜こうとする奴が現れて賭ケグルイ的展開に。
        
        シェア
        
        親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  他の人も書いてるけど、リンク先見たほうが良い
  元の記事は無限ループしないなんてことは一言も書いてないから
  一般的にどれぐらい相手の思考を読めば勝ちやすいかという話
  互いに最適解を選んだ結果、将棋なら無限ループ(千日手)はたまにあるし
  囲碁なら無限ループしたら駄目(コウ)ってルールで決まってる
  (そう決めてないと頻繁に発生する)
  とか言う話を知ってたら変な記事にしか見えないよねｗ
  - Re:単に時間や能力が有限だからじゃないの？ (スコア:2)
    
    by manmos (29892) on 2020年03月17日 10時53分 (#3780474) 日記
    
    囲碁を例に出すとき「駄目」と「劫」は違う。
    
    シェア
    
    親コメント
    - Re:単に時間や能力が有限だからじゃないの？ (スコア:1)
      
      by Anonymous Coward on 2020年03月17日 11時23分 (#3780496)
      
      囲碁を例に出すとき「駄目」と「劫」は違う。
      その駄目はそっちの駄目じゃねえよ！
      駄目まめちしき：囲碁は碁盤の目（領土）を獲得する競技だが、白と黒の領域に空いたどちらの領土でもない目のことを「駄目」という。ここから「価値がない」「してはいけない」という日常語の「駄目」という言葉ができた
      
      シェア
      
      親コメント
      - Re:単に時間や能力が有限だからじゃないの？ (スコア:1)
        
        by manmos (29892) on 2020年03月17日 11時43分 (#3780512) 日記
        
        あなたの言っている「駄目」の事ですが「劫」とは違いますよね。
        何言ってんだろう？
        
        シェア
        
        親コメント
        
        Re:単に時間や能力が有限だからじゃないの？ (スコア:1)
        
        by manmos (29892) on 2020年03月17日 13時52分 (#3780649) 日記
        
        「劫」などという囲碁用語を知っている人が「駄目」を知らないはずもないのに、わざわざ「駄目（コウ）」という「駄目」と「劫」を同一視するような書き方はいかんだろうというツッコミなんだが。
        中途半端にでも囲碁を知っている私ですら「アレ、「劫」は「駄目」じゃないよなぁ」と思うレベルの書き方だ。
        
        シェア
        
        親コメント
最適解を選択するとは限らない、とは？ (スコア:0)

by Anonymous Coward on 2020年03月17日 7時51分 (#3780343)

ちょっとよく分からない。
最適解を選択しない人間が、この世に存在するという事？
なんで？
- Re:最適解を選択するとは限らない、とは？ (スコア:2)
  
  by renja (12958) on 2020年03月17日 8時04分 (#3780349) 日記
  
  ①最適解を思いつかないで行動する
  ②単純にミスをする
  ③相手が最適解をとらないだろうと判断して行動する
  ④最適解より自分の好みを重視して行動する
  ⑤知識が間違っていて、最適解だと思っているものが最適解では無い
  ⑥そもそも最適解が1つに絞り込めない状況
  ぱっと思いつくだけでもこんな可能性は当たり前に存在するかと。
  
  --
  
  ψアレゲな事を真面目にやることこそアレゲだと思う。
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    > ①最適解を思いつかないで行動する
    > ②単純にミスをする
    > ③相手が最適解をとらないだろうと判断して行動する
    > ⑤知識が間違っていて、最適解だと思っているものが最適解では無い
    こんな状況ってあり得るの？
    普通に最適解を考えて、ミスなく行動すればよいだけでは？
    > ④最適解より自分の好みを重視して行動する
    最適解が好みでない、とは？？？？？
    やっぱりよく分からない。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      その人の最適解は「最適解でないこと」なんだよ。
      つまり「「最適解でないこと」」でないこと。
      いうならば「「「最適解でないこと」」でないこと」でないこと。
      したがって「
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      最適解が他人の行動で決まるとしたらどうする?
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      スゲ―な。常にミスなく動けるのか君は
      そして、全ての知識を有していて何に対しても最適解で判断できる、と
      全知全能かよ
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    ➆最適解が時間経過に伴って変化する。(時間軸による部分最適)
    ➇最適解が地勢的条件に伴って変化する。(空間軸による部分最適)
    ➈最適解に至る前に収束してしまうもの。(ライフゲームのコロニーのような状態)
    ➉最適解が存在しない。(スゴロクのようなもの)
- Re:最適解を選択するとは限らない、とは？ (スコア:2)
  
  by 90 (35300) on 2020年03月17日 9時48分 (#3780416) 日記
  
  じゃんけんをするとしましょう。あなたは勝たなければいけないとします。私が「パーを出します」と言った時、あなたが出すべき手はなんですか?
  まあ私は素直にグーを出すんですが、最適解ってなんだと思います?
  
  シェア
  
  親コメント
  - Re:最適解を選択するとは限らない、とは？ (スコア:1)
    
    by hahahash (41409) on 2020年03月17日 10時31分 (#3780461) 日記
    
    「パーを出します」という言葉を記録に残して、裁判所に証拠として提出する。
    
    シェア
    
    親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    チョキ。
    あなたが発言通りにパーを出したら勝ち。
    あなたが発言を覆して別の手を出したら、「嘘つき」と非難して精神的勝利を得る。
    なんなら「チョキを出す」と事前申告してもいい。嘘つかれたときの非難に力が入る。
  - - Re:最適解を選択するとは限らない、とは？ (スコア:2)
      
      by 90 (35300) on 2020年03月17日 12時00分 (#3780523) 日記
      
      良い返しが出てこないなーと思っていたんですがまだまだACさんにもプロの方がいらっしゃいますね……!
      
      シェア
      
      親コメント
    - - Re:最適解を選択するとは限らない、とは？ (スコア:2)
        
        by 90 (35300) on 2020年03月17日 12時59分 (#3780579) 日記
        
        それは最適な手ですか? 理由はどうしてでしょうか? 最適ではなくなる条件はなんでしょう?
        
        シェア
        
        親コメント
- Re:最適解を選択するとは限らない、とは？ (スコア:1)
  
  by Anonymous Coward on 2020年03月17日 8時24分 (#3780358)
  
  成功体験が忘れられないから、じゃないか。
  やっぱり万馬券当てたいんだよ。
  
  シェア
  
  親コメント
- Re:最適解を選択するとは限らない、とは？ (スコア:1)
  
  by albireo (7374) on 2020年03月17日 10時10分 (#3780440) 日記
  
  最適解しか選択しない人間が、この世に存在すると思っているという事？
  なんで？
  
  --
  うじゃうじゃ
  
  シェア
  
  親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  最適解が人によって違うってのもあるんじゃね？
  次の手が最適解ではないそこそこの手であっても、それ以上時間を突っ込んで最適解を探すより
  別のことをしてたほうがいい（つまりそのゲームが最重要事項ではない）とか。
- なんたら国民投票 (スコア:0)
  
  by Anonymous Coward
  
  ・最適でないところに価値を見いだす人がいる
  ・最適解を求める上の評価関数は人によってそれぞれ
  ・敢えて最適解でない選択をするようにみせかけて相手を混乱させたい
  ・単なる計算間違い
  ・最適解なにそれおいしいの？
  ・単に最適解を追っかけるのが面倒
  ・息抜きの合間に人生やってるんだから最適解なんてどうでもいいんだよ
  ・Anonymous Cowardにはわからないものなのだよ
- Re: (スコア:0)
  
  by Anonymous Coward
  
  理性より感情が優先されるから。
古人曰く (スコア:0)

by Anonymous Coward on 2020年03月17日 8時09分 (#3780351)

通らばリーチ、根拠無し !!!（確か出典は「ファントム無頼」）
- Re: (スコア:0)
  
  by Anonymous Coward
  
  麻雀の場合、牌の種類は、数牌(3*9)と字牌(3+4)の34種類。
  天牌の待ち牌は、一番多くて、国士無双13面待ちの13牌、次が九連宝燈の9牌、
  普通の多面待ちでは5面待ちくらいまでが多い。
  根拠無しで捨てても、ランダムなら当たってしまう確率は13/34≒43%以下で
  しかない。
  よって、「根拠は俺の不要牌だから」でいいんじゃないか。
そもそもゲーム自体が無限ループになってんの？ (スコア:0)

by Anonymous Coward on 2020年03月17日 9時02分 (#3780374)

突き詰めれば先手必勝・後手必勝・ループの３パターンになって、必ずしも相手の手を読み切る同士ならループって訳とは限らんだろう。
本当に (スコア:0)

by Anonymous Coward on 2020年03月17日 9時17分 (#3780381)

相手の思考を読んでいる（テレパス）同士だとどうなるのだろうか？
- Re:本当に (スコア:1)
  
  by minet (45149) on 2020年03月17日 12時15分 (#3780540) 日記
  
  相手を脅迫したり、取引をしたり、精神を傷つけるような思考をしたり、場外戦？になりそう。
  
  シェア
  
  親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  性格の悪い方が勝つ。
  本人しか理解できないような複雑な条件分岐が見えたところでどこまで正確に処理をトレースできるか？
  「こんなところにgoto置くんじゃねぇ！！」
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    「こ、こいつ何も考えていねー！」
心理戦って (スコア:0)

by Anonymous Coward on 2020年03月17日 10時25分 (#3780456)

言葉や行動でもって相手の動揺を誘ってミスさせるもんじゃないの？

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

心理戦で互いの思考の読み合いが無限ループしない理由 More ログイン

ループじゃなくて再帰 (スコア:5, 興味深い)

Re: (スコア:0)

Re: (スコア:0)

Re:ループじゃなくて再帰 (スコア:1)

Re: (スコア:0)

Re:ループじゃなくて再帰 (スコア:2)

Re:ループじゃなくて再帰 (スコア:1)

つい最近現実で実験していたやつだ (スコア:2, 興味深い)

Re: (スコア:0)

Re: (スコア:0)

Re:つい最近現実で実験していたやつだ (スコア:1)

Re:つい最近現実で実験していたやつだ (スコア:1)

無限ループ (スコア:2)

最適解を必ず選択する場合でも、思考の読みあいは無限ループしない (スコア:1)

いまさらながらの納得感 (スコア:1)

単に時間や能力が有限だからじゃないの？ (スコア:0)

リンク先見ろや (スコア:0)

Re:リンク先見ろや (スコア:2)

Re:リンク先見ろや (スコア:1)

Re:リンク先見ろや (スコア:2)

Re: (スコア:0)

Re:単に時間や能力が有限だからじゃないの？ (スコア:2)

Re:単に時間や能力が有限だからじゃないの？ (スコア:1)

Re:単に時間や能力が有限だからじゃないの？ (スコア:1)

Re:単に時間や能力が有限だからじゃないの？ (スコア:1)

最適解を選択するとは限らない、とは？ (スコア:0)

Re:最適解を選択するとは限らない、とは？ (スコア:2)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:最適解を選択するとは限らない、とは？ (スコア:2)

Re:最適解を選択するとは限らない、とは？ (スコア:1)

Re: (スコア:0)

Re:最適解を選択するとは限らない、とは？ (スコア:2)

Re:最適解を選択するとは限らない、とは？ (スコア:2)

Re:最適解を選択するとは限らない、とは？ (スコア:1)

Re:最適解を選択するとは限らない、とは？ (スコア:1)

Re: (スコア:0)

なんたら国民投票 (スコア:0)

Re: (スコア:0)

古人曰く (スコア:0)

Re: (スコア:0)

そもそもゲーム自体が無限ループになってんの？ (スコア:0)

本当に (スコア:0)

Re:本当に (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

心理戦って (スコア:0)