パスワードを忘れた? アカウント作成
14136377 story
ゲーム

心理戦で互いの思考の読み合いが無限ループしない理由 88

ストーリー by hylom
時間と能力的制約もありますしね 部門より

対人ゲームでは、相手の思考を読んだうえでそれに対応することが求められることが多い。しかし、相手もこちらの思考を読んだ上で行動するとすると、こちらはさらに相手がこちらの思考を読むだろうと想定してその対策を取らなければならない。これを繰り返すと無限ループになるようにも思えるのだが、実際にはそうならない。その理由は、ゲームに参加するすべてのプレイヤーが常に最適解を選択するとは限らないからだという(Quora)。

過去に行われた実験では、一般人はほかのプレイヤーの思考を読まないか、読んだとしてもその思考を読んだ上でほかのプレイヤーが行動を変えるということはあまり想定しない、という結果になったそうだ。そのため、その実験ではいわゆる「裏の裏をかく」行動が最適になったという。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by 90 (35300) on 2020年03月17日 9時33分 (#3780398) 日記

    これ、ループじゃないですよね。

    状態 k を関数 f(k) と評価して、関数の返り値 kintermediate を 相手の出方の予想関数に g(f(k)) と与えると 状態 k1 が得られて、f(k) - g(f(k)) が心地よく小さくなるまでこれを n 回にわたって再帰的に呼ぶと理想の状態に達するわけですよね? でも、この状態 kn って常に kn-1 との差分方程式の形でしか表現できないので、状態 k0 から kn までのすべての状態を保持しないといけなくないですか?

    純粋なループなら g(f(k)) の一般項なので、kn-1 を捨てながらイテレーションを続ければ平衡状態まで思考を続けられるはず。ところがこれは再帰なので、"計算"を続けるといずれかの地点でスタック領域が埋まって、関数の最終行で例外が飛び、思考が打ち切られて行動を決定せざるを得なくなるんじゃないでしょうか。

    で、リンク先を読むと一般人は n = 0~1 でそれが発生するよ、と書いてありますね。なるほど。

    • by Anonymous Coward

      相手が取る手は最終的に一つだから、この手を取ってくる(から対応する手を取ろう)と考えた時点で破棄してOK。
      knやkn-1は常に確定している。
      ただf(k)やg(f(k))には再帰が含まれているかもしれないし、一般人はf(k)やg(f(k))をn=0~1ぐらいしか計算しない。
      で最適化としてせいぜいnを2~3に設定すれば充分だろうということになるんじゃない?
      メモリは破棄できても計算時間(やそのリソース)はかかるんだから。

    • by Anonymous Coward

      再帰だから=>差分方程式のでしか表現できないから => 状態 k0 から kn までのすべての状態を保持しないといけない、

      のロジックがよくわからない。

    • by Anonymous Coward

      定式化の方針次第じゃないかな。

      1. 自分がグーチョキパーをそれぞれ1/3の確率で出すとする(数値をとりあえず適当に決める)
      2. 相手がそれぞれの手を読んだとすると、自分が出すべき手は…
      3. 2を何かしらの収束を迎えるまで繰り返す

      ならループになる。

      1. 自分がグーチョキパーを出す確率をp1, p2, p3とする
      2. 相手が自分の手を読んでる確率を…

      からスタートすると、繰り返し毎に数式が複雑になって行く。

  • by Anonymous Coward on 2020年03月17日 7時45分 (#3780341)

    「すべてのプレイヤーが最適行動を取ればトイレットペーパーが売り切れることはない。しかし他のプレイヤは俺様ほど賢くないから買い占めに走るに違いない。と見せかけて…」

  • by hahahash (41409) on 2020年03月17日 9時41分 (#3780408) 日記

    Eカードのようなルールであれば、
    最善手検討が無限ループになるのはルールのうちだろう。

    何段階目で検討を打ち切ったか、なんていう話ではなく、
    A>B>C>A...のような無限ループになるところまでは、
    お互いが大前提として検討・認識した上で、
    その後、ループ内の検討段階のどれを採用するか。という話でしかない。

  •  最適解が存在するなら、最適解を選ぶことがベストであるので、そもそも思考を読む意味はない。
     じゃんけんのような、選択に有利不利が存在しない場合であっても、思考を無限に読むと最適解は「相手の誘導をシャットアウトしての完全ランダム勝負」になるだろ。

     故に、思考の読みあいはいずれにしても無限ループしないと思うがね……。

    --
    しもべは投稿を求める →スッポン放送局がくいつく →バンブラの新作が発売される
  • by Anonymous Coward on 2020年03月17日 10時09分 (#3780436)

    これだけの話でさえロクに内容を理解せずに
    見当外れな疑問を呈す輩がこんなに湧くんだから
    そりゃ最適解なんて望むべくもないな

  • by Anonymous Coward on 2020年03月17日 7時05分 (#3780328)

    昔の囲碁や将棋なんかでは何十時間もの大長考なんてものもあったわけで、
    単に、考えるのに使える時間や能力が有限だから打ち切るだけじゃないの?

    • by Anonymous Coward

      最適解がわかってるゲームでの実験だ
      どちらかというと囚人のジレンマに近い話

      • by hahahash (41409) on 2020年03月17日 8時58分 (#3780371) 日記

        元記事の元記事の実験(平均値の2/3に近いものが勝者)についてなら、
        全員が最適解を知っていて最適解を書けるなら全員勝利する、
        というジレンマを含まないテストでなので、

        読みという話をするなら、
        『この形式でテストに参加した人間で、最適解まで考えないヤツがどのくらい混ざるか?』
        という話でしかなく、
        『考える時間や能力が不足している』で正しいと思うぞ。

        親コメント
    • by Anonymous Coward

      他の人も書いてるけど、リンク先見たほうが良い
      元の記事は無限ループしないなんてことは一言も書いてないから
      一般的にどれぐらい相手の思考を読めば勝ちやすいかという話

      互いに最適解を選んだ結果、将棋なら無限ループ(千日手)はたまにあるし
      囲碁なら無限ループしたら駄目(コウ)ってルールで決まってる
      (そう決めてないと頻繁に発生する)
      とか言う話を知ってたら変な記事にしか見えないよねw

  • by Anonymous Coward on 2020年03月17日 7時51分 (#3780343)

    ちょっとよく分からない。
    最適解を選択しない人間が、この世に存在するという事?
    なんで?

    • ①最適解を思いつかないで行動する
      ②単純にミスをする
      ③相手が最適解をとらないだろうと判断して行動する
      ④最適解より自分の好みを重視して行動する
      ⑤知識が間違っていて、最適解だと思っているものが最適解では無い
      ⑥そもそも最適解が1つに絞り込めない状況

      ぱっと思いつくだけでもこんな可能性は当たり前に存在するかと。

      --

      ψアレゲな事を真面目にやることこそアレゲだと思う。
      親コメント
      • by Anonymous Coward

        > ①最適解を思いつかないで行動する
        > ②単純にミスをする
        > ③相手が最適解をとらないだろうと判断して行動する
        > ⑤知識が間違っていて、最適解だと思っているものが最適解では無い

        こんな状況ってあり得るの?
        普通に最適解を考えて、ミスなく行動すればよいだけでは?

        > ④最適解より自分の好みを重視して行動する

        最適解が好みでない、とは?????

        やっぱりよく分からない。

        • by Anonymous Coward

          その人の最適解は「最適解でないこと」なんだよ。
          つまり「「最適解でないこと」」でないこと。
          いうならば「「「最適解でないこと」」でないこと」でないこと。
          したがって「

        • by Anonymous Coward

          最適解が他人の行動で決まるとしたらどうする?

        • by Anonymous Coward

          スゲ―な。常にミスなく動けるのか君は
          そして、全ての知識を有していて何に対しても最適解で判断できる、と

          全知全能かよ

      • by Anonymous Coward

        ➆最適解が時間経過に伴って変化する。(時間軸による部分最適)
        ➇最適解が地勢的条件に伴って変化する。(空間軸による部分最適)
        ➈最適解に至る前に収束してしまうもの。(ライフゲームのコロニーのような状態)
        ➉最適解が存在しない。(スゴロクのようなもの)

    • じゃんけんをするとしましょう。あなたは勝たなければいけないとします。私が「パーを出します」と言った時、あなたが出すべき手はなんですか?

      まあ私は素直にグーを出すんですが、最適解ってなんだと思います?

      親コメント
    • by Anonymous Coward on 2020年03月17日 8時24分 (#3780358)

      成功体験が忘れられないから、じゃないか。
      やっぱり万馬券当てたいんだよ。

      親コメント
    • 最適解しか選択しない人間が、この世に存在すると思っているという事?
      なんで?

      --
      うじゃうじゃ
      親コメント
    • by Anonymous Coward

      最適解が人によって違うってのもあるんじゃね?

      次の手が最適解ではないそこそこの手であっても、それ以上時間を突っ込んで最適解を探すより
      別のことをしてたほうがいい(つまりそのゲームが最重要事項ではない)とか。

    • by Anonymous Coward

      ・最適でないところに価値を見いだす人がいる
      ・最適解を求める上の評価関数は人によってそれぞれ
      ・敢えて最適解でない選択をするようにみせかけて相手を混乱させたい
      ・単なる計算間違い
      ・最適解なにそれおいしいの?
      ・単に最適解を追っかけるのが面倒
      ・息抜きの合間に人生やってるんだから最適解なんてどうでもいいんだよ
      ・Anonymous Cowardにはわからないものなのだよ

    • by Anonymous Coward

      理性より感情が優先されるから。

  • by Anonymous Coward on 2020年03月17日 8時09分 (#3780351)

    通らばリーチ、根拠無し !!!(確か出典は「ファントム無頼」)

    • by Anonymous Coward

      麻雀の場合、牌の種類は、数牌(3*9)と字牌(3+4)の34種類。
      天牌の待ち牌は、一番多くて、国士無双13面待ちの13牌、次が九連宝燈の9牌、
      普通の多面待ちでは5面待ちくらいまでが多い。

      根拠無しで捨てても、ランダムなら当たってしまう確率は13/34≒43%以下で
      しかない。

      よって、「根拠は俺の不要牌だから」でいいんじゃないか。

  • by Anonymous Coward on 2020年03月17日 9時02分 (#3780374)

    突き詰めれば先手必勝・後手必勝・ループの3パターンになって、必ずしも相手の手を読み切る同士ならループって訳とは限らんだろう。

  • by Anonymous Coward on 2020年03月17日 9時17分 (#3780381)

    相手の思考を読んでいる(テレパス)同士だとどうなるのだろうか?

    • by minet (45149) on 2020年03月17日 12時15分 (#3780540) 日記

      相手を脅迫したり、取引をしたり、精神を傷つけるような思考をしたり、場外戦?になりそう。

      親コメント
    • by Anonymous Coward

      性格の悪い方が勝つ。
      本人しか理解できないような複雑な条件分岐が見えたところでどこまで正確に処理をトレースできるか?
      「こんなところにgoto置くんじゃねぇ!!」

      • by Anonymous Coward

        「こ、こいつ何も考えていねー!」

  • by Anonymous Coward on 2020年03月17日 10時25分 (#3780456)

    言葉や行動でもって相手の動揺を誘ってミスさせるもんじゃないの?

typodupeerror

ハッカーとクラッカーの違い。大してないと思います -- あるアレゲ

読み込み中...