心理戦で互いの思考の読み合いが無限ループしない理由 88
ストーリー by hylom
時間と能力的制約もありますしね 部門より
時間と能力的制約もありますしね 部門より
対人ゲームでは、相手の思考を読んだうえでそれに対応することが求められることが多い。しかし、相手もこちらの思考を読んだ上で行動するとすると、こちらはさらに相手がこちらの思考を読むだろうと想定してその対策を取らなければならない。これを繰り返すと無限ループになるようにも思えるのだが、実際にはそうならない。その理由は、ゲームに参加するすべてのプレイヤーが常に最適解を選択するとは限らないからだという(Quora)。
過去に行われた実験では、一般人はほかのプレイヤーの思考を読まないか、読んだとしてもその思考を読んだ上でほかのプレイヤーが行動を変えるということはあまり想定しない、という結果になったそうだ。そのため、その実験ではいわゆる「裏の裏をかく」行動が最適になったという。
ループじゃなくて再帰 (スコア:5, 興味深い)
これ、ループじゃないですよね。
状態 k を関数 f(k) と評価して、関数の返り値 kintermediate を 相手の出方の予想関数に g(f(k)) と与えると 状態 k1 が得られて、f(k) - g(f(k)) が心地よく小さくなるまでこれを n 回にわたって再帰的に呼ぶと理想の状態に達するわけですよね? でも、この状態 kn って常に kn-1 との差分方程式の形でしか表現できないので、状態 k0 から kn までのすべての状態を保持しないといけなくないですか?
純粋なループなら g(f(k)) の一般項なので、kn-1 を捨てながらイテレーションを続ければ平衡状態まで思考を続けられるはず。ところがこれは再帰なので、"計算"を続けるといずれかの地点でスタック領域が埋まって、関数の最終行で例外が飛び、思考が打ち切られて行動を決定せざるを得なくなるんじゃないでしょうか。
で、リンク先を読むと一般人は n = 0~1 でそれが発生するよ、と書いてありますね。なるほど。
Re: (スコア:0)
相手が取る手は最終的に一つだから、この手を取ってくる(から対応する手を取ろう)と考えた時点で破棄してOK。
knやkn-1は常に確定している。
ただf(k)やg(f(k))には再帰が含まれているかもしれないし、一般人はf(k)やg(f(k))をn=0~1ぐらいしか計算しない。
で最適化としてせいぜいnを2~3に設定すれば充分だろうということになるんじゃない?
メモリは破棄できても計算時間(やそのリソース)はかかるんだから。
Re: (スコア:0)
再帰だから=>差分方程式のでしか表現できないから => 状態 k0 から kn までのすべての状態を保持しないといけない、
のロジックがよくわからない。
Re:ループじゃなくて再帰 (スコア:1)
多分、末尾再帰で書けるよね(ループにできる)。
Re: (スコア:0)
定式化の方針次第じゃないかな。
1. 自分がグーチョキパーをそれぞれ1/3の確率で出すとする(数値をとりあえず適当に決める)
2. 相手がそれぞれの手を読んだとすると、自分が出すべき手は…
3. 2を何かしらの収束を迎えるまで繰り返す
ならループになる。
1. 自分がグーチョキパーを出す確率をp1, p2, p3とする
2. 相手が自分の手を読んでる確率を…
からスタートすると、繰り返し毎に数式が複雑になって行く。
Re:ループじゃなくて再帰 (スコア:2)
ループと再帰が可換であることは理解してますか?
なんとなーく昔そんなことを聞いたかなとは思ってました。ただ、実際には「相手がこう出てくるはずだから、それに対して……」処理は人の頭ではループ処理にはなってなくて、常に途中の状態も評価しながら最終行でオブジェクトが増えていっていると思うんですよね。その辺が「ループじゃなくて再帰」の含意でした。
人の頭にはメモリがないからオブジェクトを参照する度にコンストラクタも走るし渡されたオブジェクトのコンストラクタも走る、だから計算量が爆発する、みたいな考え方の方が正確だったかな。
Re:ループじゃなくて再帰 (スコア:1)
無い人が多いでしょうね。
ここ日本では、学歴不問でソフトウェアエンジニアとかITエンジニアになれるから。
つい最近現実で実験していたやつだ (スコア:2, 興味深い)
「すべてのプレイヤーが最適行動を取ればトイレットペーパーが売り切れることはない。しかし他のプレイヤは俺様ほど賢くないから買い占めに走るに違いない。と見せかけて…」
Re: (スコア:0)
相場の世界でもよく見る。
こんな糞株買うやつおらへんやろーじゃなくて、イナゴがどう動くかを読まないといけない。
Re: (スコア:0)
為替の世界でもよく見る。
こんな糞国の通貨買うやつおらへんやろーじゃなくて、イナゴがどう動くかを読まないといけない。
Re:つい最近現実で実験していたやつだ (スコア:1)
オフトピだけど、「為替」=「外国為替」前提の言説を見るたび、
いつもお世話になっているのに忘れられがちな内国為替が可哀想になる。
Re:つい最近現実で実験していたやつだ (スコア:1)
そもそもそういう場合の為替=外国為替は2通貨の交換を意味しており、内国為替(≒国内送金)と対比される意味での外国為替(≒国際送金)とは違う意味。
無限ループ (スコア:2)
Eカードのようなルールであれば、
最善手検討が無限ループになるのはルールのうちだろう。
何段階目で検討を打ち切ったか、なんていう話ではなく、
A>B>C>A...のような無限ループになるところまでは、
お互いが大前提として検討・認識した上で、
その後、ループ内の検討段階のどれを採用するか。という話でしかない。
最適解を必ず選択する場合でも、思考の読みあいは無限ループしない (スコア:1)
最適解が存在するなら、最適解を選ぶことがベストであるので、そもそも思考を読む意味はない。
じゃんけんのような、選択に有利不利が存在しない場合であっても、思考を無限に読むと最適解は「相手の誘導をシャットアウトしての完全ランダム勝負」になるだろ。
故に、思考の読みあいはいずれにしても無限ループしないと思うがね……。
しもべは投稿を求める →スッポン放送局がくいつく →バンブラの新作が発売される
いまさらながらの納得感 (スコア:1)
これだけの話でさえロクに内容を理解せずに
見当外れな疑問を呈す輩がこんなに湧くんだから
そりゃ最適解なんて望むべくもないな
単に時間や能力が有限だからじゃないの? (スコア:0)
昔の囲碁や将棋なんかでは何十時間もの大長考なんてものもあったわけで、
単に、考えるのに使える時間や能力が有限だから打ち切るだけじゃないの?
リンク先見ろや (スコア:0)
最適解がわかってるゲームでの実験だ
どちらかというと囚人のジレンマに近い話
Re:リンク先見ろや (スコア:2)
元記事の元記事の実験(平均値の2/3に近いものが勝者)についてなら、
全員が最適解を知っていて最適解を書けるなら全員勝利する、
というジレンマを含まないテストでなので、
読みという話をするなら、
『この形式でテストに参加した人間で、最適解まで考えないヤツがどのくらい混ざるか?』
という話でしかなく、
『考える時間や能力が不足している』で正しいと思うぞ。
Re:リンク先見ろや (スコア:1)
参加人数がある程度限定され、勝者の数が少ないほど報酬が多く、
自分以外の参加者と相談できる、等の条件があれば、
複数人で組んで、平均値を押し上げる役と平均値を書く役になり、報酬を山分けする。
みたいな戦略が発生するかもしれない。
#状況を想像したら福本氏の絵で再現された。
Re:リンク先見ろや (スコア:2)
それを出し抜こうとする奴が現れて賭ケグルイ的展開に。
Re: (スコア:0)
他の人も書いてるけど、リンク先見たほうが良い
元の記事は無限ループしないなんてことは一言も書いてないから
一般的にどれぐらい相手の思考を読めば勝ちやすいかという話
互いに最適解を選んだ結果、将棋なら無限ループ(千日手)はたまにあるし
囲碁なら無限ループしたら駄目(コウ)ってルールで決まってる
(そう決めてないと頻繁に発生する)
とか言う話を知ってたら変な記事にしか見えないよねw
Re:単に時間や能力が有限だからじゃないの? (スコア:2)
囲碁を例に出すとき「駄目」と「劫」は違う。
Re:単に時間や能力が有限だからじゃないの? (スコア:1)
囲碁を例に出すとき「駄目」と「劫」は違う。
その駄目はそっちの駄目じゃねえよ!
駄目まめちしき:囲碁は碁盤の目(領土)を獲得する競技だが、白と黒の領域に空いたどちらの領土でもない目のことを「駄目」という。ここから「価値がない」「してはいけない」という日常語の「駄目」という言葉ができた
Re:単に時間や能力が有限だからじゃないの? (スコア:1)
あなたの言っている「駄目」の事ですが「劫」とは違いますよね。
何言ってんだろう?
Re:単に時間や能力が有限だからじゃないの? (スコア:1)
「劫」などという囲碁用語を知っている人が「駄目」を知らないはずもないのに、わざわざ「駄目(コウ)」という「駄目」と「劫」を同一視するような書き方はいかんだろうというツッコミなんだが。
中途半端にでも囲碁を知っている私ですら「アレ、「劫」は「駄目」じゃないよなぁ」と思うレベルの書き方だ。
最適解を選択するとは限らない、とは? (スコア:0)
ちょっとよく分からない。
最適解を選択しない人間が、この世に存在するという事?
なんで?
Re:最適解を選択するとは限らない、とは? (スコア:2)
①最適解を思いつかないで行動する
②単純にミスをする
③相手が最適解をとらないだろうと判断して行動する
④最適解より自分の好みを重視して行動する
⑤知識が間違っていて、最適解だと思っているものが最適解では無い
⑥そもそも最適解が1つに絞り込めない状況
ぱっと思いつくだけでもこんな可能性は当たり前に存在するかと。
ψアレゲな事を真面目にやることこそアレゲだと思う。
Re: (スコア:0)
> ①最適解を思いつかないで行動する
> ②単純にミスをする
> ③相手が最適解をとらないだろうと判断して行動する
> ⑤知識が間違っていて、最適解だと思っているものが最適解では無い
こんな状況ってあり得るの?
普通に最適解を考えて、ミスなく行動すればよいだけでは?
> ④最適解より自分の好みを重視して行動する
最適解が好みでない、とは?????
やっぱりよく分からない。
Re: (スコア:0)
その人の最適解は「最適解でないこと」なんだよ。
つまり「「最適解でないこと」」でないこと。
いうならば「「「最適解でないこと」」でないこと」でないこと。
したがって「
Re: (スコア:0)
最適解が他人の行動で決まるとしたらどうする?
Re: (スコア:0)
スゲ―な。常にミスなく動けるのか君は
そして、全ての知識を有していて何に対しても最適解で判断できる、と
全知全能かよ
Re: (スコア:0)
➆最適解が時間経過に伴って変化する。(時間軸による部分最適)
➇最適解が地勢的条件に伴って変化する。(空間軸による部分最適)
➈最適解に至る前に収束してしまうもの。(ライフゲームのコロニーのような状態)
➉最適解が存在しない。(スゴロクのようなもの)
Re:最適解を選択するとは限らない、とは? (スコア:2)
じゃんけんをするとしましょう。あなたは勝たなければいけないとします。私が「パーを出します」と言った時、あなたが出すべき手はなんですか?
まあ私は素直にグーを出すんですが、最適解ってなんだと思います?
Re:最適解を選択するとは限らない、とは? (スコア:1)
「パーを出します」という言葉を記録に残して、裁判所に証拠として提出する。
Re: (スコア:0)
チョキ。
あなたが発言通りにパーを出したら勝ち。
あなたが発言を覆して別の手を出したら、「嘘つき」と非難して精神的勝利を得る。
なんなら「チョキを出す」と事前申告してもいい。嘘つかれたときの非難に力が入る。
Re:最適解を選択するとは限らない、とは? (スコア:2)
良い返しが出てこないなーと思っていたんですがまだまだACさんにもプロの方がいらっしゃいますね……!
Re:最適解を選択するとは限らない、とは? (スコア:2)
それは最適な手ですか? 理由はどうしてでしょうか? 最適ではなくなる条件はなんでしょう?
Re:最適解を選択するとは限らない、とは? (スコア:1)
成功体験が忘れられないから、じゃないか。
やっぱり万馬券当てたいんだよ。
Re:最適解を選択するとは限らない、とは? (スコア:1)
最適解しか選択しない人間が、この世に存在すると思っているという事?
なんで?
うじゃうじゃ
Re: (スコア:0)
最適解が人によって違うってのもあるんじゃね?
次の手が最適解ではないそこそこの手であっても、それ以上時間を突っ込んで最適解を探すより
別のことをしてたほうがいい(つまりそのゲームが最重要事項ではない)とか。
なんたら国民投票 (スコア:0)
・最適でないところに価値を見いだす人がいる
・最適解を求める上の評価関数は人によってそれぞれ
・敢えて最適解でない選択をするようにみせかけて相手を混乱させたい
・単なる計算間違い
・最適解なにそれおいしいの?
・単に最適解を追っかけるのが面倒
・息抜きの合間に人生やってるんだから最適解なんてどうでもいいんだよ
・Anonymous Cowardにはわからないものなのだよ
Re: (スコア:0)
理性より感情が優先されるから。
古人曰く (スコア:0)
通らばリーチ、根拠無し !!!(確か出典は「ファントム無頼」)
Re: (スコア:0)
麻雀の場合、牌の種類は、数牌(3*9)と字牌(3+4)の34種類。
天牌の待ち牌は、一番多くて、国士無双13面待ちの13牌、次が九連宝燈の9牌、
普通の多面待ちでは5面待ちくらいまでが多い。
根拠無しで捨てても、ランダムなら当たってしまう確率は13/34≒43%以下で
しかない。
よって、「根拠は俺の不要牌だから」でいいんじゃないか。
そもそもゲーム自体が無限ループになってんの? (スコア:0)
突き詰めれば先手必勝・後手必勝・ループの3パターンになって、必ずしも相手の手を読み切る同士ならループって訳とは限らんだろう。
本当に (スコア:0)
相手の思考を読んでいる(テレパス)同士だとどうなるのだろうか?
Re:本当に (スコア:1)
相手を脅迫したり、取引をしたり、精神を傷つけるような思考をしたり、場外戦?になりそう。
Re: (スコア:0)
性格の悪い方が勝つ。
本人しか理解できないような複雑な条件分岐が見えたところでどこまで正確に処理をトレースできるか?
「こんなところにgoto置くんじゃねぇ!!」
Re: (スコア:0)
「こ、こいつ何も考えていねー!」
心理戦って (スコア:0)
言葉や行動でもって相手の動揺を誘ってミスさせるもんじゃないの?