ゲーム攻略メモ

RTAやその他ゲームについてのメモ。

佐藤問題問題、あるいは期待値について

かもリバー氏がまた面白い記事を書いていた。

エントロピーで考える 2531年佐藤さん問題問題

xcloche.hateblo.jp

結びの説明が気になった(コメントでも指摘があったようで修正されている)。

「一度0人になった名字は復活しない」は、より一般化すると「世代が更新すると、苗字が満遍ない状態(エントロピー大)からだんだん一極集中(エントロピー小)の状態に移行していく」ということだったわけである。

苗字復活不能はドレインの存在という確率過程の設定について、エントロピーの変化はあるミクロな過程の性質についての話であり、独立した概念であるはずだ。これは実際、一般化になっているのだろうか?

エントロピーの議論において、ドレイン(破産・滅亡・絶滅)の存在は仮定されていない。つまり、ドレインが存在しなくても使える議論のはずである。ここで、モデルに「苗字が滅亡することがない」という条件(苗字絶滅防止法)を付加して、ドレインを無くしてみる。たとえば、苗字$s$の人口$n_{s} = 1$の場合は世代更新のときに必ずその苗字が選択されて残る、みたいな条件である。この例はドレインの寄与とエントロピーの寄与を区別できるはずだ。

(予想)

  • $n_s=1,2$あるいは$n_s = N-1, N-2$あたりが安定点になる
  • 逆転は常にありうる
    • →可逆過程?
    • ドレインありだと不可逆過程っぽい?

熱力学との比較(エントロピーエントロピーの期待値)

この節は太字だけ読めばいい

熱力学の孤立系には不可逆な過程が存在し、その不可逆さはエントロピー(厳密には情報エントロピーとは異なる概念なので、区別したい場合はそれぞれを熱力学的エントロピー、情報エントロピーと呼ぶ(とはいえ実際にどれくらい違うのか、というのは微妙な問題で、フォンノイマンエントロピーみたいなものを考えると区別がつかなくなってくる。非平衡統計力学みたいな教科書を読むといいのかもしれない)))によって特徴付けられる。これは熱力学第二法則の一つの表現として知られている。

(熱力学の範囲、かつ、妥当な仮定の下で)熱力学的エントロピーが増大することはない。これはもう絶対にない。どの一部分の過程を取り出してみても、必ず熱力学的エントロピーが増大している(少なくとも、増分が0以上である)。一方で、佐藤問題問題モデルでは、たくさんの過程を繰り返せば傾向として情報エントロピーが減少しているとはいえ、一部分に注目すれば情報エントロピーが増大する過程を取り出すことができる(少数の苗字が増大している過程を取ればよい)。

これはdeterministicな過程とstochasticな過程の違いであると思われる(要は確率過程とその対義語なのだが、対義語が分かんなかったから英語使ったんだよね。もののpdfでは決定論的/確率論的の語を用いているね。あと、本筋と関係ないが、熱力学がdeterministicな過程をモデルに使っているからと言って、熱力学が説明する現実の現象がマジでdeterministicだ、ということにはならない(というか、この文も変で、そもそもdeterministicとかはモデルの性質であって、現実の性質ではない)。熱力学に限らず、物理学は適用範囲と近似の学問である)。つまり、熱力学でのエントロピーは必ず単調に変化(単調増加)するが、佐藤問題問題モデルでのエントロピーは期待値として単調に変化(単調減少)する

両者を統一して扱ってみたいわけだが、熱力学の不可逆性、というか可逆性に対応する概念?として、確率過程の一部においては再帰性という概念がある。これを使って議論を進めてみよう。

確率過程の再帰性

再帰性の説明はしない(自分が理解していないため)。3次元ランダムウォークの例を考えると分かりやすいんじゃないでしょうか。

再帰性の概念を使えばドレインあり/なしのモデルを区別することができる。具体的には

  • ドレインあり佐藤問題問題モデル→再帰性なし
  • ドレインなし佐藤問題問題モデル→再帰性あり

ということになる。

再帰性がないというのは不可逆過程とほぼ同じようにみなせる(と思ったが、怪しいかもしれない)。少なくとも、ドレインあり佐藤問題問題モデルでは、苗字の絶滅状態でラベル付けした頂点とその間の適切な遷移を有向辺で表現したグラフを考えて(これはDAGになる、DAGというのも考えてみれば不可逆性の表現の一つやね)、再帰性の議論からいずれかの遷移(=絶滅)が発生する(確率が1な)ので、大体不可逆過程みたいなものである。 したがって、ドレインあり佐藤問題問題モデルで苗字の統一が起こるのは決定論的過程の議論を流用して説明できる。

ドレインなし佐藤問題問題モデルは1次元ランダムウォークと同じような挙動になる(一つの苗字に注目して、俺 or 俺以外、という二分をすればよい)。1次元ランダムウォークには再帰性があるから、このモデルでも再帰性がある→ありそう→ドレインなし&有限離散という制約を考えれば再帰性がある。

再帰性があるということは、ある頂点、あるいは部分グラフに固定/トラップされることがないということだ。当たり前か。ドレインなし佐藤問題問題モデルではその苗字最後の1人になっても全然逆転可能であり、(再帰性の観点から言えば)実際に逆転が起こる。

ドレインなし佐藤問題問題モデルを扱ったのは、「エントロピー変化の期待値が負」という性質について調べるためである。そして今、再帰性の概念を使ってこのモデルでは苗字多数派の逆転が起こることを見た。「エントロピー変化の期待値が負」という性質は、ある苗字多数派の固定とは関係がないのだろうか?

再帰性において無視された時間

面倒になってきたので投げるが、再帰性は無限時間待ってもいいので、必要な試行回数の多寡がほとんど無視される。再帰性があるとはいえ、おそらく1人/少数派から多数派に変わるための必要時間はマジで長く(この長さとエントロピー変化の期待値が負であることが関係する)、それは一種の固定と見ることができる。その意味でやはり、エントロピー変化の期待値が負であるというのは状況を偏在に固定化させるのではないでしょうか(どう効くかは知らんです。でも任意停止定理ってそういうことでは? でも絶滅防止法があるのでだんだん初期の情報を忘れるかもしれない)。

でもややこしいよね。期待値の性質から負のエントロピー変化(苗字多寡固定化)が実現するには時間が長い方がよい。でも、マジで時間が長ければ再帰性が顔を出して、苗字多寡逆転、ということになるので。結局時間についてはどうなるんや?

というか、期待値って実現するのか? それって標本平均みたいな統計量が期待値になるのか、みたいな話ですか? つまり確率収束とかそこらへんの議論になる? たとえばコーシー分布を使った確率過程なら期待値っぽいものが実現することは期待できない(この文はややこしい)。

気持ち・雑多なこと

整理をあきらめたので適当に書き散らかす。

期待値から考える賭けの戦略って、一般的には

  1. 期待値を正にする
  2. 期待値を実現する

の2つのプロセスを踏むっぽい。2つ目って盲点だなあ、と思う。期待値が負で破産がある賭け(これは人生のモデルとして良い近似である)についての面白い記事がどこかにあった気がして、そこにはだいたい「期待値が負なら試行回数を少なく、期待値が正なら試行回数を大きくする戦略が良い」という話が書いてあったと思う。期待値の実現について今回の例でいえば、

  • ある苗字の人口変化の期待値が0であること vs. ある苗字の人口変化が0であること
  • エントロピー変化の期待値が負である vs. エントロピー変化が負である

などの差異が面白いんじゃないでしょうか。期待値ってただの和/積分で、その機能的意味は使う人が頑張って与えなきゃいけないよね。

あと、途中で「もののpdf」などと軽い扱いをしてしまったが、これは決定論的・確率論的モデルの説明そのものであり、今回の話と大体同じことを議論している。こういうのを読むと得られるものもあるんじゃないでしょうか。たとえば最後のスライドにある人口学的確率性とか、そのものじゃないですか? また、最後の1つ前のスライド、シミュレーション例を見ると、いろいろ示唆があり、たとえば時間の長さについても気持ちが分かりそうな気がする。ある程度の期間であれば、この図に写っている領域のように、状況の固定化に向かい(~50step)、実際に固定されるんだろう(50~200step)。しかし、時間をありえん長くすれば(実際いくつかの黒い線が下側に突き出しているように)絶対に絶滅するんじゃないだろうか(ちゃんと議論したければこのモデルの再帰性を検討してください)。相転移っぽい挙動じゃないですか? 時間の長さが状況の固定・逆転のどちらに寄与するかはこういうフワッとした観測で締めたいと思う。式を見ていて思ったが、もしかして今までの議論は筋悪で、平均と分散の影響を比べる(ファットテールが云々)って話だったかもしれない。でももう随分書いてしまった。

あと、相転移についてもちゃんと書くつもりだったが力尽きてしまった。これを先に書くべきだった。金融市場のモデルみたいなファットテールの分布で云々が云々して相転移が云々する。今朝そういう夢を見た。見ました。

あと、この記事の説明には欺瞞があった。ドレインなし佐藤問題問題モデルは、少数苗字が最後の1人になっちゃった瀬戸際の次の過程のとき、かつそのときに限り、エントロピー変化が必ず正になる(当然だが、エントロピー変化の期待値も正になる)。したがって、ドレインなし佐藤問題問題モデルがエントロピー変化の期待値が負のモデル、と主張するのは正しくない。この境界的な過程を除けばエントロピー変化の期待値が負、と言うのが正しい。 言い訳しておくと、この違いはあまり問題ではないはずだ。というのも、エントロピー変化の期待値の議論から全体的には少数苗字の人口1人⇆2人の部分グラフに向かう、とは主張できて、部分グラフの中で1人か2人かというのは問題の主眼とはあまり関係ないから。

あと、熱力学の節はマジで不要だった。

以上。