サンプルを抜き出すのではなく、「解空間」を狭めるのよ。
極端な話、「攻撃しかしない」か「回避しかしない」の2択しか答えを用意せず、
どっちが最適かという問題を解かせるなら速く答えが出せるでしょ?
まぁそれじゃつまらないから、実際には中間的なのとか、変な行動とかいれてみたり、いくつかの行動をつなげたりとかして。
現時点で得られてる情報、場合によっては直近の数プレイ分の情報とかを用いて最適化を行う。
「即時性の高いメタヒューリスティクス手法」ってのは
現在までに得られている情報を用いて振舞いを動的に最適化するような処理の事だと思うが、
日本語だと「適応」、英語だと「adaptive」っていう。
「適応処理」とか「Adaptive Algorithm」とか。
0そうだね プレイ済み