メジャーでないっていうか。 その即時性って、普通に「現在より過去のデータ」いれて「逐次学習」させることと全く同値なので。 どんなゲームなのかいまいちよくわからないけど、2D追いかけっこ程度でもきちんとやるとプチコンでリアルタイムでやるのは計算量的に無理だね。 ノーフリーランチ定理が示す通り、問題を絞るしかない。 例えば、「敵機をひたすら追いかける」「横から狙う」「ひたすら逃げる」「ランダム歩行」等の行動パターンを用意しておいて、 その行動割合だけを学習させるとかね。 「追いかける」割合の高い僚機が落とされたらその割合を下げる、みたいな。