こうさんの投稿

メジャーでないっていうか。その即時性って、普通に「現在より過去のデータ」いれて「逐次学習」させることと全く同値なので。どんなゲームなのかいまいちよくわからないけど、2D追いかけっこ程度でもきちんとやるとプチコンでリアルタイムでやるのは計算量的に無理だね。ノーフリーランチ定理が示す通り、問題を絞るしかない。例えば、「敵機をひたすら追いかける」「横から狙う」「ひたすら逃げる」「ランダム歩行」等の行動パターンを用意しておいて、その行動割合だけを学習させるとかね。「追いかける」割合の高い僚機が落とされたらその割合を下げる、みたいな。

0そうだね

プレイ済み

2017/11/03 17:59:27に取得

プチコン3号 SmileBASIC コミュニティ

返信[7]

親投稿

こう subwars

2016/8/10 1:57

まだ組んだ訳ではないので想定・自機以外の全ての機体は大まかな行動ルーチンに則り動く・敵機は攻撃、回避、戦局判断、etc...を高い頻度で交叉、淘汰、変異させる・陣営の全滅等で勝敗を決めるこの際精度はある程度でいいから遺伝アルゴリズム等より早く解に近い数値を出したいってだけです早いかどうか確かめるためにも戦局がコロコロ変わるRTSとSTGの間の子を舞台にしようと。

0そうだね

プレイ済み

2017/11/03 17:59:27に取得

プチコン3号 SmileBASIC コミュニティ

返信[8]

親投稿

れい rei-nntnd

2016/8/10 11:05

いやだから、どんな手法で解を求めても、平均したら収束速度は同じなんだって。遺伝的アルゴリズムより速くとかは、ない。速くするには問題を制限するしかない。

0そうだね

プレイ済み

2017/11/03 17:59:27に取得

プチコン3号 SmileBASIC コミュニティ

返信[9]

親投稿

こう subwars

2016/8/10 11:43

問題は項目を絞るなりで制限してますよ収束速度を求めるのなら仰る通りサンプル取って交叉したほうが良いですただ、それだけの試合数を人間がこなせるでしょうか？仮にこなせたとしてプレイヤーが変わった時、進化の方向は変えられるでしょうか？自分でもわかりませんがもしかしたら速度というよりは柔軟性を求めているのかもしれません

0そうだね

プレイ済み

2017/11/03 17:59:27に取得

プチコン3号 SmileBASIC コミュニティ

返信[10]

親投稿

こう subwars

2016/8/10 11:45

なんにせよ夏休みもありますしお客が居る訳でもないのでやりたいようにやりますよ

0そうだね

プレイ済み

2017/11/03 17:59:27に取得

プチコン3号 SmileBASIC コミュニティ

返信[11]

親投稿

れい rei-nntnd

2016/8/11 1:50

サンプルを抜き出すのではなく、「解空間」を狭めるのよ。極端な話、「攻撃しかしない」か「回避しかしない」の2択しか答えを用意せず、どっちが最適かという問題を解かせるなら速く答えが出せるでしょ？まぁそれじゃつまらないから、実際には中間的なのとか、変な行動とかいれてみたり、いくつかの行動をつなげたりとかして。現時点で得られてる情報、場合によっては直近の数プレイ分の情報とかを用いて最適化を行う。「即時性の高いメタヒューリスティクス手法」ってのは現在までに得られている情報を用いて振舞いを動的に最適化するような処理の事だと思うが、日本語だと「適応」、英語だと「adaptive」っていう。「適応処理」とか「Adaptive Algorithm」とか。

0そうだね

プレイ済み

2017/11/03 17:59:27に取得

プチコン3号 SmileBASIC コミュニティ

返信[12]

親投稿

こう subwars

2016/8/13 22:09

適応なら自分のイメージしてるものと近い気がします項目・回避角度(回避成功率で判断) ・攻撃ルーチン(攻撃前後の戦力比で判断) ・攻撃タイミング (戦力比と成功率を評価して判断)

0そうだね

プレイ済み

2017/11/03 17:59:27に取得