myu314さん情報ありがとうございます。256bitというのは気づきませんでした。 armは詳しくないですが、256bit単位だと速度的に何かいいことあるのですか? 8bit境界でも256bitアクセスできるのも不思議な感じ。 copy a,1,a,0,n 命令の内部処理は 1 引数の個数で分岐(これはもしかしたらコンパイル時に決定してるかも) 2 引数1と引数3が同じ型の配列変数であることを確認 3 その型(文字列か数値か)によって分岐 4 コピー元アドレスとコピー先アドレスを決定 5 floor(総bit数/256)回コピー(256bit単位) 6 (総bit数 mod 256)/8回コピー(8bit単位) ここで 4 あたりで重なり判定をすればいいだけと思いますが、速度に対するインパクトはそんなに大きいですか?