僕もARM全然知らないんですけども、ベクトル化されたらそんなものかなーぐらいの気持ちで前のコメントしました。
32bit境界が期待できない文字列の場合で処理が違ってるようなので、まあ最適化による仕様だろうなと。
速度のインパクトですけど、どれくらい差があるかはわかりませんが、プチコンから使うことを考えるとまず無いでしょうね。
参考程度にnewlibっていう組み込み向けのライブラリのソース眺めてみましたが、memmoveとmemcpyの差は重複チェックして場合によっては逆からコピーに変えてるだけでした。
同じことをプチコン側もやってくれれば、恐らくみんな幸せな気がします。
前のコメントの「パフォーマンスに影響でますし」は迂闊でした、撤回させていただきます:)
0そうだね プレイ済み