もう一丁。では配列関係はどうだろう?ということで、これも調べてみました(BIGで)。
COPYやFILLは大差ないけど、ARYOPでは物凄い差です^^;
配列サイズは画像に合わせて1024×1024を何分割するかで計測しました。ARYOPでは256分割か4096分割が一番速そうでした。もう命令呼び出しのオーバーヘッドがどうとか気にしてる場合じゃないくらい、速度が全然違いますね。
BIGの傾向としては、画像/配列ともに64×64サイズ(256分割)毎に処理するのが一番速そうですが、大抵の場合ループ中には画像/配列以外の処理も入っていると思うので、それも考慮するなら128×128(64分割)くらいが効率的かな。
ウソみたいな結果で自分でもまだ信じられないくらいなので、何方かでも確認して頂けるとありがたいです。