2024年7月11日木曜日

SIMD化の結果

 結論から言うと殆ど変わりませんでした。

下が実行中の様子です。Solver2がSIMD化していないアンローリングコード、Solver3がSIMD化しているコードです。8weeksのインスタンスで50万ノード程度の規模になります。どちらも1ms程度で増減していますが、ほぼ同じ結果となりました。

恐らくは、データが不揃いであり、データフェッチの部分で律速しているのだと思います。


AVX2という最近のPCでは、ごく当たり前の機能ですが、それでもSIMD化は、CPUを選ぶので同じ程度であれば、SIMDなしとした方が汎用性のある設計となります。



0 件のコメント:

コメントを投稿