結論から言うと殆ど変わりませんでした。
下が実行中の様子です。Solver2がSIMD化していないアンローリングコード、Solver3がSIMD化しているコードです。8weeksのインスタンスで50万ノード程度の規模になります。どちらも1ms程度で増減していますが、ほぼ同じ結果となりました。
恐らくは、データが不揃いであり、データフェッチの部分で律速しているのだと思います。
0 件のコメント:
コメントを投稿