AVX512ならありますが、AVX2まではありません。AVX2では、速い代替手段がありますが、AVX以下なら、その手段も使えないので、いくつかの命令をシリーズで使うことになります。AVXで、折角VmaskLoad命令を備えたのにoperandが、__m128しかないおかげで余計なインストラクションを使わないといけません。(総じて、AVXのアーキテクチャは、急ごしらえの感が否めません。)そこで、FirstOrderサポート(超大なインスタンス対応、例えば、6ヶ月100人スタッフ)は、AVX2以降(2013年発売のHaswellアーキテクチャ以降)とすることにしました。机上計算では、これでEigenに対して、同じスレッド数下で、4倍以上のゲインを有するはずです。
0 件のコメント:
コメントを投稿