[X86][AVX512] Add support for VPERMILPS v16f32 shuffle lowering (PR34382)

Avoid use of VPERMPS where we don't need it by instead using the variable mask version of VPERMILPS for unary shuffles. llvm-svn: 312486
author: Simon Pilgrim <llvm-dev@redking.me.uk> 2017-09-04 13:51:57 +0000
committer: Simon Pilgrim <llvm-dev@redking.me.uk> 2017-09-04 13:51:57 +0000
commit: 91751b42f639f6419acbf493895078e0b3b13d7f (patch)
tree: f6f7c7d488f1c6dace70244f3a2ba6bc43d51824 /llvm/lib/Target
parent: adffa8b2e96c0e59551f486b6bfe0d70aaaeda45 (diff)
download: bcm5719-llvm-91751b42f639f6419acbf493895078e0b3b13d7f.tar.gz
bcm5719-llvm-91751b42f639f6419acbf493895078e0b3b13d7f.zip
1 files changed, 9 insertions, 0 deletions
diff --git a/llvm/lib/Target/X86/X86ISelLowering.cpp b/llvm/lib/Target/X86/X86ISelLowering.cpp
index 80f1afe310f..023e539250c 100644
--- a/llvm/lib/Target/X86/X86ISelLowering.cpp
+++ b/llvm/lib/Target/X86/X86ISelLowering.cpp
@@ -13452,6 +13452,15 @@ static SDValue lowerV16F32VectorShuffle(const SDLoc &DL, ArrayRef<int> Mask,
     // Otherwise, fall back to a SHUFPS sequence.
     return lowerVectorShuffleWithSHUFPS(DL, MVT::v16f32, RepeatedMask, V1, V2, DAG);
   }
+
+  // If we have a single input shuffle with different shuffle patterns in the
+  // 128-bit lanes and don't lane cross, use variable mask VPERMILPS.
+  if (V2.isUndef() &&
+      !is128BitLaneCrossingShuffleMask(MVT::v16f32, Mask)) {
+    SDValue VPermMask = getConstVector(Mask, MVT::v16i32, DAG, DL, true);
+    return DAG.getNode(X86ISD::VPERMILPV, DL, MVT::v16f32, V1, VPermMask);
+  }
+
   // If we have AVX512F support, we can use VEXPAND.
   if (SDValue V = lowerVectorShuffleToEXPAND(DL, MVT::v16f32, Zeroable, Mask,
                                              V1, V2, DAG, Subtarget))
author	Simon Pilgrim <llvm-dev@redking.me.uk>	2017-09-04 13:51:57 +0000
committer	Simon Pilgrim <llvm-dev@redking.me.uk>	2017-09-04 13:51:57 +0000
commit	91751b42f639f6419acbf493895078e0b3b13d7f (patch)
tree	f6f7c7d488f1c6dace70244f3a2ba6bc43d51824 /llvm/lib/Target
parent	adffa8b2e96c0e59551f486b6bfe0d70aaaeda45 (diff)
download	bcm5719-llvm-91751b42f639f6419acbf493895078e0b3b13d7f.tar.gz bcm5719-llvm-91751b42f639f6419acbf493895078e0b3b13d7f.zip