[ARM] Split 128-bit vectors in BUILD_VECTOR lowering

Given that INSERT_VECTOR_ELT operates on D registers anyway, combining 64-bit vectors into a 128-bit vector is basically free. Therefore, try to split BUILD_VECTOR nodes before giving up and lowering them to a series of INSERT_VECTOR_ELT instructions. Sometimes this allows dramatically better lowerings; see testcases for examples. Inspired by similar code in the x86 backend for AVX. Differential Revision: https://reviews.llvm.org/D27624 llvm-svn: 289706
author: Eli Friedman <efriedma@codeaurora.org> 2016-12-14 20:44:38 +0000
committer: Eli Friedman <efriedma@codeaurora.org> 2016-12-14 20:44:38 +0000
commit: cbed30c5012b9b52a495dadc94f14ea54f1b5b10 (patch)
tree: 8df8e1f2f28f11f7865edfb9cd0513a023651362 /llvm/lib/Target/ARM/ARMISelLowering.cpp
parent: 53816d074d928b3a39b6c07aabe43b419e9cc980 (diff)
download: bcm5719-llvm-cbed30c5012b9b52a495dadc94f14ea54f1b5b10.tar.gz
bcm5719-llvm-cbed30c5012b9b52a495dadc94f14ea54f1b5b10.zip
1 files changed, 21 insertions, 0 deletions
diff --git a/llvm/lib/Target/ARM/ARMISelLowering.cpp b/llvm/lib/Target/ARM/ARMISelLowering.cpp
index 57beb422f7d..3ddb66e6721 100644
--- a/llvm/lib/Target/ARM/ARMISelLowering.cpp
+++ b/llvm/lib/Target/ARM/ARMISelLowering.cpp
@@ -6053,6 +6053,9 @@ SDValue ARMTargetLowering::LowerBUILD_VECTOR(SDValue Op, SelectionDAG &DAG,
   unsigned SplatBitSize;
   bool HasAnyUndefs;
   if (BVN->isConstantSplat(SplatBits, SplatUndef, SplatBitSize, HasAnyUndefs)) {
+    if (SplatUndef.isAllOnesValue())
+      return DAG.getUNDEF(VT);
+
     if (SplatBitSize <= 64) {
       // Check if an immediate VMOV works.
       EVT VmovVT;
@@ -6214,6 +6217,24 @@ SDValue ARMTargetLowering::LowerBUILD_VECTOR(SDValue Op, SelectionDAG &DAG,
       return shuffle;
   }
 
+  if (VT.is128BitVector() && VT != MVT::v2f64 && VT != MVT::v4f32) {
+    // If we haven't found an efficient lowering, try splitting a 128-bit vector
+    // into two 64-bit vectors; we might discover a better way to lower it.
+    SmallVector<SDValue, 64> Ops(Op->op_begin(), Op->op_begin() + NumElts);
+    EVT ExtVT = VT.getVectorElementType();
+    EVT HVT = EVT::getVectorVT(*DAG.getContext(), ExtVT, NumElts / 2);
+    SDValue Lower =
+        DAG.getBuildVector(HVT, dl, makeArrayRef(&Ops[0], NumElts / 2));
+    if (Lower.getOpcode() == ISD::BUILD_VECTOR)
+      Lower = LowerBUILD_VECTOR(Lower, DAG, ST);
+    SDValue Upper = DAG.getBuildVector(
+        HVT, dl, makeArrayRef(&Ops[NumElts / 2], NumElts / 2));
+    if (Upper.getOpcode() == ISD::BUILD_VECTOR)
+      Upper = LowerBUILD_VECTOR(Upper, DAG, ST);
+    if (Lower && Upper)
+      return DAG.getNode(ISD::CONCAT_VECTORS, dl, VT, Lower, Upper);
+  }
+
   // Vectors with 32- or 64-bit elements can be built by directly assigning
   // the subregisters.  Lower it to an ARMISD::BUILD_VECTOR so the operands
   // will be legalized.
author	Eli Friedman <efriedma@codeaurora.org>	2016-12-14 20:44:38 +0000
committer	Eli Friedman <efriedma@codeaurora.org>	2016-12-14 20:44:38 +0000
commit	cbed30c5012b9b52a495dadc94f14ea54f1b5b10 (patch)
tree	8df8e1f2f28f11f7865edfb9cd0513a023651362 /llvm/lib/Target/ARM/ARMISelLowering.cpp
parent	53816d074d928b3a39b6c07aabe43b419e9cc980 (diff)
download	bcm5719-llvm-cbed30c5012b9b52a495dadc94f14ea54f1b5b10.tar.gz bcm5719-llvm-cbed30c5012b9b52a495dadc94f14ea54f1b5b10.zip