GlobalISel: Lower scalarizing unmerge of a vector to shifts

AMDGPU sometimes has legal s16 and <2 x s16> operations, but all registers are really 32-bit. An unmerge destination really should ben widened to a 32-bit register. If widening a scalarizing vector with a target size that matches the vector size, bitcast to integer and extract the relevant bits with shifts. I'm not sure if this is the right place for this. This could arguably be part of widenScalar for the result. I also have a growing feeling that we're missing a bitcast legalize action. llvm-svn: 367604
author: Matt Arsenault <Matthew.Arsenault@amd.com> 2019-08-01 19:10:05 +0000
committer: Matt Arsenault <Matthew.Arsenault@amd.com> 2019-08-01 19:10:05 +0000
commit: d9d30a408e7ec9b1c201046ee887ff055ea50bb1 (patch)
tree: 5d39f9e00f6e22b0ab4d4c503338f440f4b32830 /llvm/lib/CodeGen
parent: e0dfce072399e54f100ce73347ca66ca757ebefa (diff)
download: bcm5719-llvm-d9d30a408e7ec9b1c201046ee887ff055ea50bb1.tar.gz
bcm5719-llvm-d9d30a408e7ec9b1c201046ee887ff055ea50bb1.zip
1 files changed, 35 insertions, 0 deletions
diff --git a/llvm/lib/CodeGen/GlobalISel/LegalizerHelper.cpp b/llvm/lib/CodeGen/GlobalISel/LegalizerHelper.cpp
index 78bc5f49d0a..53374b0cde1 100644
--- a/llvm/lib/CodeGen/GlobalISel/LegalizerHelper.cpp
+++ b/llvm/lib/CodeGen/GlobalISel/LegalizerHelper.cpp
@@ -1878,6 +1878,8 @@ LegalizerHelper::lower(MachineInstr &MI, unsigned TypeIdx, LLT Ty) {
   case G_FMINNUM:
   case G_FMAXNUM:
     return lowerFMinNumMaxNum(MI);
+  case G_UNMERGE_VALUES:
+    return lowerUnmergeValues(MI);
   }
 }
 
@@ -3500,3 +3502,36 @@ LegalizerHelper::lowerFMinNumMaxNum(MachineInstr &MI) {
   MI.eraseFromParent();
   return Legalized;
 }
+
+LegalizerHelper::LegalizeResult
+LegalizerHelper::lowerUnmergeValues(MachineInstr &MI) {
+  const unsigned NumDst = MI.getNumOperands() - 1;
+  const Register SrcReg = MI.getOperand(NumDst).getReg();
+  LLT SrcTy = MRI.getType(SrcReg);
+
+  Register Dst0Reg = MI.getOperand(0).getReg();
+  LLT DstTy = MRI.getType(Dst0Reg);
+
+
+  // Expand scalarizing unmerge as bitcast to integer and shift.
+  if (!DstTy.isVector() && SrcTy.isVector() &&
+      SrcTy.getElementType() == DstTy) {
+    LLT IntTy = LLT::scalar(SrcTy.getSizeInBits());
+    Register Cast = MIRBuilder.buildBitcast(IntTy, SrcReg).getReg(0);
+
+    MIRBuilder.buildTrunc(Dst0Reg, Cast);
+
+    const unsigned DstSize = DstTy.getSizeInBits();
+    unsigned Offset = DstSize;
+    for (unsigned I = 1; I != NumDst; ++I, Offset += DstSize) {
+      auto ShiftAmt = MIRBuilder.buildConstant(IntTy, Offset);
+      auto Shift = MIRBuilder.buildLShr(IntTy, Cast, ShiftAmt);
+      MIRBuilder.buildTrunc(MI.getOperand(I), Shift);
+    }
+
+    MI.eraseFromParent();
+    return Legalized;
+  }
+
+  return UnableToLegalize;
+}
author	Matt Arsenault <Matthew.Arsenault@amd.com>	2019-08-01 19:10:05 +0000
committer	Matt Arsenault <Matthew.Arsenault@amd.com>	2019-08-01 19:10:05 +0000
commit	d9d30a408e7ec9b1c201046ee887ff055ea50bb1 (patch)
tree	5d39f9e00f6e22b0ab4d4c503338f440f4b32830 /llvm/lib/CodeGen
parent	e0dfce072399e54f100ce73347ca66ca757ebefa (diff)
download	bcm5719-llvm-d9d30a408e7ec9b1c201046ee887ff055ea50bb1.tar.gz bcm5719-llvm-d9d30a408e7ec9b1c201046ee887ff055ea50bb1.zip