AMDGPU: Fix scratch wave offset relative FI expansion

The offset may not be an inline immediate, so this needs to be materialized into a register. The post-RA run of SIShrinkInstructions is able to fold it later if it can. llvm-svn: 305761
author: Matt Arsenault <Matthew.Arsenault@amd.com> 2017-06-19 23:47:21 +0000
committer: Matt Arsenault <Matthew.Arsenault@amd.com> 2017-06-19 23:47:21 +0000
commit: c595185f8fc85e331afda990b99bc8d6ffc85bca (patch)
tree: 9d31975fb9f4621f12c1b72644f94262f7a11f4b /llvm/lib/Target/AMDGPU/SIRegisterInfo.cpp
parent: f292a2feca7165eb94cc6b6775a87e3c2c32422e (diff)
download: bcm5719-llvm-c595185f8fc85e331afda990b99bc8d6ffc85bca.tar.gz
bcm5719-llvm-c595185f8fc85e331afda990b99bc8d6ffc85bca.zip
1 files changed, 20 insertions, 9 deletions
diff --git a/llvm/lib/Target/AMDGPU/SIRegisterInfo.cpp b/llvm/lib/Target/AMDGPU/SIRegisterInfo.cpp
index b611f28fcab..9018e3882d9 100644
--- a/llvm/lib/Target/AMDGPU/SIRegisterInfo.cpp
+++ b/llvm/lib/Target/AMDGPU/SIRegisterInfo.cpp
@@ -1044,18 +1044,29 @@ void SIRegisterInfo::eliminateFrameIndex(MachineBasicBlock::iterator MI,
           unsigned CarryOut
             = MRI.createVirtualRegister(&AMDGPU::SReg_64_XEXECRegClass);
           unsigned ScaledReg
-            = MRI.createVirtualRegister(&AMDGPU::SReg_32_XM0RegClass);
+            = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);
 
-          // XXX - Should this use a vector shift?
-          BuildMI(*MBB, MI, DL, TII->get(AMDGPU::S_LSHR_B32), ScaledReg)
-            .addReg(DiffReg, RegState::Kill)
-            .addImm(Log2_32(ST.getWavefrontSize()));
+          BuildMI(*MBB, MI, DL, TII->get(AMDGPU::V_LSHRREV_B32_e64), ScaledReg)
+            .addImm(Log2_32(ST.getWavefrontSize()))
+            .addReg(DiffReg, RegState::Kill);
 
           // TODO: Fold if use instruction is another add of a constant.
-          BuildMI(*MBB, MI, DL, TII->get(AMDGPU::V_ADD_I32_e64), ResultReg)
-            .addReg(CarryOut, RegState::Define | RegState::Dead)
-            .addImm(Offset)
-            .addReg(ScaledReg, RegState::Kill);
+          if (AMDGPU::isInlinableLiteral32(Offset, ST.hasInv2PiInlineImm())) {
+            BuildMI(*MBB, MI, DL, TII->get(AMDGPU::V_ADD_I32_e64), ResultReg)
+              .addReg(CarryOut, RegState::Define | RegState::Dead)
+              .addImm(Offset)
+              .addReg(ScaledReg, RegState::Kill);
+          } else {
+            unsigned ConstOffsetReg
+              = MRI.createVirtualRegister(&AMDGPU::SReg_32_XM0RegClass);
+
+            BuildMI(*MBB, MI, DL, TII->get(AMDGPU::S_MOV_B32), ConstOffsetReg)
+              .addImm(Offset);
+            BuildMI(*MBB, MI, DL, TII->get(AMDGPU::V_ADD_I32_e64), ResultReg)
+              .addReg(CarryOut, RegState::Define | RegState::Dead)
+              .addReg(ConstOffsetReg, RegState::Kill)
+              .addReg(ScaledReg, RegState::Kill);
+          }
 
           MRI.setRegAllocationHint(CarryOut, 0, AMDGPU::VCC);
         }
author	Matt Arsenault <Matthew.Arsenault@amd.com>	2017-06-19 23:47:21 +0000
committer	Matt Arsenault <Matthew.Arsenault@amd.com>	2017-06-19 23:47:21 +0000
commit	c595185f8fc85e331afda990b99bc8d6ffc85bca (patch)
tree	9d31975fb9f4621f12c1b72644f94262f7a11f4b /llvm/lib/Target/AMDGPU/SIRegisterInfo.cpp
parent	f292a2feca7165eb94cc6b6775a87e3c2c32422e (diff)
download	bcm5719-llvm-c595185f8fc85e331afda990b99bc8d6ffc85bca.tar.gz bcm5719-llvm-c595185f8fc85e331afda990b99bc8d6ffc85bca.zip