[X86] Allow load folding into PUSH instructions

Adds pushes to the folding tables. This also required a fix to the TD definition, since the memory forms of the push instructions did not have the right mayLoad/mayStore flags. Differential Revision: http://reviews.llvm.org/D11340 llvm-svn: 243010
author: Michael Kuperstein <michael.m.kuperstein@intel.com> 2015-07-23 12:23:45 +0000
committer: Michael Kuperstein <michael.m.kuperstein@intel.com> 2015-07-23 12:23:45 +0000
commit: 454d14539597986d2cf4a50dbebf894081392f04 (patch)
tree: 971d3932c03aced4d388d7a2e117cdcbfeee6d4e /llvm/lib/Target/X86/X86InstrInfo.cpp
parent: f6a58b6dff6dc0d585d6ab08c2abd0a309ea4aea (diff)
download: bcm5719-llvm-454d14539597986d2cf4a50dbebf894081392f04.tar.gz
bcm5719-llvm-454d14539597986d2cf4a50dbebf894081392f04.zip
1 files changed, 11 insertions, 4 deletions
diff --git a/llvm/lib/Target/X86/X86InstrInfo.cpp b/llvm/lib/Target/X86/X86InstrInfo.cpp
index 3fdbac79814..65df840a935 100644
--- a/llvm/lib/Target/X86/X86InstrInfo.cpp
+++ b/llvm/lib/Target/X86/X86InstrInfo.cpp
@@ -332,6 +332,9 @@ X86InstrInfo::X86InstrInfo(X86Subtarget &STI)
     { X86::MUL8r,       X86::MUL8m,         TB_FOLDED_LOAD },
     { X86::PEXTRDrr,    X86::PEXTRDmr,      TB_FOLDED_STORE },
     { X86::PEXTRQrr,    X86::PEXTRQmr,      TB_FOLDED_STORE },
+    { X86::PUSH16r,     X86::PUSH16rmm,     TB_FOLDED_LOAD },
+    { X86::PUSH32r,     X86::PUSH32rmm,     TB_FOLDED_LOAD },
+    { X86::PUSH64r,     X86::PUSH64rmm,     TB_FOLDED_LOAD },
     { X86::SETAEr,      X86::SETAEm,        TB_FOLDED_STORE },
     { X86::SETAr,       X86::SETAm,         TB_FOLDED_STORE },
     { X86::SETBEr,      X86::SETBEm,        TB_FOLDED_STORE },
@@ -4878,10 +4881,14 @@ MachineInstr *X86InstrInfo::foldMemoryOperandImpl(
   bool isCallRegIndirect = Subtarget.callRegIndirect();
   bool isTwoAddrFold = false;
 
-  // For CPUs that favor the register form of a call,
-  // do not fold loads into calls.
-  if (isCallRegIndirect &&
-    (MI->getOpcode() == X86::CALL32r || MI->getOpcode() == X86::CALL64r))
+  // For CPUs that favor the register form of a call or push,
+  // do not fold loads into calls or pushes, unless optimizing for size
+  // aggressively.
+  if (isCallRegIndirect && 
+      !MF.getFunction()->hasFnAttribute(Attribute::MinSize) &&
+      (MI->getOpcode() == X86::CALL32r || MI->getOpcode() == X86::CALL64r ||
+       MI->getOpcode() == X86::PUSH16r || MI->getOpcode() == X86::PUSH32r ||
+       MI->getOpcode() == X86::PUSH64r))
     return nullptr;
 
   unsigned NumOps = MI->getDesc().getNumOperands();
author	Michael Kuperstein <michael.m.kuperstein@intel.com>	2015-07-23 12:23:45 +0000
committer	Michael Kuperstein <michael.m.kuperstein@intel.com>	2015-07-23 12:23:45 +0000
commit	454d14539597986d2cf4a50dbebf894081392f04 (patch)
tree	971d3932c03aced4d388d7a2e117cdcbfeee6d4e /llvm/lib/Target/X86/X86InstrInfo.cpp
parent	f6a58b6dff6dc0d585d6ab08c2abd0a309ea4aea (diff)
download	bcm5719-llvm-454d14539597986d2cf4a50dbebf894081392f04.tar.gz bcm5719-llvm-454d14539597986d2cf4a50dbebf894081392f04.zip