[X86][SSE] Vector integer to float conversion memory folding

Added missing memory folding for the (V)CVTDQ2PS instructions - we can safely fold these (but not the (V)CVTDQ2PD versions which have a register/memory size discrepancy in the source operand). I've added a test case demonstrating that stack folding now works. Differential Revision: http://reviews.llvm.org/D5981 llvm-svn: 221407
author: Simon Pilgrim <llvm-dev@redking.me.uk> 2014-11-05 22:28:25 +0000
committer: Simon Pilgrim <llvm-dev@redking.me.uk> 2014-11-05 22:28:25 +0000
commit: 1fc483d9917d224a7731e2570f6f799a26f8de1c (patch)
tree: 66661023dda2da5d2bf40d2ce859020d4d73cf63 /llvm/lib/Target/X86/X86InstrInfo.cpp
parent: 15ee408a91abb9b53f532672e9fc7c0864cfdf3a (diff)
download: bcm5719-llvm-1fc483d9917d224a7731e2570f6f799a26f8de1c.tar.gz
bcm5719-llvm-1fc483d9917d224a7731e2570f6f799a26f8de1c.zip
1 files changed, 3 insertions, 0 deletions
diff --git a/llvm/lib/Target/X86/X86InstrInfo.cpp b/llvm/lib/Target/X86/X86InstrInfo.cpp
index 4e05c7c2d2e..dd463f15b32 100644
--- a/llvm/lib/Target/X86/X86InstrInfo.cpp
+++ b/llvm/lib/Target/X86/X86InstrInfo.cpp
@@ -448,6 +448,7 @@ X86InstrInfo::X86InstrInfo(X86Subtarget &STI)
     { X86::CVTSD2SIrr,      X86::CVTSD2SIrm,          0 },
     { X86::CVTSS2SI64rr,    X86::CVTSS2SI64rm,        0 },
     { X86::CVTSS2SIrr,      X86::CVTSS2SIrm,          0 },
+    { X86::CVTDQ2PSrr,      X86::CVTDQ2PSrm,          TB_ALIGN_16 },
     { X86::CVTTPD2DQrr,     X86::CVTTPD2DQrm,         TB_ALIGN_16 },
     { X86::CVTTPS2DQrr,     X86::CVTTPS2DQrm,         TB_ALIGN_16 },
     { X86::Int_CVTTSD2SI64rr,X86::Int_CVTTSD2SI64rm,  0 },
@@ -526,6 +527,7 @@ X86InstrInfo::X86InstrInfo(X86Subtarget &STI)
     { X86::VCVTSD2SIrr,     X86::VCVTSD2SIrm,         0 },
     { X86::VCVTSS2SI64rr,   X86::VCVTSS2SI64rm,       0 },
     { X86::VCVTSS2SIrr,     X86::VCVTSS2SIrm,         0 },
+    { X86::VCVTDQ2PSrr,     X86::VCVTDQ2PSrm,         0 },
     { X86::VMOV64toPQIrr,   X86::VMOVQI2PQIrm,        0 },
     { X86::VMOV64toSDrr,    X86::VMOV64toSDrm,        0 },
     { X86::VMOVAPDrr,       X86::VMOVAPDrm,           TB_ALIGN_16 },
@@ -559,6 +561,7 @@ X86InstrInfo::X86InstrInfo(X86Subtarget &STI)
     { X86::VBROADCASTSSrr,  X86::VBROADCASTSSrm,      TB_NO_REVERSE },
 
     // AVX 256-bit foldable instructions
+    { X86::VCVTDQ2PSYrr,    X86::VCVTDQ2PSYrm,        0 },
     { X86::VMOVAPDYrr,      X86::VMOVAPDYrm,          TB_ALIGN_32 },
     { X86::VMOVAPSYrr,      X86::VMOVAPSYrm,          TB_ALIGN_32 },
     { X86::VMOVDQAYrr,      X86::VMOVDQAYrm,          TB_ALIGN_32 },
author	Simon Pilgrim <llvm-dev@redking.me.uk>	2014-11-05 22:28:25 +0000
committer	Simon Pilgrim <llvm-dev@redking.me.uk>	2014-11-05 22:28:25 +0000
commit	1fc483d9917d224a7731e2570f6f799a26f8de1c (patch)
tree	66661023dda2da5d2bf40d2ce859020d4d73cf63 /llvm/lib/Target/X86/X86InstrInfo.cpp
parent	15ee408a91abb9b53f532672e9fc7c0864cfdf3a (diff)
download	bcm5719-llvm-1fc483d9917d224a7731e2570f6f799a26f8de1c.tar.gz bcm5719-llvm-1fc483d9917d224a7731e2570f6f799a26f8de1c.zip