[AArch64] Don't materialize 0 with "fmov h0, .." when FullFP16 is not supported

We were generating "fmov h0, wzr" instructions when FullFP16 is not enabled. I've not added any tests, because the problem was visible in: test/CodeGen/AArch64/arm64-zero-cycle-zeroing.ll, which I had to change: I don't think Cyclone has FullFP16 enabled by default, so it shouldn't be using this v8.2a instruction. I've also removed these rdar tags, please shout if there are any objections. Differential Revision: https://reviews.llvm.org/D43020 llvm-svn: 324581
author: Sjoerd Meijer <sjoerd.meijer@arm.com> 2018-02-08 08:39:05 +0000
committer: Sjoerd Meijer <sjoerd.meijer@arm.com> 2018-02-08 08:39:05 +0000
commit: 5ea465ded7ef9e48a390ec60961096d8a7caf105 (patch)
tree: f87a70c40af6aa0f7d5ace1671d0287fbc1324dd /llvm/lib/Target
parent: 8d0c8c9be158d2c83864c3124f258f8790476602 (diff)
download: bcm5719-llvm-5ea465ded7ef9e48a390ec60961096d8a7caf105.tar.gz
bcm5719-llvm-5ea465ded7ef9e48a390ec60961096d8a7caf105.zip
2 files changed, 3 insertions, 2 deletions
diff --git a/llvm/lib/Target/AArch64/AArch64ISelLowering.cpp b/llvm/lib/Target/AArch64/AArch64ISelLowering.cpp
index b77f542af9d..073418688e1 100644
--- a/llvm/lib/Target/AArch64/AArch64ISelLowering.cpp
+++ b/llvm/lib/Target/AArch64/AArch64ISelLowering.cpp
@@ -4924,7 +4924,8 @@ bool AArch64TargetLowering::isOffsetFoldingLegal(
 bool AArch64TargetLowering::isFPImmLegal(const APFloat &Imm, EVT VT) const {
   // We can materialize #0.0 as fmov $Rd, XZR for 64-bit and 32-bit cases.
   // FIXME: We should be able to handle f128 as well with a clever lowering.
-  if (Imm.isPosZero() && (VT == MVT::f16 || VT == MVT::f64 || VT == MVT::f32)) {
+  if (Imm.isPosZero() && (VT == MVT::f64 || VT == MVT::f32 ||
+                          (VT == MVT::f16 && Subtarget->hasFullFP16()))) {
     DEBUG(dbgs() << "Legal fp imm: materialize 0 using the zero register\n");
     return true;
   }
diff --git a/llvm/lib/Target/AArch64/AArch64InstrInfo.td b/llvm/lib/Target/AArch64/AArch64InstrInfo.td
index 1751b04800c..2b49a7abb34 100644
--- a/llvm/lib/Target/AArch64/AArch64InstrInfo.td
+++ b/llvm/lib/Target/AArch64/AArch64InstrInfo.td
@@ -2717,7 +2717,7 @@ defm FMOV : UnscaledConversion<"fmov">;
 // Add pseudo ops for FMOV 0 so we can mark them as isReMaterializable
 let isReMaterializable = 1, isCodeGenOnly = 1, isAsCheapAsAMove = 1 in {
 def FMOVH0 : Pseudo<(outs FPR16:$Rd), (ins), [(set f16:$Rd, (fpimm0))]>,
-    Sched<[WriteF]>;
+    Sched<[WriteF]>, Requires<[HasFullFP16]>;
 def FMOVS0 : Pseudo<(outs FPR32:$Rd), (ins), [(set f32:$Rd, (fpimm0))]>,
     Sched<[WriteF]>;
 def FMOVD0 : Pseudo<(outs FPR64:$Rd), (ins), [(set f64:$Rd, (fpimm0))]>,
author	Sjoerd Meijer <sjoerd.meijer@arm.com>	2018-02-08 08:39:05 +0000
committer	Sjoerd Meijer <sjoerd.meijer@arm.com>	2018-02-08 08:39:05 +0000
commit	5ea465ded7ef9e48a390ec60961096d8a7caf105 (patch)
tree	f87a70c40af6aa0f7d5ace1671d0287fbc1324dd /llvm/lib/Target
parent	8d0c8c9be158d2c83864c3124f258f8790476602 (diff)
download	bcm5719-llvm-5ea465ded7ef9e48a390ec60961096d8a7caf105.tar.gz bcm5719-llvm-5ea465ded7ef9e48a390ec60961096d8a7caf105.zip