AMDGPU: Enable some f32 fadd/fsub combines for f16

llvm-svn: 290308
author: Matt Arsenault <Matthew.Arsenault@amd.com> 2016-12-22 03:40:39 +0000
committer: Matt Arsenault <Matthew.Arsenault@amd.com> 2016-12-22 03:40:39 +0000
commit: ef82ad94ea962205c869bacdf46658105592af70 (patch)
tree: 44114de25054f98bd0f24776702714c86efff553 /llvm/lib
parent: 9e22bc2cd30fc8a3f43f740fd93287a76d5115f3 (diff)
download: bcm5719-llvm-ef82ad94ea962205c869bacdf46658105592af70.tar.gz
bcm5719-llvm-ef82ad94ea962205c869bacdf46658105592af70.zip
1 files changed, 12 insertions, 7 deletions
diff --git a/llvm/lib/Target/AMDGPU/SIISelLowering.cpp b/llvm/lib/Target/AMDGPU/SIISelLowering.cpp
index f907a63141f..e5b927d925e 100644
--- a/llvm/lib/Target/AMDGPU/SIISelLowering.cpp
+++ b/llvm/lib/Target/AMDGPU/SIISelLowering.cpp
@@ -3959,12 +3959,15 @@ SDValue SITargetLowering::PerformDAGCombine(SDNode *N,
       break;
 
     EVT VT = N->getValueType(0);
-    if (VT != MVT::f32)
+    if (VT == MVT::f64)
       break;
 
+    assert(!VT.isVector());
+
     // Only do this if we are not trying to support denormals. v_mad_f32 does
     // not support denormals ever.
-    if (Subtarget->hasFP32Denormals())
+    if ((VT == MVT::f32 && Subtarget->hasFP32Denormals()) ||
+        (VT == MVT::f16 && Subtarget->hasFP16Denormals()))
       break;
 
     SDValue LHS = N->getOperand(0);
@@ -3977,7 +3980,7 @@ SDValue SITargetLowering::PerformDAGCombine(SDNode *N,
     if (LHS.getOpcode() == ISD::FADD) {
       SDValue A = LHS.getOperand(0);
       if (A == LHS.getOperand(1)) {
-        const SDValue Two = DAG.getConstantFP(2.0, DL, MVT::f32);
+        const SDValue Two = DAG.getConstantFP(2.0, DL, VT);
         return DAG.getNode(ISD::FMAD, DL, VT, Two, A, RHS);
       }
     }
@@ -3986,7 +3989,7 @@ SDValue SITargetLowering::PerformDAGCombine(SDNode *N,
     if (RHS.getOpcode() == ISD::FADD) {
       SDValue A = RHS.getOperand(0);
       if (A == RHS.getOperand(1)) {
-        const SDValue Two = DAG.getConstantFP(2.0, DL, MVT::f32);
+        const SDValue Two = DAG.getConstantFP(2.0, DL, VT);
         return DAG.getNode(ISD::FMAD, DL, VT, Two, A, LHS);
       }
     }
@@ -3998,13 +4001,15 @@ SDValue SITargetLowering::PerformDAGCombine(SDNode *N,
       break;
 
     EVT VT = N->getValueType(0);
+    assert(!VT.isVector());
 
     // Try to get the fneg to fold into the source modifier. This undoes generic
     // DAG combines and folds them into the mad.
     //
     // Only do this if we are not trying to support denormals. v_mad_f32 does
     // not support denormals ever.
-    if (VT == MVT::f32 && !Subtarget->hasFP32Denormals()) {
+    if ((VT == MVT::f32 && !Subtarget->hasFP32Denormals()) ||
+        (VT == MVT::f16 && !Subtarget->hasFP16Denormals())) {
       SDValue LHS = N->getOperand(0);
       SDValue RHS = N->getOperand(1);
       if (LHS.getOpcode() == ISD::FADD) {
@@ -4012,7 +4017,7 @@ SDValue SITargetLowering::PerformDAGCombine(SDNode *N,
 
         SDValue A = LHS.getOperand(0);
         if (A == LHS.getOperand(1)) {
-          const SDValue Two = DAG.getConstantFP(2.0, DL, MVT::f32);
+          const SDValue Two = DAG.getConstantFP(2.0, DL, VT);
           SDValue NegRHS = DAG.getNode(ISD::FNEG, DL, VT, RHS);
 
           return DAG.getNode(ISD::FMAD, DL, VT, Two, A, NegRHS);
@@ -4024,7 +4029,7 @@ SDValue SITargetLowering::PerformDAGCombine(SDNode *N,
 
         SDValue A = RHS.getOperand(0);
         if (A == RHS.getOperand(1)) {
-          const SDValue NegTwo = DAG.getConstantFP(-2.0, DL, MVT::f32);
+          const SDValue NegTwo = DAG.getConstantFP(-2.0, DL, VT);
           return DAG.getNode(ISD::FMAD, DL, VT, NegTwo, A, LHS);
         }
       }
author	Matt Arsenault <Matthew.Arsenault@amd.com>	2016-12-22 03:40:39 +0000
committer	Matt Arsenault <Matthew.Arsenault@amd.com>	2016-12-22 03:40:39 +0000
commit	ef82ad94ea962205c869bacdf46658105592af70 (patch)
tree	44114de25054f98bd0f24776702714c86efff553 /llvm/lib
parent	9e22bc2cd30fc8a3f43f740fd93287a76d5115f3 (diff)
download	bcm5719-llvm-ef82ad94ea962205c869bacdf46658105592af70.tar.gz bcm5719-llvm-ef82ad94ea962205c869bacdf46658105592af70.zip