[X86][SSE] LowerUINT_TO_FP_i64 - only use HADDPD for size/fast-hops

We were always generating a single source HADDPD, but really we should only do this if shouldUseHorizontalOp says its a good idea. Differential Revision: https://reviews.llvm.org/D69175 llvm-svn: 375341
author: Simon Pilgrim <llvm-dev@redking.me.uk> 2019-10-19 11:53:48 +0000
committer: Simon Pilgrim <llvm-dev@redking.me.uk> 2019-10-19 11:53:48 +0000
commit: 6ada70d1b55b9efb8b0603575a0b86e14f049553 (patch)
tree: 58433e616ace9a6d38daceaeaf5d33353d6b80c4 /llvm/lib/Target/X86/X86ISelLowering.cpp
parent: d5367db95c4295b088bf9ae3cf99e24d8bf7e249 (diff)
download: bcm5719-llvm-6ada70d1b55b9efb8b0603575a0b86e14f049553.tar.gz
bcm5719-llvm-6ada70d1b55b9efb8b0603575a0b86e14f049553.zip
1 files changed, 11 insertions, 12 deletions
diff --git a/llvm/lib/Target/X86/X86ISelLowering.cpp b/llvm/lib/Target/X86/X86ISelLowering.cpp
index 4edb3b37afd..49608d7c28a 100644
--- a/llvm/lib/Target/X86/X86ISelLowering.cpp
+++ b/llvm/lib/Target/X86/X86ISelLowering.cpp
@@ -18510,6 +18510,16 @@ SDValue X86TargetLowering::BuildFILD(SDValue Op, EVT SrcVT, SDValue Chain,
   return Result;
 }
 
+/// Horizontal vector math instructions may be slower than normal math with
+/// shuffles. Limit horizontal op codegen based on size/speed trade-offs, uarch
+/// implementation, and likely shuffle complexity of the alternate sequence.
+static bool shouldUseHorizontalOp(bool IsSingleSource, SelectionDAG &DAG,
+                                  const X86Subtarget &Subtarget) {
+  bool IsOptimizingSize = DAG.getMachineFunction().getFunction().hasOptSize();
+  bool HasFastHOps = Subtarget.hasFastHorizontalOps();
+  return !IsSingleSource || IsOptimizingSize || HasFastHOps;
+}
+
 /// 64-bit unsigned integer to double expansion.
 static SDValue LowerUINT_TO_FP_i64(SDValue Op, SelectionDAG &DAG,
                                    const X86Subtarget &Subtarget) {
@@ -18564,8 +18574,7 @@ static SDValue LowerUINT_TO_FP_i64(SDValue Op, SelectionDAG &DAG,
   SDValue Sub = DAG.getNode(ISD::FSUB, dl, MVT::v2f64, XR2F, CLod1);
   SDValue Result;
 
-  if (Subtarget.hasSSE3()) {
-    // FIXME: The 'haddpd' instruction may be slower than 'shuffle + addsd'.
+  if (shouldUseHorizontalOp(true, DAG, Subtarget)) {
     Result = DAG.getNode(X86ISD::FHADD, dl, MVT::v2f64, Sub, Sub);
   } else {
     SDValue Shuffle = DAG.getVectorShuffle(MVT::v2f64, dl, Sub, Sub, {1,-1});
@@ -19623,16 +19632,6 @@ static SDValue LowerSTRICT_FP_ROUND(SDValue Op, SelectionDAG &DAG) {
   return Op;
 }
 
-/// Horizontal vector math instructions may be slower than normal math with
-/// shuffles. Limit horizontal op codegen based on size/speed trade-offs, uarch
-/// implementation, and likely shuffle complexity of the alternate sequence.
-static bool shouldUseHorizontalOp(bool IsSingleSource, SelectionDAG &DAG,
-                                  const X86Subtarget &Subtarget) {
-  bool IsOptimizingSize = DAG.getMachineFunction().getFunction().hasOptSize();
-  bool HasFastHOps = Subtarget.hasFastHorizontalOps();
-  return !IsSingleSource || IsOptimizingSize || HasFastHOps;
-}
-
 /// Depending on uarch and/or optimizing for size, we might prefer to use a
 /// vector operation in place of the typical scalar operation.
 static SDValue lowerAddSubToHorizontalOp(SDValue Op, SelectionDAG &DAG,
author	Simon Pilgrim <llvm-dev@redking.me.uk>	2019-10-19 11:53:48 +0000
committer	Simon Pilgrim <llvm-dev@redking.me.uk>	2019-10-19 11:53:48 +0000
commit	6ada70d1b55b9efb8b0603575a0b86e14f049553 (patch)
tree	58433e616ace9a6d38daceaeaf5d33353d6b80c4 /llvm/lib/Target/X86/X86ISelLowering.cpp
parent	d5367db95c4295b088bf9ae3cf99e24d8bf7e249 (diff)
download	bcm5719-llvm-6ada70d1b55b9efb8b0603575a0b86e14f049553.tar.gz bcm5719-llvm-6ada70d1b55b9efb8b0603575a0b86e14f049553.zip