[NVPTX] Move getDivF32Level, usePrecSqrtF32, and useF32FTZ into out of DAGToDAG and into TargetLowering.

Summary: DADToDAG has access to TargetLowering, but not vice versa, so this is the more general location for these functions. NFC Reviewers: tra Subscribers: jholewinski, llvm-commits Differential Revision: https://reviews.llvm.org/D28795 llvm-svn: 292693
author: Justin Lebar <jlebar@google.com> 2017-01-21 01:00:14 +0000
committer: Justin Lebar <jlebar@google.com> 2017-01-21 01:00:14 +0000
commit: 077f8fb1689d24d0118248ca41447aea2cd0f6d9 (patch)
tree: 8c3a40c06c5f6e899a35f9e53b8f265ff24bd203 /llvm/lib/Target/NVPTX/NVPTXISelLowering.cpp
parent: 8b18a347b6021cf5bea7b6f7c6fd0b8c42f26adb (diff)
download: bcm5719-llvm-077f8fb1689d24d0118248ca41447aea2cd0f6d9.tar.gz
bcm5719-llvm-077f8fb1689d24d0118248ca41447aea2cd0f6d9.zip
1 files changed, 54 insertions, 0 deletions
diff --git a/llvm/lib/Target/NVPTX/NVPTXISelLowering.cpp b/llvm/lib/Target/NVPTX/NVPTXISelLowering.cpp
index 48954fd19e5..1fb42496d95 100644
--- a/llvm/lib/Target/NVPTX/NVPTXISelLowering.cpp
+++ b/llvm/lib/Target/NVPTX/NVPTXISelLowering.cpp
@@ -79,6 +79,60 @@ FMAContractLevelOpt("nvptx-fma-level", cl::ZeroOrMore, cl::Hidden,
                              " 1: do it  2: do it aggressively"),
                     cl::init(2));
 
+static cl::opt<int> UsePrecDivF32(
+    "nvptx-prec-divf32", cl::ZeroOrMore, cl::Hidden,
+    cl::desc("NVPTX Specifies: 0 use div.approx, 1 use div.full, 2 use"
+             " IEEE Compliant F32 div.rnd if available."),
+    cl::init(2));
+
+static cl::opt<bool> UsePrecSqrtF32(
+    "nvptx-prec-sqrtf32", cl::Hidden,
+    cl::desc("NVPTX Specific: 0 use sqrt.approx, 1 use sqrt.rn."),
+    cl::init(true));
+
+static cl::opt<bool> FtzEnabled(
+    "nvptx-f32ftz", cl::ZeroOrMore, cl::Hidden,
+    cl::desc("NVPTX Specific: Flush f32 subnormals to sign-preserving zero."),
+    cl::init(false));
+
+int NVPTXTargetLowering::getDivF32Level() const {
+  if (UsePrecDivF32.getNumOccurrences() > 0) {
+    // If nvptx-prec-div32=N is used on the command-line, always honor it
+    return UsePrecDivF32;
+  } else {
+    // Otherwise, use div.approx if fast math is enabled
+    if (getTargetMachine().Options.UnsafeFPMath)
+      return 0;
+    else
+      return 2;
+  }
+}
+
+bool NVPTXTargetLowering::usePrecSqrtF32() const {
+  if (UsePrecSqrtF32.getNumOccurrences() > 0) {
+    // If nvptx-prec-sqrtf32 is used on the command-line, always honor it
+    return UsePrecSqrtF32;
+  } else {
+    // Otherwise, use sqrt.approx if fast math is enabled
+    return !getTargetMachine().Options.UnsafeFPMath;
+  }
+}
+
+bool NVPTXTargetLowering::useF32FTZ(const MachineFunction &MF) const {
+  // TODO: Get rid of this flag; there can be only one way to do this.
+  if (FtzEnabled.getNumOccurrences() > 0) {
+    // If nvptx-f32ftz is used on the command-line, always honor it
+    return FtzEnabled;
+  } else {
+    const Function *F = MF.getFunction();
+    // Otherwise, check for an nvptx-f32ftz attribute on the function
+    if (F->hasFnAttribute("nvptx-f32ftz"))
+      return F->getFnAttribute("nvptx-f32ftz").getValueAsString() == "true";
+    else
+      return false;
+  }
+}
+
 static bool IsPTXVectorType(MVT VT) {
   switch (VT.SimpleTy) {
   default:
author	Justin Lebar <jlebar@google.com>	2017-01-21 01:00:14 +0000
committer	Justin Lebar <jlebar@google.com>	2017-01-21 01:00:14 +0000
commit	077f8fb1689d24d0118248ca41447aea2cd0f6d9 (patch)
tree	8c3a40c06c5f6e899a35f9e53b8f265ff24bd203 /llvm/lib/Target/NVPTX/NVPTXISelLowering.cpp
parent	8b18a347b6021cf5bea7b6f7c6fd0b8c42f26adb (diff)
download	bcm5719-llvm-077f8fb1689d24d0118248ca41447aea2cd0f6d9.tar.gz bcm5719-llvm-077f8fb1689d24d0118248ca41447aea2cd0f6d9.zip