[SCEV] Apply NSW and NUW flags via poison value analysis

Summary: Make Scalar Evolution able to propagate NSW and NUW flags from instructions to SCEVs in some cases. This is based on reasoning about when poison from instructions with these flags would trigger undefined behavior. This gives a 13% speed-up on some Eigen3-based Google-internal microbenchmarks for NVPTX. There does not seem to be clear agreement about when poison should be considered to propagate through instructions. In this analysis, poison propagates only in cases where that should be uncontroversial. This change makes LSR able to create induction variables for expressions like &ptr[i + offset] for loops like this: for (int i = 0; i < limit; ++i) { sum += ptr[i + offset]; } Here ptr is a 64 bit pointer and offset is a 32 bit integer. For NVPTX, LSR currently creates an induction variable for i + offset instead, which is not as fast. Improving this situation is what brings the 13% speed-up on some Eigen3-based Google-internal microbenchmarks for NVPTX. There are more details in this discussion on llvmdev. June: http://lists.cs.uiuc.edu/pipermail/llvmdev/2015-June/thread.html#87234 July: http://lists.cs.uiuc.edu/pipermail/llvmdev/2015-July/thread.html#87392 Patch by Bjarke Roune Reviewers: eliben, atrick, sanjoy Subscribers: majnemer, hfinkel, jingyue, meheff, llvm-commits Differential Revision: http://reviews.llvm.org/D11212 llvm-svn: 243460
author: Jingyue Wu <jingyue@google.com> 2015-07-28 18:22:40 +0000
committer: Jingyue Wu <jingyue@google.com> 2015-07-28 18:22:40 +0000
commit: 42f1d67a45f3762ee7a5ffd9f1511b9314602fcc (patch)
tree: a1ae5444da994a2e0ba39be1abef9af0a476a726 /llvm/test/Transforms/LoopStrengthReduce/sext-ind-var.ll
parent: 916cea5682a468db21b2872c31b5bef87bb67f17 (diff)
download: bcm5719-llvm-42f1d67a45f3762ee7a5ffd9f1511b9314602fcc.tar.gz
bcm5719-llvm-42f1d67a45f3762ee7a5ffd9f1511b9314602fcc.zip
1 files changed, 36 insertions, 0 deletions
diff --git a/llvm/test/Transforms/LoopStrengthReduce/sext-ind-var.ll b/llvm/test/Transforms/LoopStrengthReduce/sext-ind-var.ll
new file mode 100644
index 00000000000..9fca3f97094
--- /dev/null
+++ b/llvm/test/Transforms/LoopStrengthReduce/sext-ind-var.ll
@@ -0,0 +1,36 @@
+; RUN: opt -loop-reduce -S < %s | FileCheck %s
+
+target datalayout = "e-i64:64-v16:16-v32:32-n16:32:64"
+target triple = "nvptx64-unknown-unknown"
+
+; LSR used not to be able to generate a float* induction variable in
+; these cases due to scalar evolution not propagating nsw from an
+; instruction to the SCEV, preventing distributing sext into the
+; corresponding addrec.
+
+define float @testadd(float* %input, i32 %offset, i32 %numIterations) {
+; CHECK-LABEL: @testadd
+; CHECK: sext i32 %offset to i64
+; CHECK: loop:
+; CHECK-DAG: phi float*
+; CHECK-DAG: phi i32
+; CHECK-NOT: sext
+
+entry:
+  br label %loop
+
+loop:
+  %i = phi i32 [ %nexti, %loop ], [ 0, %entry ]
+  %sum = phi float [ %nextsum, %loop ], [ 0.000000e+00, %entry ]
+  %index32 = add nuw nsw i32 %i, %offset
+  %index64 = sext i32 %index32 to i64
+  %ptr = getelementptr inbounds float, float* %input, i64 %index64
+  %addend = load float, float* %ptr, align 4
+  %nextsum = fadd float %sum, %addend
+  %nexti = add nuw nsw i32 %i, 1
+  %exitcond = icmp eq i32 %nexti, %numIterations
+  br i1 %exitcond, label %exit, label %loop
+
+exit:
+  ret float %nextsum
+}
author	Jingyue Wu <jingyue@google.com>	2015-07-28 18:22:40 +0000
committer	Jingyue Wu <jingyue@google.com>	2015-07-28 18:22:40 +0000
commit	42f1d67a45f3762ee7a5ffd9f1511b9314602fcc (patch)
tree	a1ae5444da994a2e0ba39be1abef9af0a476a726 /llvm/test/Transforms/LoopStrengthReduce/sext-ind-var.ll
parent	916cea5682a468db21b2872c31b5bef87bb67f17 (diff)
download	bcm5719-llvm-42f1d67a45f3762ee7a5ffd9f1511b9314602fcc.tar.gz bcm5719-llvm-42f1d67a45f3762ee7a5ffd9f1511b9314602fcc.zip