diff options
author | Tobias Grosser <tobias@grosser.es> | 2017-05-19 03:45:00 +0000 |
---|---|---|
committer | Tobias Grosser <tobias@grosser.es> | 2017-05-19 03:45:00 +0000 |
commit | 45e9fd181003a01f52f312edbb4d4b0c54d4f608 (patch) | |
tree | d6c6a50f7f7e16a07c25c2096a7ad04d4a35d18d /polly/test/ScopInfo | |
parent | 27ac223a857d4b7da715a69a22694c37498158a4 (diff) | |
download | bcm5719-llvm-45e9fd181003a01f52f312edbb4d4b0c54d4f608.tar.gz bcm5719-llvm-45e9fd181003a01f52f312edbb4d4b0c54d4f608.zip |
[ScopInfo] Gracefully handle long compile times
The following test case tried to compute the lexicographic minimum of the
following set during alias analysis, which caused very long compile time:
[p_0, p_1, p_2, p_3, p_4, p_5] -> { MemRef0[i0] : (517p_3 >= 70944 - 298p_2 and
256i0 >= -71199 + 298p_2 + 517p_3 and 256i0 <= -70944 + 298p_2 + 517p_3) or
(409p_4 >= 57120 - 298p_2 and 256i0 >= -57375 + 298p_2 + 409p_4 and 256i0 <=
-57120 + 298p_2 + 409p_4) or (104p_4 >= 17329 + 149p_2 - 50p_3 and 128i0 >=
17328 + 149p_2 - 50p_3 - 104p_4 and 128i0 <= 17455 + 149p_2 - 50p_3 - 104p_4) or
(104p_4 <= 17328 + 149p_2 - 50p_3 and 128i0 >= 17201 + 149p_2 - 50p_3 - 104p_4
and 128i0 <= 17328 + 149p_2 - 50p_3 - 104p_4) or (409p_4 <= 57119 - 298p_2 and
256i0 >= -57120 + 298p_2 + 409p_4 and 256i0 <= -56865 + 298p_2 + 409p_4) or
(517p_3 <= 70943 - 298p_2 and 256i0 >= -70944 + 298p_2 + 517p_3 and 256i0 <=
-70689 + 298p_2 + 517p_3) or (p_1 >= 2 + 2p_0 and 298p_5 >= 70944 - 517p_3 and
256i0 >= -71199 + 517p_3 + 298p_5 and 256i0 <= -70944 + 517p_3 + 298p_5) or (p_1
>= 2 + 2p_0 and 298p_5 >= 57120 - 409p_4 and 256i0 >= -57375 + 409p_4 + 298p_5
>and 256i0 <= -57120 + 409p_4 + 298p_5) or (p_1 >= 2 + 2p_0 and 149p_5 <= -17329
>+ 50p_3 + 104p_4 and 128i0 >= 17328 - 50p_3 - 104p_4 + 149p_5 and 128i0 <=
>17455 - 50p_3 - 104p_4 + 149p_5) or (p_1 >= 2 + 2p_0 and 149p_5 >= -17328 +
>50p_3 + 104p_4 and 128i0 >= 17201 - 50p_3 - 104p_4 + 149p_5 and 128i0 <= 17328
>- 50p_3 - 104p_4 + 149p_5) or (p_1 >= 2 + 2p_0 and 298p_5 <= 57119 - 409p_4 and
>256i0 >= -57120 + 409p_4 + 298p_5 and 256i0 <= -56865 + 409p_4 + 298p_5) or
>(p_1 >= 2 + 2p_0 and 298p_5 <= 70943 - 517p_3 and 256i0 >= -70944 + 517p_3 +
>298p_5 and 256i0 <= -70689 + 517p_3 + 298p_5) }
We now guard the potentially expensive functions in Polly's scop analysis to
gracefully bail out in case of overly long compilation times.
llvm-svn: 303404
Diffstat (limited to 'polly/test/ScopInfo')
-rw-r--r-- | polly/test/ScopInfo/long-compile-time-alias-analysis.ll | 235 |
1 files changed, 235 insertions, 0 deletions
diff --git a/polly/test/ScopInfo/long-compile-time-alias-analysis.ll b/polly/test/ScopInfo/long-compile-time-alias-analysis.ll new file mode 100644 index 00000000000..d0905104ce6 --- /dev/null +++ b/polly/test/ScopInfo/long-compile-time-alias-analysis.ll @@ -0,0 +1,235 @@ +; RUN: opt %loadPolly -polly-scops -analyze < %s + +; Verify that the compilation of this test case does not take infinite time. +; At some point Polly tried to model this test case and got stuck in +; computing a lexicographic minima. Today it should gracefully bail out. +target datalayout = "e-m:e-i8:8:32-i16:16:32-i64:64-i128:128-n32:64-S128" +target triple = "aarch64--linux-android" + +%0 = type { i8*, i64, i64, i64, i64, i64, i64 } + +define void @_Z1fR1SS0_Ph(%0* nocapture readonly dereferenceable(56) %arg, %0* nocapture readonly dereferenceable(56) %arg1, i8* nocapture readonly %arg2) { +bb: + %tmp = getelementptr inbounds %0, %0* %arg1, i64 0, i32 1 + %tmp3 = getelementptr inbounds %0, %0* %arg, i64 0, i32 0 + %tmp4 = load i8*, i8** %tmp3, align 8 + %tmp5 = getelementptr inbounds %0, %0* %arg, i64 0, i32 4 + %tmp6 = load i64, i64* %tmp5, align 8 + %tmp7 = getelementptr inbounds %0, %0* %arg, i64 0, i32 1 + %tmp8 = load i64, i64* %tmp7, align 8 + %tmp9 = mul i64 %tmp8, %tmp6 + %tmp10 = getelementptr inbounds i8, i8* %tmp4, i64 %tmp9 + %tmp11 = getelementptr inbounds %0, %0* %arg, i64 0, i32 3 + %tmp12 = load i64, i64* %tmp11, align 8 + %tmp13 = getelementptr inbounds i8, i8* %tmp10, i64 %tmp12 + %tmp14 = getelementptr inbounds %0, %0* %arg, i64 0, i32 6 + %tmp15 = load i64, i64* %tmp14, align 8 + %tmp16 = add i64 %tmp15, 1 + %tmp17 = icmp eq i64 %tmp16, %tmp6 + br i1 %tmp17, label %bb51, label %bb18 + +bb18: ; preds = %bb + %tmp19 = getelementptr inbounds %0, %0* %arg, i64 0, i32 2 + %tmp20 = load i64, i64* %tmp19, align 8 + %tmp21 = mul i64 %tmp20, %tmp8 + %tmp22 = getelementptr inbounds i8, i8* %tmp13, i64 %tmp21 + %tmp23 = getelementptr inbounds i8, i8* %tmp22, i64 %tmp9 + %tmp24 = getelementptr inbounds i8, i8* %tmp23, i64 %tmp12 + %tmp25 = bitcast %0* %arg1 to i16** + %tmp26 = load i16*, i16** %tmp25, align 8 + %tmp27 = load i64, i64* %tmp, align 8 + %tmp28 = getelementptr inbounds %0, %0* %arg1, i64 0, i32 4 + %tmp29 = load i64, i64* %tmp28, align 8 + %tmp30 = mul i64 %tmp27, %tmp29 + %tmp31 = getelementptr inbounds i16, i16* %tmp26, i64 %tmp30 + %tmp32 = getelementptr inbounds %0, %0* %arg1, i64 0, i32 3 + %tmp33 = load i64, i64* %tmp32, align 8 + %tmp34 = getelementptr inbounds i16, i16* %tmp31, i64 %tmp33 + %tmp35 = getelementptr inbounds %0, %0* %arg, i64 0, i32 5 + %tmp36 = load i64, i64* %tmp35, align 8 + br label %bb37 + +bb37: ; preds = %bb57, %bb18 + %tmp38 = phi i64 [ %tmp6, %bb18 ], [ %tmp58, %bb57 ] + %tmp39 = phi i64 [ %tmp15, %bb18 ], [ %tmp59, %bb57 ] + %tmp40 = phi i64 [ %tmp27, %bb18 ], [ %tmp60, %bb57 ] + %tmp41 = phi i64 [ %tmp8, %bb18 ], [ %tmp61, %bb57 ] + %tmp42 = phi i64 [ %tmp12, %bb18 ], [ %tmp62, %bb57 ] + %tmp43 = phi i64 [ %tmp36, %bb18 ], [ %tmp63, %bb57 ] + %tmp44 = phi i16* [ %tmp34, %bb18 ], [ %tmp69, %bb57 ] + %tmp45 = phi i8* [ %tmp13, %bb18 ], [ %tmp64, %bb57 ] + %tmp46 = phi i8* [ %tmp24, %bb18 ], [ %tmp68, %bb57 ] + %tmp47 = phi i64 [ 0, %bb18 ], [ %tmp70, %bb57 ] + %tmp48 = add i64 %tmp43, 1 + %tmp49 = sub i64 %tmp48, %tmp42 + %tmp50 = icmp eq i64 %tmp49, 0 + br i1 %tmp50, label %bb57, label %bb74 + +bb51: ; preds = %bb57, %bb + ret void + +bb52: ; preds = %bb176 + %tmp53 = load i64, i64* %tmp7, align 8 + %tmp54 = load i64, i64* %tmp, align 8 + %tmp55 = load i64, i64* %tmp14, align 8 + %tmp56 = load i64, i64* %tmp5, align 8 + br label %bb57 + +bb57: ; preds = %bb52, %bb37 + %tmp58 = phi i64 [ %tmp56, %bb52 ], [ %tmp38, %bb37 ] + %tmp59 = phi i64 [ %tmp55, %bb52 ], [ %tmp39, %bb37 ] + %tmp60 = phi i64 [ %tmp54, %bb52 ], [ %tmp40, %bb37 ] + %tmp61 = phi i64 [ %tmp53, %bb52 ], [ %tmp41, %bb37 ] + %tmp62 = phi i64 [ %tmp179, %bb52 ], [ %tmp42, %bb37 ] + %tmp63 = phi i64 [ %tmp178, %bb52 ], [ %tmp43, %bb37 ] + %tmp64 = getelementptr inbounds i8, i8* %tmp45, i64 %tmp61 + %tmp65 = and i64 %tmp47, 1 + %tmp66 = icmp eq i64 %tmp65, 0 + %tmp67 = getelementptr inbounds i8, i8* %tmp46, i64 %tmp61 + %tmp68 = select i1 %tmp66, i8* %tmp46, i8* %tmp67 + %tmp69 = getelementptr inbounds i16, i16* %tmp44, i64 %tmp60 + %tmp70 = add i64 %tmp47, 1 + %tmp71 = add i64 %tmp59, 1 + %tmp72 = sub i64 %tmp71, %tmp58 + %tmp73 = icmp ult i64 %tmp70, %tmp72 + br i1 %tmp73, label %bb37, label %bb51 + +bb74: ; preds = %bb176, %bb37 + %tmp75 = phi i64 [ %tmp181, %bb176 ], [ %tmp49, %bb37 ] + %tmp76 = phi i64 [ %tmp177, %bb176 ], [ 0, %bb37 ] + %tmp77 = getelementptr inbounds i8, i8* %tmp45, i64 %tmp76 + %tmp78 = load i8, i8* %tmp77, align 1 + %tmp79 = zext i8 %tmp78 to i32 + %tmp80 = or i64 %tmp76, 1 + %tmp81 = getelementptr inbounds i8, i8* %tmp45, i64 %tmp80 + %tmp82 = load i8, i8* %tmp81, align 1 + %tmp83 = zext i8 %tmp82 to i32 + %tmp84 = getelementptr inbounds i8, i8* %tmp46, i64 %tmp76 + %tmp85 = load i8, i8* %tmp84, align 1 + %tmp86 = zext i8 %tmp85 to i32 + %tmp87 = getelementptr inbounds i8, i8* %tmp46, i64 %tmp80 + %tmp88 = load i8, i8* %tmp87, align 1 + %tmp89 = zext i8 %tmp88 to i32 + %tmp90 = mul nuw nsw i32 %tmp86, 517 + %tmp91 = add nsw i32 %tmp90, -66176 + %tmp92 = sub nsw i32 128, %tmp86 + %tmp93 = mul nsw i32 %tmp92, 100 + %tmp94 = sub nsw i32 128, %tmp89 + %tmp95 = mul nsw i32 %tmp94, 208 + %tmp96 = mul nuw nsw i32 %tmp89, 409 + %tmp97 = add nsw i32 %tmp96, -52352 + %tmp98 = mul nuw nsw i32 %tmp79, 298 + %tmp99 = add nsw i32 %tmp98, -4768 + %tmp100 = add nsw i32 %tmp91, %tmp99 + %tmp101 = sdiv i32 %tmp100, 256 + %tmp102 = tail call { i32, i1 } @llvm.sadd.with.overflow.i32(i32 %tmp99, i32 %tmp95) + %tmp103 = extractvalue { i32, i1 } %tmp102, 1 + br i1 %tmp103, label %bb104, label %bb105 + +bb104: ; preds = %bb120, %bb109, %bb105, %bb74 + tail call void @llvm.trap() + unreachable + +bb105: ; preds = %bb74 + %tmp106 = extractvalue { i32, i1 } %tmp102, 0 + %tmp107 = tail call { i32, i1 } @llvm.sadd.with.overflow.i32(i32 %tmp106, i32 %tmp93) + %tmp108 = extractvalue { i32, i1 } %tmp107, 1 + br i1 %tmp108, label %bb104, label %bb109 + +bb109: ; preds = %bb105 + %tmp110 = extractvalue { i32, i1 } %tmp107, 0 + %tmp111 = sdiv i32 %tmp110, 256 + %tmp112 = add nsw i32 %tmp97, %tmp99 + %tmp113 = sdiv i32 %tmp112, 256 + %tmp114 = mul nuw nsw i32 %tmp83, 298 + %tmp115 = add nsw i32 %tmp114, -4768 + %tmp116 = add nsw i32 %tmp91, %tmp115 + %tmp117 = sdiv i32 %tmp116, 256 + %tmp118 = tail call { i32, i1 } @llvm.sadd.with.overflow.i32(i32 %tmp115, i32 %tmp95) + %tmp119 = extractvalue { i32, i1 } %tmp118, 1 + br i1 %tmp119, label %bb104, label %bb120 + +bb120: ; preds = %bb109 + %tmp121 = extractvalue { i32, i1 } %tmp118, 0 + %tmp122 = tail call { i32, i1 } @llvm.sadd.with.overflow.i32(i32 %tmp121, i32 %tmp93) + %tmp123 = extractvalue { i32, i1 } %tmp122, 1 + br i1 %tmp123, label %bb104, label %bb124 + +bb124: ; preds = %bb120 + %tmp125 = sext i32 %tmp101 to i64 + %tmp126 = getelementptr inbounds i8, i8* %arg2, i64 %tmp125 + %tmp127 = load i8, i8* %tmp126, align 1 + %tmp128 = zext i8 %tmp127 to i32 + %tmp129 = lshr i32 %tmp128, 3 + %tmp130 = shl nuw nsw i32 %tmp129, 11 + %tmp131 = sext i32 %tmp111 to i64 + %tmp132 = getelementptr inbounds i8, i8* %arg2, i64 %tmp131 + %tmp133 = load i8, i8* %tmp132, align 1 + %tmp134 = zext i8 %tmp133 to i32 + %tmp135 = lshr i32 %tmp134, 2 + %tmp136 = shl nuw nsw i32 %tmp135, 5 + %tmp137 = or i32 %tmp136, %tmp130 + %tmp138 = sext i32 %tmp113 to i64 + %tmp139 = getelementptr inbounds i8, i8* %arg2, i64 %tmp138 + %tmp140 = load i8, i8* %tmp139, align 1 + %tmp141 = zext i8 %tmp140 to i32 + %tmp142 = lshr i32 %tmp141, 3 + %tmp143 = or i32 %tmp137, %tmp142 + %tmp144 = icmp ult i64 %tmp80, %tmp75 + br i1 %tmp144, label %bb145, label %bb173 + +bb145: ; preds = %bb124 + %tmp146 = add nsw i32 %tmp97, %tmp115 + %tmp147 = sdiv i32 %tmp146, 256 + %tmp148 = sext i32 %tmp147 to i64 + %tmp149 = getelementptr inbounds i8, i8* %arg2, i64 %tmp148 + %tmp150 = load i8, i8* %tmp149, align 1 + %tmp151 = extractvalue { i32, i1 } %tmp122, 0 + %tmp152 = sdiv i32 %tmp151, 256 + %tmp153 = sext i32 %tmp152 to i64 + %tmp154 = getelementptr inbounds i8, i8* %arg2, i64 %tmp153 + %tmp155 = load i8, i8* %tmp154, align 1 + %tmp156 = sext i32 %tmp117 to i64 + %tmp157 = getelementptr inbounds i8, i8* %arg2, i64 %tmp156 + %tmp158 = load i8, i8* %tmp157, align 1 + %tmp159 = zext i8 %tmp158 to i32 + %tmp160 = lshr i32 %tmp159, 3 + %tmp161 = shl nuw nsw i32 %tmp160, 11 + %tmp162 = zext i8 %tmp155 to i32 + %tmp163 = lshr i32 %tmp162, 2 + %tmp164 = shl nuw nsw i32 %tmp163, 5 + %tmp165 = zext i8 %tmp150 to i32 + %tmp166 = lshr i32 %tmp165, 3 + %tmp167 = or i32 %tmp164, %tmp166 + %tmp168 = or i32 %tmp167, %tmp161 + %tmp169 = shl nuw i32 %tmp168, 16 + %tmp170 = or i32 %tmp169, %tmp143 + %tmp171 = getelementptr inbounds i16, i16* %tmp44, i64 %tmp76 + %tmp172 = bitcast i16* %tmp171 to i32* + store i32 %tmp170, i32* %tmp172, align 4 + br label %bb176 + +bb173: ; preds = %bb124 + %tmp174 = trunc i32 %tmp143 to i16 + %tmp175 = getelementptr inbounds i16, i16* %tmp44, i64 %tmp76 + store i16 %tmp174, i16* %tmp175, align 2 + br label %bb176 + +bb176: ; preds = %bb173, %bb145 + %tmp177 = add i64 %tmp76, 2 + %tmp178 = load i64, i64* %tmp35, align 8 + %tmp179 = load i64, i64* %tmp11, align 8 + %tmp180 = add i64 %tmp178, 1 + %tmp181 = sub i64 %tmp180, %tmp179 + %tmp182 = icmp ult i64 %tmp177, %tmp181 + br i1 %tmp182, label %bb74, label %bb52 +} + +; Function Attrs: noreturn nounwind +declare void @llvm.trap() #0 + +; Function Attrs: nounwind readnone speculatable +declare { i32, i1 } @llvm.sadd.with.overflow.i32(i32, i32) #1 + +attributes #0 = { noreturn nounwind } +attributes #1 = { nounwind readnone speculatable } |