; NOTE: Assertions have been autogenerated by utils/update_test_checks.py ; RUN: opt -loop-idiom < %s -S | FileCheck %s ; CHECK: source_filename ; CHECK-NOT; bcmp ; CHECK-NOT; memcmp target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64" define i1 @three_blocks_and_two_latches_in_loop(i8* %ptr0, i8* %ptr1) { entry: br label %for.body for.body: %i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ], [ 0, %for.passthrough ] %arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08 %v0 = load i8, i8* %arrayidx %arrayidx1 = getelementptr inbounds i8, i8* %ptr1, i64 %i.08 %v1 = load i8, i8* %arrayidx1 %cmp3 = icmp eq i8 %v0, %v1 %inc = add nuw nsw i64 %i.08, 1 br i1 %cmp3, label %for.passthrough, label %cleanup for.passthrough: br i1 true, label %for.cond, label %for.body for.cond: %cmp = icmp ult i64 %inc, 8 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.cond ] ret i1 %res } define i1 @three_blocks_in_loop(i8* %ptr0, i8* %ptr1) { entry: br label %for.body for.body: %i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ] %arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08 %v0 = load i8, i8* %arrayidx %arrayidx1 = getelementptr inbounds i8, i8* %ptr1, i64 %i.08 %v1 = load i8, i8* %arrayidx1 %cmp3 = icmp eq i8 %v0, %v1 %inc = add nuw nsw i64 %i.08, 1 br i1 %cmp3, label %for.passthrough, label %cleanup for.passthrough: br label %for.cond for.cond: %cmp = icmp ult i64 %inc, 8 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.cond ] ret i1 %res } define i1 @exit_block_is_not_dedicated(i8* %ptr0, i8* %ptr1) { entry: br i1 true, label %for.body, label %cleanup for.body: %i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ] %arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08 %v0 = load i8, i8* %arrayidx %arrayidx1 = getelementptr inbounds i8, i8* %ptr1, i64 %i.08 %v1 = load i8, i8* %arrayidx1 %cmp3 = icmp eq i8 %v0, %v1 %inc = add nuw nsw i64 %i.08, 1 br i1 %cmp3, label %for.cond, label %cleanup for.cond: %cmp = icmp ult i64 %inc, 8 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.cond ], [ false, %entry ] ret i1 %res } define i1 @body_cmp_is_not_equality(i8* %ptr0, i8* %ptr1) { entry: br label %for.body for.body: %i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ] %arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08 %v0 = load i8, i8* %arrayidx %arrayidx1 = getelementptr inbounds i8, i8* %ptr1, i64 %i.08 %v1 = load i8, i8* %arrayidx1 %cmp3 = icmp ult i8 %v0, %v1 %inc = add nuw nsw i64 %i.08, 1 br i1 %cmp3, label %for.cond, label %cleanup for.cond: %cmp = icmp ult i64 %inc, 8 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.cond ] ret i1 %res } define i1 @only_one_load(i8* %ptr0, i8* %ptr1) { entry: br label %for.body for.body: %i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ] %arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08 %v0 = load i8, i8* %arrayidx %cmp3 = icmp eq i8 %v0, 0 %inc = add nuw nsw i64 %i.08, 1 br i1 %cmp3, label %for.cond, label %cleanup for.cond: %cmp = icmp ult i64 %inc, 8 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.cond ] ret i1 %res } define i1 @loads_of_less_than_byte(i7* %ptr0, i7* %ptr1) { entry: br label %for.body for.body: %i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ] %arrayidx = getelementptr inbounds i7, i7* %ptr0, i64 %i.08 %v0 = load i7, i7* %arrayidx %arrayidx1 = getelementptr inbounds i7, i7* %ptr1, i64 %i.08 %v1 = load i7, i7* %arrayidx1 %cmp3 = icmp ult i7 %v0, %v1 %inc = add nuw nsw i64 %i.08, 1 br i1 %cmp3, label %for.cond, label %cleanup for.cond: %cmp = icmp ult i64 %inc, 8 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.cond ] ret i1 %res } define i1 @loads_of_not_multiple_of_a_byte(i9* %ptr0, i9* %ptr1) { entry: br label %for.body for.body: %i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ] %arrayidx = getelementptr inbounds i9, i9* %ptr0, i64 %i.08 %v0 = load i9, i9* %arrayidx %arrayidx1 = getelementptr inbounds i9, i9* %ptr1, i64 %i.08 %v1 = load i9, i9* %arrayidx1 %cmp3 = icmp ult i9 %v0, %v1 %inc = add nuw nsw i64 %i.08, 1 br i1 %cmp3, label %for.cond, label %cleanup for.cond: %cmp = icmp ult i64 %inc, 8 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.cond ] ret i1 %res } define i1 @loop_instruction_used_in_phi_node_outside_loop(i8* %ptr0, i8* %ptr1) { entry: br label %for.body for.body: %i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ] %arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08 %v0 = load i8, i8* %arrayidx %arrayidx1 = getelementptr inbounds i8, i8* %ptr1, i64 %i.08 %v1 = load i8, i8* %arrayidx1 %cmp3 = icmp eq i8 %v0, %v1 %inc = add nuw nsw i64 %i.08, 1 br i1 %cmp3, label %for.cond, label %cleanup for.cond: %cmp = icmp ult i64 %inc, 8 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ %cmp3, %for.body ], [ true, %for.cond ] ret i1 %res } define i1 @loop_has_write(i8* %ptr0, i8* %ptr1, i32* %write) { entry: br label %for.body for.body: %i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ] %arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08 %v0 = load i8, i8* %arrayidx %arrayidx1 = getelementptr inbounds i8, i8* %ptr1, i64 %i.08 %v1 = load i8, i8* %arrayidx1 %cmp3 = icmp eq i8 %v0, %v1 %inc = add nuw nsw i64 %i.08, 1 br i1 %cmp3, label %for.cond, label %cleanup for.cond: %cmp = icmp ult i64 %inc, 8 store i32 0, i32* %write br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.cond ] ret i1 %res } declare void @sink() define i1 @loop_has_call(i8* %ptr0, i8* %ptr1, i32* %load) { entry: br label %for.body for.body: %i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ] %arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08 %v0 = load i8, i8* %arrayidx %arrayidx1 = getelementptr inbounds i8, i8* %ptr1, i64 %i.08 %v1 = load i8, i8* %arrayidx1 %cmp3 = icmp eq i8 %v0, %v1 %inc = add nuw nsw i64 %i.08, 1 br i1 %cmp3, label %for.cond, label %cleanup for.cond: %cmp = icmp ult i64 %inc, 8 tail call void @sink() br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.cond ] ret i1 %res } define i1 @loop_has_atomic_load(i8* %ptr0, i8* %ptr1, i32* %load) { entry: br label %for.body for.body: %i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ] %arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08 %v0 = load i8, i8* %arrayidx %arrayidx1 = getelementptr inbounds i8, i8* %ptr1, i64 %i.08 %v1 = load i8, i8* %arrayidx1 %cmp3 = icmp eq i8 %v0, %v1 %inc = add nuw nsw i64 %i.08, 1 br i1 %cmp3, label %for.cond, label %cleanup for.cond: %cmp = icmp ult i64 %inc, 8 %tmp = load atomic i32, i32* %load unordered, align 1 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.cond ] ret i1 %res } define i1 @different_load_step(i8* %ptr) { entry: %add.ptr = getelementptr inbounds i8, i8* %ptr, i64 8 br label %for.body for.body: %i.015 = phi i64 [ 0, %entry ], [ %inc, %for.inc ] %ptr1.014 = phi i8* [ %add.ptr, %entry ], [ %add.ptr3, %for.inc ] %ptr0.013 = phi i8* [ %ptr, %entry ], [ %incdec.ptr, %for.inc ] %v0 = load i8, i8* %ptr0.013 %v1 = load i8, i8* %ptr1.014 %cmp2 = icmp eq i8 %v0, %v1 br i1 %cmp2, label %for.inc, label %cleanup for.inc: %inc = add nuw nsw i64 %i.015, 1 %incdec.ptr = getelementptr inbounds i8, i8* %ptr0.013, i64 1 %add.ptr3 = getelementptr inbounds i8, i8* %ptr1.014, i64 2 %cmp = icmp ult i64 %inc, 16 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.inc ] ret i1 %res } define i1 @step_is_variable(i8* %ptr, i64 %step) { entry: %add.ptr = getelementptr inbounds i8, i8* %ptr, i64 8 br label %for.body for.body: %i.015 = phi i64 [ 0, %entry ], [ %inc, %for.inc ] %ptr1.014 = phi i8* [ %add.ptr, %entry ], [ %add.ptr3, %for.inc ] %ptr0.013 = phi i8* [ %ptr, %entry ], [ %incdec.ptr, %for.inc ] %v0 = load i8, i8* %ptr0.013 %v1 = load i8, i8* %ptr1.014 %cmp2 = icmp eq i8 %v0, %v1 br i1 %cmp2, label %for.inc, label %cleanup for.inc: %inc = add nuw nsw i64 %i.015, %step %incdec.ptr = getelementptr inbounds i8, i8* %ptr0.013, i64 1 %add.ptr3 = getelementptr inbounds i8, i8* %ptr1.014, i64 1 %cmp = icmp ult i64 %inc, 16 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.inc ] ret i1 %res } define i1 @load_step_is_variable(i8* %ptr, i64 %step) { entry: %add.ptr = getelementptr inbounds i8, i8* %ptr, i64 8 br label %for.body for.body: %i.015 = phi i64 [ 0, %entry ], [ %inc, %for.inc ] %ptr1.014 = phi i8* [ %add.ptr, %entry ], [ %add.ptr3, %for.inc ] %ptr0.013 = phi i8* [ %ptr, %entry ], [ %incdec.ptr, %for.inc ] %v0 = load i8, i8* %ptr0.013 %v1 = load i8, i8* %ptr1.014 %cmp2 = icmp eq i8 %v0, %v1 br i1 %cmp2, label %for.inc, label %cleanup for.inc: %inc = add nuw nsw i64 %i.015, 1 %incdec.ptr = getelementptr inbounds i8, i8* %ptr0.013, i64 %step %add.ptr3 = getelementptr inbounds i8, i8* %ptr1.014, i64 %step %cmp = icmp ult i64 %inc, 16 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.inc ] ret i1 %res } define i1 @step_and_load_step_is_variable(i8* %ptr, i64 %step) { entry: %add.ptr = getelementptr inbounds i8, i8* %ptr, i64 8 br label %for.body for.body: %i.015 = phi i64 [ 0, %entry ], [ %inc, %for.inc ] %ptr1.014 = phi i8* [ %add.ptr, %entry ], [ %add.ptr3, %for.inc ] %ptr0.013 = phi i8* [ %ptr, %entry ], [ %incdec.ptr, %for.inc ] %v0 = load i8, i8* %ptr0.013 %v1 = load i8, i8* %ptr1.014 %cmp2 = icmp eq i8 %v0, %v1 br i1 %cmp2, label %for.inc, label %cleanup for.inc: %inc = add nuw nsw i64 %i.015, %step %incdec.ptr = getelementptr inbounds i8, i8* %ptr0.013, i64 %step %add.ptr3 = getelementptr inbounds i8, i8* %ptr1.014, i64 %step %cmp = icmp ult i64 %inc, 16 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.inc ] ret i1 %res } define i1 @load_step_not_affine(i8* %ptr) { entry: %add.ptr = getelementptr inbounds i8, i8* %ptr, i64 8 br label %for.body for.body: %i.018 = phi i64 [ 0, %entry ], [ %inc, %for.inc ] %ptr1.017 = phi i8* [ %add.ptr, %entry ], [ %add.ptr4, %for.inc ] %ptr0.016 = phi i8* [ %ptr, %entry ], [ %add.ptr3, %for.inc ] %v0 = load i8, i8* %ptr0.016 %v1 = load i8, i8* %ptr1.017 %cmp2 = icmp eq i8 %v0, %v1 br i1 %cmp2, label %for.inc, label %cleanup for.inc: %inc = add nuw nsw i64 %i.018, 1 %add.ptr3 = getelementptr inbounds i8, i8* %ptr0.016, i64 %inc %add.ptr4 = getelementptr inbounds i8, i8* %ptr1.017, i64 %inc %cmp = icmp ult i64 %inc, 16 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.inc ] ret i1 %res } define i1 @no_overlap_between_loads(i8* %ptr) { entry: %add.ptr = getelementptr inbounds i8, i8* %ptr, i64 8 br label %for.body for.body: %i.016 = phi i64 [ 0, %entry ], [ %inc, %for.inc ] %ptr1.015 = phi i8* [ %add.ptr, %entry ], [ %add.ptr4, %for.inc ] %ptr0.014 = phi i8* [ %ptr, %entry ], [ %add.ptr3, %for.inc ] %v0 = load i8, i8* %ptr0.014 %v1 = load i8, i8* %ptr1.015 %cmp2 = icmp eq i8 %v0, %v1 br i1 %cmp2, label %for.inc, label %cleanup for.inc: %inc = add nuw nsw i64 %i.016, 1 %add.ptr3 = getelementptr inbounds i8, i8* %ptr0.014, i64 2 %add.ptr4 = getelementptr inbounds i8, i8* %ptr1.015, i64 2 %cmp = icmp ult i64 %inc, 16 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.inc ] ret i1 %res } define i1 @volatile_loads(i8* %ptr) { entry: %add.ptr = getelementptr inbounds i8, i8* %ptr, i64 8 br label %for.body for.body: %i.016 = phi i64 [ 0, %entry ], [ %inc, %for.inc ] %ptr1.015 = phi i8* [ %add.ptr, %entry ], [ %add.ptr4, %for.inc ] %ptr0.014 = phi i8* [ %ptr, %entry ], [ %add.ptr3, %for.inc ] %v0 = load volatile i8, i8* %ptr0.014 %v1 = load volatile i8, i8* %ptr1.015 %cmp2 = icmp eq i8 %v0, %v1 br i1 %cmp2, label %for.inc, label %cleanup for.inc: %inc = add nuw nsw i64 %i.016, 1 %add.ptr3 = getelementptr inbounds i8, i8* %ptr0.014, i64 1 %add.ptr4 = getelementptr inbounds i8, i8* %ptr1.015, i64 1 %cmp = icmp ult i64 %inc, 16 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.inc ] ret i1 %res } define i1 @atomic_loads(i8* %ptr) { entry: %add.ptr = getelementptr inbounds i8, i8* %ptr, i64 8 br label %for.body for.body: %i.016 = phi i64 [ 0, %entry ], [ %inc, %for.inc ] %ptr1.015 = phi i8* [ %add.ptr, %entry ], [ %add.ptr4, %for.inc ] %ptr0.014 = phi i8* [ %ptr, %entry ], [ %add.ptr3, %for.inc ] %v0 = load atomic i8, i8* %ptr0.014 unordered, align 1 %v1 = load atomic i8, i8* %ptr1.015 unordered, align 1 %cmp2 = icmp eq i8 %v0, %v1 br i1 %cmp2, label %for.inc, label %cleanup for.inc: %inc = add nuw nsw i64 %i.016, 1 %add.ptr3 = getelementptr inbounds i8, i8* %ptr0.014, i64 1 %add.ptr4 = getelementptr inbounds i8, i8* %ptr1.015, i64 1 %cmp = icmp ult i64 %inc, 16 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.inc ] ret i1 %res } define i1 @address_space(i8 addrspace(1)* %ptr) { entry: %add.ptr = getelementptr inbounds i8, i8 addrspace(1)* %ptr, i64 8 br label %for.body for.body: %i.016 = phi i64 [ 0, %entry ], [ %inc, %for.inc ] %ptr1.015 = phi i8 addrspace(1)* [ %add.ptr, %entry ], [ %add.ptr4, %for.inc ] %ptr0.014 = phi i8 addrspace(1)* [ %ptr, %entry ], [ %add.ptr3, %for.inc ] %v0 = load i8, i8 addrspace(1)* %ptr0.014 %v1 = load i8, i8 addrspace(1)* %ptr1.015 %cmp2 = icmp eq i8 %v0, %v1 br i1 %cmp2, label %for.inc, label %cleanup for.inc: %inc = add nuw nsw i64 %i.016, 1 %add.ptr3 = getelementptr inbounds i8, i8 addrspace(1)* %ptr0.014, i64 1 %add.ptr4 = getelementptr inbounds i8, i8 addrspace(1)* %ptr1.015, i64 1 %cmp = icmp ult i64 %inc, 16 br i1 %cmp, label %for.body, label %cleanup cleanup: %res = phi i1 [ false, %for.body ], [ true, %for.inc ] ret i1 %res }