; RUN: opt -loop-unroll-and-jam -allow-unroll-and-jam -pass-remarks=loop-unroll < %s -S 2>&1 | FileCheck %s target datalayout = "e-m:e-p:32:32-i64:64-v128:64:128-a:0:32-n32-S64" target triple = "thumbv8m.main-arm-none-eabi" ;; Common check for all tests. None should be unroll and jammed due to profitability ; CHECK-NOT: remark: {{.*}} unroll and jammed ; CHECK-LABEL: unprof1 ; Multiple inner loop blocks define void @unprof1(i32 %I, i32 %J, i32* noalias nocapture %A, i32* noalias nocapture readonly %B) #0 { ; CHECK: %i = phi i32 [ %addinc, %for.latch ], [ 0, %for.outer.preheader ] ; CHECK: %j = phi i32 [ 0, %for.outer ], [ %inc, %for.inner2 ] entry: %cmp = icmp ne i32 %J, 0 %cmp122 = icmp ne i32 %I, 0 %or.cond = and i1 %cmp, %cmp122 br i1 %or.cond, label %for.outer.preheader, label %for.end for.outer.preheader: br label %for.outer for.outer: %i = phi i32 [ %addinc, %for.latch ], [ 0, %for.outer.preheader ] br label %for.inner for.inner: %j = phi i32 [ 0, %for.outer ], [ %inc, %for.inner2 ] %sum1 = phi i32 [ 0, %for.outer ], [ %add, %for.inner2 ] %arrayidx = getelementptr inbounds i32, i32* %B, i32 %j %0 = load i32, i32* %arrayidx, align 4 %add = add i32 %0, %sum1 br label %for.inner2 for.inner2: %inc = add nuw i32 %j, 1 %exitcond = icmp eq i32 %inc, %J br i1 %exitcond, label %for.latch, label %for.inner for.latch: %add.lcssa = phi i32 [ %add, %for.inner2 ] %arrayidx6 = getelementptr inbounds i32, i32* %A, i32 %i store i32 %add.lcssa, i32* %arrayidx6, align 4 %addinc = add nuw i32 %i, 1 %exitcond25 = icmp eq i32 %addinc, %I br i1 %exitcond25, label %for.loopexit, label %for.outer for.loopexit: br label %for.end for.end: ret void } ; CHECK-LABEL: unprof2 ; Constant inner loop count define void @unprof2(i32 %I, i32 %J, i32* noalias nocapture %A, i32* noalias nocapture readonly %B) #0 { ; CHECK: %i = phi i32 [ %addinc, %for.latch ], [ 0, %for.outer.preheader ] ; CHECK: %j = phi i32 [ 0, %for.outer ], [ %inc, %for.inner ] entry: %cmp = icmp ne i32 %J, 0 %cmp122 = icmp ne i32 %I, 0 %or.cond = and i1 %cmp, %cmp122 br i1 %or.cond, label %for.outer.preheader, label %for.end for.outer.preheader: br label %for.outer for.outer: %i = phi i32 [ %addinc, %for.latch ], [ 0, %for.outer.preheader ] br label %for.inner for.inner: %j = phi i32 [ 0, %for.outer ], [ %inc, %for.inner ] %sum1 = phi i32 [ 0, %for.outer ], [ %add, %for.inner ] %arrayidx = getelementptr inbounds i32, i32* %B, i32 %j %0 = load i32, i32* %arrayidx, align 4 %add = add i32 %0, %sum1 %inc = add nuw i32 %j, 1 %exitcond = icmp eq i32 %inc, 10 br i1 %exitcond, label %for.latch, label %for.inner for.latch: %add.lcssa = phi i32 [ %add, %for.inner ] %arrayidx6 = getelementptr inbounds i32, i32* %A, i32 %i store i32 %add.lcssa, i32* %arrayidx6, align 4 %addinc = add nuw i32 %i, 1 %exitcond25 = icmp eq i32 %addinc, %I br i1 %exitcond25, label %for.loopexit, label %for.outer for.loopexit: br label %for.end for.end: ret void } ; CHECK-LABEL: unprof3 ; Complex inner loop define void @unprof3(i32 %I, i32 %J, i32* noalias nocapture %A, i32* noalias nocapture readonly %B) #0 { ; CHECK: %i = phi i32 [ %addinc, %for.latch ], [ 0, %for.outer.preheader ] ; CHECK: %j = phi i32 [ 0, %for.outer ], [ %inc, %for.inner ] entry: %cmp = icmp ne i32 %J, 0 %cmp122 = icmp ne i32 %I, 0 %or.cond = and i1 %cmp, %cmp122 br i1 %or.cond, label %for.outer.preheader, label %for.end for.outer.preheader: br label %for.outer for.outer: %i = phi i32 [ %addinc, %for.latch ], [ 0, %for.outer.preheader ] br label %for.inner for.inner: %j = phi i32 [ 0, %for.outer ], [ %inc, %for.inner ] %sum1 = phi i32 [ 0, %for.outer ], [ %add, %for.inner ] %arrayidx = getelementptr inbounds i32, i32* %B, i32 %j %0 = load i32, i32* %arrayidx, align 4 %add = add i32 %0, %sum1 %add0 = add i32 %0, %sum1 %add1 = add i32 %0, %sum1 %add2 = add i32 %0, %sum1 %add3 = add i32 %0, %sum1 %add4 = add i32 %0, %sum1 %add5 = add i32 %0, %sum1 %add6 = add i32 %0, %sum1 %add7 = add i32 %0, %sum1 %add8 = add i32 %0, %sum1 %add9 = add i32 %0, %sum1 %add10 = add i32 %0, %sum1 %add11 = add i32 %0, %sum1 %add12 = add i32 %0, %sum1 %add13 = add i32 %0, %sum1 %add14 = add i32 %0, %sum1 %add15 = add i32 %0, %sum1 %add16 = add i32 %0, %sum1 %add17 = add i32 %0, %sum1 %add18 = add i32 %0, %sum1 %add19 = add i32 %0, %sum1 %add20 = add i32 %0, %sum1 %add21 = add i32 %0, %sum1 %add22 = add i32 %0, %sum1 %add23 = add i32 %0, %sum1 %add24 = add i32 %0, %sum1 %add25 = add i32 %0, %sum1 %add26 = add i32 %0, %sum1 %add27 = add i32 %0, %sum1 %add28 = add i32 %0, %sum1 %add29 = add i32 %0, %sum1 %inc = add nuw i32 %j, 1 %exitcond = icmp eq i32 %inc, %J br i1 %exitcond, label %for.latch, label %for.inner for.latch: %add.lcssa = phi i32 [ %add, %for.inner ] %arrayidx6 = getelementptr inbounds i32, i32* %A, i32 %i store i32 %add.lcssa, i32* %arrayidx6, align 4 %addinc = add nuw i32 %i, 1 %exitcond25 = icmp eq i32 %addinc, %I br i1 %exitcond25, label %for.loopexit, label %for.outer for.loopexit: br label %for.end for.end: ret void } ; CHECK-LABEL: unprof4 ; No loop invariant loads define void @unprof4(i32 %I, i32 %J, i32* noalias nocapture %A, i32* noalias nocapture readonly %B) #0 { ; CHECK: %i = phi i32 [ %addinc, %for.latch ], [ 0, %for.outer.preheader ] ; CHECK: %j = phi i32 [ 0, %for.outer ], [ %inc, %for.inner ] entry: %cmp = icmp ne i32 %J, 0 %cmp122 = icmp ne i32 %I, 0 %or.cond = and i1 %cmp, %cmp122 br i1 %or.cond, label %for.outer.preheader, label %for.end for.outer.preheader: br label %for.outer for.outer: %i = phi i32 [ %addinc, %for.latch ], [ 0, %for.outer.preheader ] br label %for.inner for.inner: %j = phi i32 [ 0, %for.outer ], [ %inc, %for.inner ] %sum1 = phi i32 [ 0, %for.outer ], [ %add, %for.inner ] %j2 = add i32 %j, %i %arrayidx = getelementptr inbounds i32, i32* %B, i32 %j2 %0 = load i32, i32* %arrayidx, align 4 %add = add i32 %0, %sum1 %inc = add nuw i32 %j, 1 %exitcond = icmp eq i32 %inc, %J br i1 %exitcond, label %for.latch, label %for.inner for.latch: %add.lcssa = phi i32 [ %add, %for.inner ] %arrayidx6 = getelementptr inbounds i32, i32* %A, i32 %i store i32 %add.lcssa, i32* %arrayidx6, align 4 %addinc = add nuw i32 %i, 1 %exitcond25 = icmp eq i32 %addinc, %I br i1 %exitcond25, label %for.loopexit, label %for.outer for.loopexit: br label %for.end for.end: ret void }