diff options
| author | Krzysztof Parzyszek <kparzysz@codeaurora.org> | 2018-05-09 21:10:41 +0000 |
|---|---|---|
| committer | Krzysztof Parzyszek <kparzysz@codeaurora.org> | 2018-05-09 21:10:41 +0000 |
| commit | cff73a211802895f4d525ffc37cf53f4b7df1f15 (patch) | |
| tree | 9d42a86cb04903a158e14c8c79b41db7466c716f /llvm/test/CodeGen/Hexagon/autohvx/shift-64b.ll | |
| parent | 74fd7600d2120476729c4290f86118ea3bba5b69 (diff) | |
| download | bcm5719-llvm-cff73a211802895f4d525ffc37cf53f4b7df1f15.tar.gz bcm5719-llvm-cff73a211802895f4d525ffc37cf53f4b7df1f15.zip | |
[Hexagon] Add patterns for vector shift-and-accumulate
llvm-svn: 331918
Diffstat (limited to 'llvm/test/CodeGen/Hexagon/autohvx/shift-64b.ll')
| -rw-r--r-- | llvm/test/CodeGen/Hexagon/autohvx/shift-64b.ll | 177 |
1 files changed, 33 insertions, 144 deletions
diff --git a/llvm/test/CodeGen/Hexagon/autohvx/shift-64b.ll b/llvm/test/CodeGen/Hexagon/autohvx/shift-64b.ll index a43a854aac7..678a97cbf6e 100644 --- a/llvm/test/CodeGen/Hexagon/autohvx/shift-64b.ll +++ b/llvm/test/CodeGen/Hexagon/autohvx/shift-64b.ll @@ -4,38 +4,9 @@ ; CHECK: v0.h = vasl(v0.h,r0) define <32 x i16> @test0000(<32 x i16> %a0, i16 %a1) #0 { %b0 = insertelement <32 x i16> zeroinitializer, i16 %a1, i32 0 - %b1 = insertelement <32 x i16> %b0, i16 %a1, i32 1 - %b2 = insertelement <32 x i16> %b1, i16 %a1, i32 2 - %b3 = insertelement <32 x i16> %b2, i16 %a1, i32 3 - %b4 = insertelement <32 x i16> %b3, i16 %a1, i32 4 - %b5 = insertelement <32 x i16> %b4, i16 %a1, i32 5 - %b6 = insertelement <32 x i16> %b5, i16 %a1, i32 6 - %b7 = insertelement <32 x i16> %b6, i16 %a1, i32 7 - %b8 = insertelement <32 x i16> %b7, i16 %a1, i32 8 - %b9 = insertelement <32 x i16> %b8, i16 %a1, i32 9 - %b10 = insertelement <32 x i16> %b9, i16 %a1, i32 10 - %b11 = insertelement <32 x i16> %b10, i16 %a1, i32 11 - %b12 = insertelement <32 x i16> %b11, i16 %a1, i32 12 - %b13 = insertelement <32 x i16> %b12, i16 %a1, i32 13 - %b14 = insertelement <32 x i16> %b13, i16 %a1, i32 14 - %b15 = insertelement <32 x i16> %b14, i16 %a1, i32 15 - %b16 = insertelement <32 x i16> %b15, i16 %a1, i32 16 - %b17 = insertelement <32 x i16> %b16, i16 %a1, i32 17 - %b18 = insertelement <32 x i16> %b17, i16 %a1, i32 18 - %b19 = insertelement <32 x i16> %b18, i16 %a1, i32 19 - %b20 = insertelement <32 x i16> %b19, i16 %a1, i32 20 - %b21 = insertelement <32 x i16> %b20, i16 %a1, i32 21 - %b22 = insertelement <32 x i16> %b21, i16 %a1, i32 22 - %b23 = insertelement <32 x i16> %b22, i16 %a1, i32 23 - %b24 = insertelement <32 x i16> %b23, i16 %a1, i32 24 - %b25 = insertelement <32 x i16> %b24, i16 %a1, i32 25 - %b26 = insertelement <32 x i16> %b25, i16 %a1, i32 26 - %b27 = insertelement <32 x i16> %b26, i16 %a1, i32 27 - %b28 = insertelement <32 x i16> %b27, i16 %a1, i32 28 - %b29 = insertelement <32 x i16> %b28, i16 %a1, i32 29 - %b30 = insertelement <32 x i16> %b29, i16 %a1, i32 30 - %b31 = insertelement <32 x i16> %b30, i16 %a1, i32 31 - %v0 = shl <32 x i16> %a0, %b31 + %b1 = shufflevector <32 x i16> %b0, <32 x i16> undef, <32 x i32> zeroinitializer + + %v0 = shl <32 x i16> %a0, %b1 ret <32 x i16> %v0 } @@ -43,38 +14,8 @@ define <32 x i16> @test0000(<32 x i16> %a0, i16 %a1) #0 { ; CHECK: v0.h = vasr(v0.h,r0) define <32 x i16> @test0001(<32 x i16> %a0, i16 %a1) #0 { %b0 = insertelement <32 x i16> zeroinitializer, i16 %a1, i32 0 - %b1 = insertelement <32 x i16> %b0, i16 %a1, i32 1 - %b2 = insertelement <32 x i16> %b1, i16 %a1, i32 2 - %b3 = insertelement <32 x i16> %b2, i16 %a1, i32 3 - %b4 = insertelement <32 x i16> %b3, i16 %a1, i32 4 - %b5 = insertelement <32 x i16> %b4, i16 %a1, i32 5 - %b6 = insertelement <32 x i16> %b5, i16 %a1, i32 6 - %b7 = insertelement <32 x i16> %b6, i16 %a1, i32 7 - %b8 = insertelement <32 x i16> %b7, i16 %a1, i32 8 - %b9 = insertelement <32 x i16> %b8, i16 %a1, i32 9 - %b10 = insertelement <32 x i16> %b9, i16 %a1, i32 10 - %b11 = insertelement <32 x i16> %b10, i16 %a1, i32 11 - %b12 = insertelement <32 x i16> %b11, i16 %a1, i32 12 - %b13 = insertelement <32 x i16> %b12, i16 %a1, i32 13 - %b14 = insertelement <32 x i16> %b13, i16 %a1, i32 14 - %b15 = insertelement <32 x i16> %b14, i16 %a1, i32 15 - %b16 = insertelement <32 x i16> %b15, i16 %a1, i32 16 - %b17 = insertelement <32 x i16> %b16, i16 %a1, i32 17 - %b18 = insertelement <32 x i16> %b17, i16 %a1, i32 18 - %b19 = insertelement <32 x i16> %b18, i16 %a1, i32 19 - %b20 = insertelement <32 x i16> %b19, i16 %a1, i32 20 - %b21 = insertelement <32 x i16> %b20, i16 %a1, i32 21 - %b22 = insertelement <32 x i16> %b21, i16 %a1, i32 22 - %b23 = insertelement <32 x i16> %b22, i16 %a1, i32 23 - %b24 = insertelement <32 x i16> %b23, i16 %a1, i32 24 - %b25 = insertelement <32 x i16> %b24, i16 %a1, i32 25 - %b26 = insertelement <32 x i16> %b25, i16 %a1, i32 26 - %b27 = insertelement <32 x i16> %b26, i16 %a1, i32 27 - %b28 = insertelement <32 x i16> %b27, i16 %a1, i32 28 - %b29 = insertelement <32 x i16> %b28, i16 %a1, i32 29 - %b30 = insertelement <32 x i16> %b29, i16 %a1, i32 30 - %b31 = insertelement <32 x i16> %b30, i16 %a1, i32 31 - %v0 = ashr <32 x i16> %a0, %b31 + %b1 = shufflevector <32 x i16> %b0, <32 x i16> undef, <32 x i32> zeroinitializer + %v0 = ashr <32 x i16> %a0, %b1 ret <32 x i16> %v0 } @@ -82,38 +23,8 @@ define <32 x i16> @test0001(<32 x i16> %a0, i16 %a1) #0 { ; CHECK: v0.uh = vlsr(v0.uh,r0) define <32 x i16> @test0002(<32 x i16> %a0, i16 %a1) #0 { %b0 = insertelement <32 x i16> zeroinitializer, i16 %a1, i32 0 - %b1 = insertelement <32 x i16> %b0, i16 %a1, i32 1 - %b2 = insertelement <32 x i16> %b1, i16 %a1, i32 2 - %b3 = insertelement <32 x i16> %b2, i16 %a1, i32 3 - %b4 = insertelement <32 x i16> %b3, i16 %a1, i32 4 - %b5 = insertelement <32 x i16> %b4, i16 %a1, i32 5 - %b6 = insertelement <32 x i16> %b5, i16 %a1, i32 6 - %b7 = insertelement <32 x i16> %b6, i16 %a1, i32 7 - %b8 = insertelement <32 x i16> %b7, i16 %a1, i32 8 - %b9 = insertelement <32 x i16> %b8, i16 %a1, i32 9 - %b10 = insertelement <32 x i16> %b9, i16 %a1, i32 10 - %b11 = insertelement <32 x i16> %b10, i16 %a1, i32 11 - %b12 = insertelement <32 x i16> %b11, i16 %a1, i32 12 - %b13 = insertelement <32 x i16> %b12, i16 %a1, i32 13 - %b14 = insertelement <32 x i16> %b13, i16 %a1, i32 14 - %b15 = insertelement <32 x i16> %b14, i16 %a1, i32 15 - %b16 = insertelement <32 x i16> %b15, i16 %a1, i32 16 - %b17 = insertelement <32 x i16> %b16, i16 %a1, i32 17 - %b18 = insertelement <32 x i16> %b17, i16 %a1, i32 18 - %b19 = insertelement <32 x i16> %b18, i16 %a1, i32 19 - %b20 = insertelement <32 x i16> %b19, i16 %a1, i32 20 - %b21 = insertelement <32 x i16> %b20, i16 %a1, i32 21 - %b22 = insertelement <32 x i16> %b21, i16 %a1, i32 22 - %b23 = insertelement <32 x i16> %b22, i16 %a1, i32 23 - %b24 = insertelement <32 x i16> %b23, i16 %a1, i32 24 - %b25 = insertelement <32 x i16> %b24, i16 %a1, i32 25 - %b26 = insertelement <32 x i16> %b25, i16 %a1, i32 26 - %b27 = insertelement <32 x i16> %b26, i16 %a1, i32 27 - %b28 = insertelement <32 x i16> %b27, i16 %a1, i32 28 - %b29 = insertelement <32 x i16> %b28, i16 %a1, i32 29 - %b30 = insertelement <32 x i16> %b29, i16 %a1, i32 30 - %b31 = insertelement <32 x i16> %b30, i16 %a1, i32 31 - %v0 = lshr <32 x i16> %a0, %b31 + %b1 = shufflevector <32 x i16> %b0, <32 x i16> undef, <32 x i32> zeroinitializer + %v0 = lshr <32 x i16> %a0, %b1 ret <32 x i16> %v0 } @@ -121,22 +32,8 @@ define <32 x i16> @test0002(<32 x i16> %a0, i16 %a1) #0 { ; CHECK: v0.w = vasl(v0.w,r0) define <16 x i32> @test0010(<16 x i32> %a0, i32 %a1) #0 { %b0 = insertelement <16 x i32> zeroinitializer, i32 %a1, i32 0 - %b1 = insertelement <16 x i32> %b0, i32 %a1, i32 1 - %b2 = insertelement <16 x i32> %b1, i32 %a1, i32 2 - %b3 = insertelement <16 x i32> %b2, i32 %a1, i32 3 - %b4 = insertelement <16 x i32> %b3, i32 %a1, i32 4 - %b5 = insertelement <16 x i32> %b4, i32 %a1, i32 5 - %b6 = insertelement <16 x i32> %b5, i32 %a1, i32 6 - %b7 = insertelement <16 x i32> %b6, i32 %a1, i32 7 - %b8 = insertelement <16 x i32> %b7, i32 %a1, i32 8 - %b9 = insertelement <16 x i32> %b8, i32 %a1, i32 9 - %b10 = insertelement <16 x i32> %b9, i32 %a1, i32 10 - %b11 = insertelement <16 x i32> %b10, i32 %a1, i32 11 - %b12 = insertelement <16 x i32> %b11, i32 %a1, i32 12 - %b13 = insertelement <16 x i32> %b12, i32 %a1, i32 13 - %b14 = insertelement <16 x i32> %b13, i32 %a1, i32 14 - %b15 = insertelement <16 x i32> %b14, i32 %a1, i32 15 - %v0 = shl <16 x i32> %a0, %b15 + %b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer + %v0 = shl <16 x i32> %a0, %b1 ret <16 x i32> %v0 } @@ -144,22 +41,8 @@ define <16 x i32> @test0010(<16 x i32> %a0, i32 %a1) #0 { ; CHECK: v0.w = vasr(v0.w,r0) define <16 x i32> @test0011(<16 x i32> %a0, i32 %a1) #0 { %b0 = insertelement <16 x i32> zeroinitializer, i32 %a1, i32 0 - %b1 = insertelement <16 x i32> %b0, i32 %a1, i32 1 - %b2 = insertelement <16 x i32> %b1, i32 %a1, i32 2 - %b3 = insertelement <16 x i32> %b2, i32 %a1, i32 3 - %b4 = insertelement <16 x i32> %b3, i32 %a1, i32 4 - %b5 = insertelement <16 x i32> %b4, i32 %a1, i32 5 - %b6 = insertelement <16 x i32> %b5, i32 %a1, i32 6 - %b7 = insertelement <16 x i32> %b6, i32 %a1, i32 7 - %b8 = insertelement <16 x i32> %b7, i32 %a1, i32 8 - %b9 = insertelement <16 x i32> %b8, i32 %a1, i32 9 - %b10 = insertelement <16 x i32> %b9, i32 %a1, i32 10 - %b11 = insertelement <16 x i32> %b10, i32 %a1, i32 11 - %b12 = insertelement <16 x i32> %b11, i32 %a1, i32 12 - %b13 = insertelement <16 x i32> %b12, i32 %a1, i32 13 - %b14 = insertelement <16 x i32> %b13, i32 %a1, i32 14 - %b15 = insertelement <16 x i32> %b14, i32 %a1, i32 15 - %v0 = ashr <16 x i32> %a0, %b15 + %b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer + %v0 = ashr <16 x i32> %a0, %b1 ret <16 x i32> %v0 } @@ -167,25 +50,31 @@ define <16 x i32> @test0011(<16 x i32> %a0, i32 %a1) #0 { ; CHECK: v0.uw = vlsr(v0.uw,r0) define <16 x i32> @test0012(<16 x i32> %a0, i32 %a1) #0 { %b0 = insertelement <16 x i32> zeroinitializer, i32 %a1, i32 0 - %b1 = insertelement <16 x i32> %b0, i32 %a1, i32 1 - %b2 = insertelement <16 x i32> %b1, i32 %a1, i32 2 - %b3 = insertelement <16 x i32> %b2, i32 %a1, i32 3 - %b4 = insertelement <16 x i32> %b3, i32 %a1, i32 4 - %b5 = insertelement <16 x i32> %b4, i32 %a1, i32 5 - %b6 = insertelement <16 x i32> %b5, i32 %a1, i32 6 - %b7 = insertelement <16 x i32> %b6, i32 %a1, i32 7 - %b8 = insertelement <16 x i32> %b7, i32 %a1, i32 8 - %b9 = insertelement <16 x i32> %b8, i32 %a1, i32 9 - %b10 = insertelement <16 x i32> %b9, i32 %a1, i32 10 - %b11 = insertelement <16 x i32> %b10, i32 %a1, i32 11 - %b12 = insertelement <16 x i32> %b11, i32 %a1, i32 12 - %b13 = insertelement <16 x i32> %b12, i32 %a1, i32 13 - %b14 = insertelement <16 x i32> %b13, i32 %a1, i32 14 - %b15 = insertelement <16 x i32> %b14, i32 %a1, i32 15 - %v0 = lshr <16 x i32> %a0, %b15 + %b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer + %v0 = lshr <16 x i32> %a0, %b1 ret <16 x i32> %v0 } +; CHECK-LABEL: test0013: +; CHECK: v0.w += vasl(v1.w,r0) +define <16 x i32> @test0013(<16 x i32> %a0, <16 x i32> %a1, i32 %a2) #0 { + %b0 = insertelement <16 x i32> zeroinitializer, i32 %a2, i32 0 + %b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer + %v0 = shl <16 x i32> %a1, %b1 + %v1 = add <16 x i32> %a0, %v0 + ret <16 x i32> %v1 +} + +; CHECK-LABEL: test0014: +; CHECK: v0.w += vasr(v1.w,r0) +define <16 x i32> @test0014(<16 x i32> %a0, <16 x i32> %a1, i32 %a2) #0 { + %b0 = insertelement <16 x i32> zeroinitializer, i32 %a2, i32 0 + %b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer + %v0 = ashr <16 x i32> %a1, %b1 + %v1 = add <16 x i32> %a0, %v0 + ret <16 x i32> %v1 +} + ; CHECK-LABEL: test0020: ; CHECK: v0.h = vasl(v0.h,v1.h) define <32 x i16> @test0020(<32 x i16> %a0, <32 x i16> %a1) #0 { |

