[x86] Hoist the zext-lowering up in the v4i32 lowering routine -- it is

the same speed as pshufd but we can fold loads into the pmovzx instructions. This fixes some regressions that came up in the regression test suite for the new vector shuffle lowering. llvm-svn: 218733
author: Chandler Carruth <chandlerc@gmail.com> 2014-10-01 02:25:54 +0000
committer: Chandler Carruth <chandlerc@gmail.com> 2014-10-01 02:25:54 +0000
commit: 846baf2ca1a38e2f9508767cbfa6ff5de6116ef3 (patch)
tree: 2b20d4a1ec9b1bdec3624551cfaf4e5ed6298936 /llvm/test
parent: 4f09cd697cdcd0f55b9d74ef5586ca0ea78c00b5 (diff)
download: bcm5719-llvm-846baf2ca1a38e2f9508767cbfa6ff5de6116ef3.tar.gz
bcm5719-llvm-846baf2ca1a38e2f9508767cbfa6ff5de6116ef3.zip
1 files changed, 20 insertions, 5 deletions
diff --git a/llvm/test/CodeGen/X86/vector-shuffle-128-v4.ll b/llvm/test/CodeGen/X86/vector-shuffle-128-v4.ll
index 080cd439476..948f1d2e47a 100644
--- a/llvm/test/CodeGen/X86/vector-shuffle-128-v4.ll
+++ b/llvm/test/CodeGen/X86/vector-shuffle-128-v4.ll
@@ -937,14 +937,29 @@ define <4 x i32> @shuffle_v4i32_3456(<4 x i32> %a, <4 x i32> %b) {
 }
 
 define <4 x i32> @shuffle_v4i32_0u1u(<4 x i32> %a, <4 x i32> %b) {
-; SSE-LABEL: shuffle_v4i32_0u1u:
-; SSE:       # BB#0:
-; SSE-NEXT:    pshufd {{.*#+}} xmm0 = xmm0[0,0,1,1]
-; SSE-NEXT:    retq
+; SSE2-LABEL: shuffle_v4i32_0u1u:
+; SSE2:       # BB#0:
+; SSE2-NEXT:    pshufd {{.*#+}} xmm0 = xmm0[0,1,1,3]
+; SSE2-NEXT:    retq
+;
+; SSE3-LABEL: shuffle_v4i32_0u1u:
+; SSE3:       # BB#0:
+; SSE3-NEXT:    pshufd {{.*#+}} xmm0 = xmm0[0,1,1,3]
+; SSE3-NEXT:    retq
+;
+; SSSE3-LABEL: shuffle_v4i32_0u1u:
+; SSSE3:       # BB#0:
+; SSSE3-NEXT:    pshufd {{.*#+}} xmm0 = xmm0[0,1,1,3]
+; SSSE3-NEXT:    retq
+;
+; SSE41-LABEL: shuffle_v4i32_0u1u:
+; SSE41:       # BB#0:
+; SSE41-NEXT:    pmovzxdq %xmm0, %xmm0
+; SSE41-NEXT:    retq
 ;
 ; AVX-LABEL: shuffle_v4i32_0u1u:
 ; AVX:       # BB#0:
-; AVX-NEXT:    vpshufd {{.*#+}} xmm0 = xmm0[0,0,1,1]
+; AVX-NEXT:    vpmovzxdq %xmm0, %xmm0
 ; AVX-NEXT:    retq
   %shuffle = shufflevector <4 x i32> %a, <4 x i32> %b, <4 x i32> <i32 0, i32 undef, i32 1, i32 undef>
   ret <4 x i32> %shuffle
author	Chandler Carruth <chandlerc@gmail.com>	2014-10-01 02:25:54 +0000
committer	Chandler Carruth <chandlerc@gmail.com>	2014-10-01 02:25:54 +0000
commit	846baf2ca1a38e2f9508767cbfa6ff5de6116ef3 (patch)
tree	2b20d4a1ec9b1bdec3624551cfaf4e5ed6298936 /llvm/test
parent	4f09cd697cdcd0f55b9d74ef5586ca0ea78c00b5 (diff)
download	bcm5719-llvm-846baf2ca1a38e2f9508767cbfa6ff5de6116ef3.tar.gz bcm5719-llvm-846baf2ca1a38e2f9508767cbfa6ff5de6116ef3.zip