[X86] Reimplement r321437 using custom lowering instead of as a DAG combine.

My original implementation ran as a DAG combine post type legalization, but it turns out we don't run that DAG combine step if type legalization didn't change anything. Attempts to make the combine run before type legalization as well hit other issues. So just do it in LowerMUL where we can catch more cases. llvm-svn: 321496
author: Craig Topper <craig.topper@intel.com> 2017-12-27 19:09:40 +0000
committer: Craig Topper <craig.topper@intel.com> 2017-12-27 19:09:40 +0000
commit: 72bbbeb2a724583493f2c01c413f8944332ededd (patch)
tree: 85bec9bc91629970dddb39f9ca18aee393fa7b28 /llvm/test/CodeGen
parent: fab20e4ea4a4ad6a1b2ce6ac0c3ec4e9f9adbbf9 (diff)
download: bcm5719-llvm-72bbbeb2a724583493f2c01c413f8944332ededd.tar.gz
bcm5719-llvm-72bbbeb2a724583493f2c01c413f8944332ededd.zip
1 files changed, 2 insertions, 2 deletions
diff --git a/llvm/test/CodeGen/X86/combine-pmuldq.ll b/llvm/test/CodeGen/X86/combine-pmuldq.ll
index 0c7b8d6f4c5..ebfe0d56358 100644
--- a/llvm/test/CodeGen/X86/combine-pmuldq.ll
+++ b/llvm/test/CodeGen/X86/combine-pmuldq.ll
@@ -90,7 +90,7 @@ define <2 x i64> @combine_shuffle_zero_pmuludq(<4 x i32> %a0, <4 x i32> %a1) {
 ; AVX512DQVL-NEXT:    vpxor %xmm2, %xmm2, %xmm2
 ; AVX512DQVL-NEXT:    vpblendd {{.*#+}} xmm0 = xmm0[0],xmm2[1],xmm0[2],xmm2[3]
 ; AVX512DQVL-NEXT:    vpblendd {{.*#+}} xmm1 = xmm1[0],xmm2[1],xmm1[2],xmm2[3]
-; AVX512DQVL-NEXT:    vpmullq %xmm1, %xmm0, %xmm0
+; AVX512DQVL-NEXT:    vpmuludq %xmm1, %xmm0, %xmm0
 ; AVX512DQVL-NEXT:    retq
   %1 = shufflevector <4 x i32> %a0, <4 x i32> zeroinitializer, <4 x i32> <i32 0, i32 5, i32 2, i32 7>
   %2 = shufflevector <4 x i32> %a1, <4 x i32> zeroinitializer, <4 x i32> <i32 0, i32 5, i32 2, i32 7>
@@ -134,7 +134,7 @@ define <4 x i64> @combine_shuffle_zero_pmuludq_256(<8 x i32> %a0, <8 x i32> %a1)
 ; AVX512DQVL-NEXT:    vpxor %xmm2, %xmm2, %xmm2
 ; AVX512DQVL-NEXT:    vpblendd {{.*#+}} ymm0 = ymm0[0],ymm2[1],ymm0[2],ymm2[3],ymm0[4],ymm2[5],ymm0[6],ymm2[7]
 ; AVX512DQVL-NEXT:    vpblendd {{.*#+}} ymm1 = ymm1[0],ymm2[1],ymm1[2],ymm2[3],ymm1[4],ymm2[5],ymm1[6],ymm2[7]
-; AVX512DQVL-NEXT:    vpmullq %ymm1, %ymm0, %ymm0
+; AVX512DQVL-NEXT:    vpmuludq %ymm1, %ymm0, %ymm0
 ; AVX512DQVL-NEXT:    retq
   %1 = shufflevector <8 x i32> %a0, <8 x i32> zeroinitializer, <8 x i32> <i32 0, i32 9, i32 2, i32 11, i32 4, i32 13, i32 6, i32 15>
   %2 = shufflevector <8 x i32> %a1, <8 x i32> zeroinitializer, <8 x i32> <i32 0, i32 9, i32 2, i32 11, i32 4, i32 13, i32 6, i32 15>
author	Craig Topper <craig.topper@intel.com>	2017-12-27 19:09:40 +0000
committer	Craig Topper <craig.topper@intel.com>	2017-12-27 19:09:40 +0000
commit	72bbbeb2a724583493f2c01c413f8944332ededd (patch)
tree	85bec9bc91629970dddb39f9ca18aee393fa7b28 /llvm/test/CodeGen
parent	fab20e4ea4a4ad6a1b2ce6ac0c3ec4e9f9adbbf9 (diff)
download	bcm5719-llvm-72bbbeb2a724583493f2c01c413f8944332ededd.tar.gz bcm5719-llvm-72bbbeb2a724583493f2c01c413f8944332ededd.zip