diff options
author | Craig Topper <craig.topper@intel.com> | 2018-05-29 03:26:38 +0000 |
---|---|---|
committer | Craig Topper <craig.topper@intel.com> | 2018-05-29 03:26:38 +0000 |
commit | 68a272d501ee12bb54553aebb1eb5877ce42df0c (patch) | |
tree | 62dbe5fca0e6f3491f0c5c42e20b6101f03e2b73 /clang/test/CodeGen | |
parent | 2adc7d956cb7b5ca971e1ac0aa85b2c40d7b2138 (diff) | |
download | bcm5719-llvm-68a272d501ee12bb54553aebb1eb5877ce42df0c.tar.gz bcm5719-llvm-68a272d501ee12bb54553aebb1eb5877ce42df0c.zip |
[X86] Merge the 3 different flavors of masked vpermi2var/vpermt2var builtins to a single version without masking. Use select builtins with appropriate operand instead.
llvm-svn: 333387
Diffstat (limited to 'clang/test/CodeGen')
-rw-r--r-- | clang/test/CodeGen/avx512bw-builtins.c | 11 | ||||
-rw-r--r-- | clang/test/CodeGen/avx512f-builtins.c | 52 | ||||
-rw-r--r-- | clang/test/CodeGen/avx512vbmi-builtins.c | 11 | ||||
-rw-r--r-- | clang/test/CodeGen/avx512vbmivl-builtin.c | 22 | ||||
-rw-r--r-- | clang/test/CodeGen/avx512vl-builtins.c | 88 | ||||
-rw-r--r-- | clang/test/CodeGen/avx512vlbw-builtins.c | 22 |
6 files changed, 136 insertions, 70 deletions
diff --git a/clang/test/CodeGen/avx512bw-builtins.c b/clang/test/CodeGen/avx512bw-builtins.c index d5c19939980..19eb571305f 100644 --- a/clang/test/CodeGen/avx512bw-builtins.c +++ b/clang/test/CodeGen/avx512bw-builtins.c @@ -963,22 +963,25 @@ __m512i test_mm512_maskz_subs_epu16(__mmask32 __U, __m512i __A, __m512i __B) { } __m512i test_mm512_mask2_permutex2var_epi16(__m512i __A, __m512i __I, __mmask32 __U, __m512i __B) { // CHECK-LABEL: @test_mm512_mask2_permutex2var_epi16 - // CHECK: @llvm.x86.avx512.mask.vpermi2var.hi.512 + // CHECK: @llvm.x86.avx512.vpermi2var.hi.512 + // CHECK: select <32 x i1> %{{.*}}, <32 x i16> %{{.*}}, <32 x i16> %{{.*}} return _mm512_mask2_permutex2var_epi16(__A,__I,__U,__B); } __m512i test_mm512_permutex2var_epi16(__m512i __A, __m512i __I, __m512i __B) { // CHECK-LABEL: @test_mm512_permutex2var_epi16 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.hi.512 + // CHECK: @llvm.x86.avx512.vpermi2var.hi.512 return _mm512_permutex2var_epi16(__A,__I,__B); } __m512i test_mm512_mask_permutex2var_epi16(__m512i __A, __mmask32 __U, __m512i __I, __m512i __B) { // CHECK-LABEL: @test_mm512_mask_permutex2var_epi16 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.hi.512 + // CHECK: @llvm.x86.avx512.vpermi2var.hi.512 + // CHECK: select <32 x i1> %{{.*}}, <32 x i16> %{{.*}}, <32 x i16> %{{.*}} return _mm512_mask_permutex2var_epi16(__A,__U,__I,__B); } __m512i test_mm512_maskz_permutex2var_epi16(__mmask32 __U, __m512i __A, __m512i __I, __m512i __B) { // CHECK-LABEL: @test_mm512_maskz_permutex2var_epi16 - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.hi.512 + // CHECK: @llvm.x86.avx512.vpermi2var.hi.512 + // CHECK: select <32 x i1> %{{.*}}, <32 x i16> %{{.*}}, <32 x i16> %{{.*}} return _mm512_maskz_permutex2var_epi16(__U,__A,__I,__B); } diff --git a/clang/test/CodeGen/avx512f-builtins.c b/clang/test/CodeGen/avx512f-builtins.c index f324ebe1cec..ee4dd528e1f 100644 --- a/clang/test/CodeGen/avx512f-builtins.c +++ b/clang/test/CodeGen/avx512f-builtins.c @@ -3246,7 +3246,8 @@ unsigned long long test_mm_cvt_roundsd_si64(__m128d __A) { #endif __m512i test_mm512_mask2_permutex2var_epi32(__m512i __A, __m512i __I, __mmask16 __U, __m512i __B) { // CHECK-LABEL: @test_mm512_mask2_permutex2var_epi32 - // CHECK: @llvm.x86.avx512.mask.vpermi2var.d.512 + // CHECK: @llvm.x86.avx512.vpermi2var.d.512 + // CHECK: select <16 x i1> %{{.*}}, <16 x i32> %{{.*}}, <16 x i32> %{{.*}} return _mm512_mask2_permutex2var_epi32(__A, __I, __U, __B); } __m512i test_mm512_unpackhi_epi32(__m512i __A, __m512i __B) { @@ -3270,7 +3271,8 @@ long long test_mm_cvt_roundsd_i64(__m128d __A) { #endif __m512d test_mm512_mask2_permutex2var_pd(__m512d __A, __m512i __I, __mmask8 __U, __m512d __B) { // CHECK-LABEL: @test_mm512_mask2_permutex2var_pd - // CHECK: @llvm.x86.avx512.mask.vpermi2var.pd.512 + // CHECK: @llvm.x86.avx512.vpermi2var.pd.512 + // CHECK: select <8 x i1> %{{.*}}, <8 x double> %{{.*}}, <8 x double> %{{.*}} return _mm512_mask2_permutex2var_pd(__A, __I, __U, __B); } __m512i test_mm512_mask_unpackhi_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B) { @@ -3738,13 +3740,15 @@ __m256i test_mm512_maskz_cvt_roundpd_epu32(__mmask8 U, __m512d A) __m512 test_mm512_mask2_permutex2var_ps(__m512 __A, __m512i __I, __mmask16 __U, __m512 __B) { // CHECK-LABEL: @test_mm512_mask2_permutex2var_ps - // CHECK: @llvm.x86.avx512.mask.vpermi2var.ps.512 + // CHECK: @llvm.x86.avx512.vpermi2var.ps.512 + // CHECK: select <16 x i1> %{{.*}}, <16 x float> %{{.*}}, <16 x float> %{{.*}} return _mm512_mask2_permutex2var_ps(__A, __I, __U, __B); } __m512i test_mm512_mask2_permutex2var_epi64(__m512i __A, __m512i __I, __mmask8 __U, __m512i __B) { // CHECK-LABEL: @test_mm512_mask2_permutex2var_epi64 - // CHECK: @llvm.x86.avx512.mask.vpermi2var.q.512 + // CHECK: @llvm.x86.avx512.vpermi2var.q.512 + // CHECK: select <8 x i1> %{{.*}}, <8 x i64> %{{.*}}, <8 x i64> %{{.*}} return _mm512_mask2_permutex2var_epi64(__A, __I, __U, __B); } @@ -3828,68 +3832,88 @@ __m512 test_mm512_maskz_permutevar_ps(__mmask16 __U, __m512 __A, __m512i __C) { return _mm512_maskz_permutevar_ps(__U, __A, __C); } +__m512i test_mm512_permutex2var_epi32(__m512i __A, __m512i __I, __m512i __B) { + // CHECK-LABEL: @test_mm512_permutex2var_epi32 + // CHECK: @llvm.x86.avx512.vpermi2var.d.512 + return _mm512_permutex2var_epi32(__A, __I, __B); +} + __m512i test_mm512_maskz_permutex2var_epi32(__mmask16 __U, __m512i __A, __m512i __I, __m512i __B) { // CHECK-LABEL: @test_mm512_maskz_permutex2var_epi32 - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.d.512 + // CHECK: @llvm.x86.avx512.vpermi2var.d.512 + // CHECK: select <16 x i1> %{{.*}}, <16 x i32> %{{.*}}, <16 x i32> %{{.*}} return _mm512_maskz_permutex2var_epi32(__U, __A, __I, __B); } __m512i test_mm512_mask_permutex2var_epi32 (__m512i __A, __mmask16 __U, __m512i __I, __m512i __B) { // CHECK-LABEL: @test_mm512_mask_permutex2var_epi32 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.d.512 + // CHECK: @llvm.x86.avx512.vpermi2var.d.512 + // CHECK: select <16 x i1> %{{.*}}, <16 x i32> %{{.*}}, <16 x i32> %{{.*}} return _mm512_mask_permutex2var_epi32 (__A,__U,__I,__B); } __m512d test_mm512_permutex2var_pd (__m512d __A, __m512i __I, __m512d __B) { // CHECK-LABEL: @test_mm512_permutex2var_pd - // CHECK: @llvm.x86.avx512.mask.vpermt2var.pd.512 + // CHECK: @llvm.x86.avx512.vpermi2var.pd.512 return _mm512_permutex2var_pd (__A, __I,__B); } __m512d test_mm512_mask_permutex2var_pd (__m512d __A, __mmask8 __U, __m512i __I, __m512d __B) { // CHECK-LABEL: @test_mm512_mask_permutex2var_pd - // CHECK: @llvm.x86.avx512.mask.vpermt2var.pd.512 + // CHECK: @llvm.x86.avx512.vpermi2var.pd.512 + // CHECK: select <8 x i1> %{{.*}}, <8 x double> %{{.*}}, <8 x double> %{{.*}} return _mm512_mask_permutex2var_pd (__A,__U,__I,__B); } __m512d test_mm512_maskz_permutex2var_pd(__mmask8 __U, __m512d __A, __m512i __I, __m512d __B) { // CHECK-LABEL: @test_mm512_maskz_permutex2var_pd - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.pd.512 + // CHECK: @llvm.x86.avx512.vpermi2var.pd.512 + // CHECK: select <8 x i1> %{{.*}}, <8 x double> %{{.*}}, <8 x double> %{{.*}} return _mm512_maskz_permutex2var_pd(__U, __A, __I, __B); } __m512 test_mm512_permutex2var_ps (__m512 __A, __m512i __I, __m512 __B) { // CHECK-LABEL: @test_mm512_permutex2var_ps - // CHECK: @llvm.x86.avx512.mask.vpermt2var.ps.512 + // CHECK: @llvm.x86.avx512.vpermi2var.ps.512 return _mm512_permutex2var_ps (__A, __I, __B); } __m512 test_mm512_mask_permutex2var_ps (__m512 __A, __mmask16 __U, __m512i __I, __m512 __B) { // CHECK-LABEL: @test_mm512_mask_permutex2var_ps - // CHECK: @llvm.x86.avx512.mask.vpermt2var.ps.512 + // CHECK: @llvm.x86.avx512.vpermi2var.ps.512 + // CHECK: select <16 x i1> %{{.*}}, <16 x float> %{{.*}}, <16 x float> %{{.*}} return _mm512_mask_permutex2var_ps (__A,__U,__I,__B); } __m512 test_mm512_maskz_permutex2var_ps(__mmask16 __U, __m512 __A, __m512i __I, __m512 __B) { // CHECK-LABEL: @test_mm512_maskz_permutex2var_ps - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.ps.512 + // CHECK: @llvm.x86.avx512.vpermi2var.ps.512 + // CHECK: select <16 x i1> %{{.*}}, <16 x float> %{{.*}}, <16 x float> %{{.*}} return _mm512_maskz_permutex2var_ps(__U, __A, __I, __B); } +__m512i test_mm512_permutex2var_epi64 (__m512i __A, __m512i __I, __m512i __B){ + // CHECK-LABEL: @test_mm512_permutex2var_epi64 + // CHECK: @llvm.x86.avx512.vpermi2var.q.512 + return _mm512_permutex2var_epi64(__A, __I, __B); +} + __m512i test_mm512_mask_permutex2var_epi64 (__m512i __A, __mmask8 __U, __m512i __I, __m512i __B){ // CHECK-LABEL: @test_mm512_mask_permutex2var_epi64 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.q.512 + // CHECK: @llvm.x86.avx512.vpermi2var.q.512 + // CHECK: select <8 x i1> %{{.*}}, <8 x i64> %{{.*}}, <8 x i64> %{{.*}} return _mm512_mask_permutex2var_epi64(__A, __U, __I, __B); } __m512i test_mm512_maskz_permutex2var_epi64(__mmask8 __U, __m512i __A, __m512i __I, __m512i __B) { // CHECK-LABEL: @test_mm512_maskz_permutex2var_epi64 - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.q.512 + // CHECK: @llvm.x86.avx512.vpermi2var.q.512 + // CHECK: select <8 x i1> %{{.*}}, <8 x i64> %{{.*}}, <8 x i64> %{{.*}} return _mm512_maskz_permutex2var_epi64(__U, __A, __I, __B); } __mmask16 test_mm512_testn_epi32_mask(__m512i __A, __m512i __B) { diff --git a/clang/test/CodeGen/avx512vbmi-builtins.c b/clang/test/CodeGen/avx512vbmi-builtins.c index d670f3f8abf..0347916af09 100644 --- a/clang/test/CodeGen/avx512vbmi-builtins.c +++ b/clang/test/CodeGen/avx512vbmi-builtins.c @@ -5,25 +5,28 @@ __m512i test_mm512_mask2_permutex2var_epi8(__m512i __A, __m512i __I, __mmask64 __U, __m512i __B) { // CHECK-LABEL: @test_mm512_mask2_permutex2var_epi8 - // CHECK: @llvm.x86.avx512.mask.vpermi2var.qi.512 + // CHECK: @llvm.x86.avx512.vpermi2var.qi.512 + // CHECK: select <64 x i1> %{{.*}}, <64 x i8> %{{.*}}, <64 x i8> %{{.*}} return _mm512_mask2_permutex2var_epi8(__A, __I, __U, __B); } __m512i test_mm512_permutex2var_epi8(__m512i __A, __m512i __I, __m512i __B) { // CHECK-LABEL: @test_mm512_permutex2var_epi8 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.qi.512 + // CHECK: @llvm.x86.avx512.vpermi2var.qi.512 return _mm512_permutex2var_epi8(__A, __I, __B); } __m512i test_mm512_mask_permutex2var_epi8(__m512i __A, __mmask64 __U, __m512i __I, __m512i __B) { // CHECK-LABEL: @test_mm512_mask_permutex2var_epi8 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.qi.512 + // CHECK: @llvm.x86.avx512.vpermi2var.qi.512 + // CHECK: select <64 x i1> %{{.*}}, <64 x i8> %{{.*}}, <64 x i8> %{{.*}} return _mm512_mask_permutex2var_epi8(__A, __U, __I, __B); } __m512i test_mm512_maskz_permutex2var_epi8(__mmask64 __U, __m512i __A, __m512i __I, __m512i __B) { // CHECK-LABEL: @test_mm512_maskz_permutex2var_epi8 - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.qi.512 + // CHECK: @llvm.x86.avx512.vpermi2var.qi.512 + // CHECK: select <64 x i1> %{{.*}}, <64 x i8> %{{.*}}, <64 x i8> %{{.*}} return _mm512_maskz_permutex2var_epi8(__U, __A, __I, __B); } diff --git a/clang/test/CodeGen/avx512vbmivl-builtin.c b/clang/test/CodeGen/avx512vbmivl-builtin.c index 05aa626fbda..da8986f2e7d 100644 --- a/clang/test/CodeGen/avx512vbmivl-builtin.c +++ b/clang/test/CodeGen/avx512vbmivl-builtin.c @@ -45,49 +45,55 @@ __m256i test_mm256_mask_permutexvar_epi8(__m256i __W, __mmask32 __M, __m256i __A __m128i test_mm_mask2_permutex2var_epi8(__m128i __A, __m128i __I, __mmask16 __U, __m128i __B) { // CHECK-LABEL: @test_mm_mask2_permutex2var_epi8 - // CHECK: @llvm.x86.avx512.mask.vpermi2var.qi.128 + // CHECK: @llvm.x86.avx512.vpermi2var.qi.128 + // CHECK: select <16 x i1> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}} return _mm_mask2_permutex2var_epi8(__A, __I, __U, __B); } __m256i test_mm256_mask2_permutex2var_epi8(__m256i __A, __m256i __I, __mmask32 __U, __m256i __B) { // CHECK-LABEL: @test_mm256_mask2_permutex2var_epi8 - // CHECK: @llvm.x86.avx512.mask.vpermi2var.qi.256 + // CHECK: @llvm.x86.avx512.vpermi2var.qi.256 + // CHECK: select <32 x i1> %{{.*}}, <32 x i8> %{{.*}}, <32 x i8> %{{.*}} return _mm256_mask2_permutex2var_epi8(__A, __I, __U, __B); } __m128i test_mm_permutex2var_epi8(__m128i __A, __m128i __I, __m128i __B) { // CHECK-LABEL: @test_mm_permutex2var_epi8 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.qi.128 + // CHECK: @llvm.x86.avx512.vpermi2var.qi.128 return _mm_permutex2var_epi8(__A, __I, __B); } __m128i test_mm_mask_permutex2var_epi8(__m128i __A, __mmask16 __U, __m128i __I, __m128i __B) { // CHECK-LABEL: @test_mm_mask_permutex2var_epi8 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.qi.128 + // CHECK: @llvm.x86.avx512.vpermi2var.qi.128 + // CHECK: select <16 x i1> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}} return _mm_mask_permutex2var_epi8(__A, __U, __I, __B); } __m128i test_mm_maskz_permutex2var_epi8(__mmask16 __U, __m128i __A, __m128i __I, __m128i __B) { // CHECK-LABEL: @test_mm_maskz_permutex2var_epi8 - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.qi.128 + // CHECK: @llvm.x86.avx512.vpermi2var.qi.128 + // CHECK: select <16 x i1> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}} return _mm_maskz_permutex2var_epi8(__U, __A, __I, __B); } __m256i test_mm256_permutex2var_epi8(__m256i __A, __m256i __I, __m256i __B) { // CHECK-LABEL: @test_mm256_permutex2var_epi8 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.qi.256 + // CHECK: @llvm.x86.avx512.vpermi2var.qi.256 return _mm256_permutex2var_epi8(__A, __I, __B); } __m256i test_mm256_mask_permutex2var_epi8(__m256i __A, __mmask32 __U, __m256i __I, __m256i __B) { // CHECK-LABEL: @test_mm256_mask_permutex2var_epi8 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.qi.256 + // CHECK: @llvm.x86.avx512.vpermi2var.qi.256 + // CHECK: select <32 x i1> %{{.*}}, <32 x i8> %{{.*}}, <32 x i8> %{{.*}} return _mm256_mask_permutex2var_epi8(__A, __U, __I, __B); } __m256i test_mm256_maskz_permutex2var_epi8(__mmask32 __U, __m256i __A, __m256i __I, __m256i __B) { // CHECK-LABEL: @test_mm256_maskz_permutex2var_epi8 - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.qi.256 + // CHECK: @llvm.x86.avx512.vpermi2var.qi.256 + // CHECK: select <32 x i1> %{{.*}}, <32 x i8> %{{.*}}, <32 x i8> %{{.*}} return _mm256_maskz_permutex2var_epi8(__U, __A, __I, __B); } diff --git a/clang/test/CodeGen/avx512vl-builtins.c b/clang/test/CodeGen/avx512vl-builtins.c index 6e54592d727..f3ac6c95b91 100644 --- a/clang/test/CodeGen/avx512vl-builtins.c +++ b/clang/test/CodeGen/avx512vl-builtins.c @@ -3284,162 +3284,186 @@ __m256 test_mm256_maskz_sub_ps(__mmask8 __U, __m256 __A, __m256 __B) { } __m128i test_mm_mask2_permutex2var_epi32(__m128i __A, __m128i __I, __mmask8 __U, __m128i __B) { // CHECK-LABEL: @test_mm_mask2_permutex2var_epi32 - // CHECK: @llvm.x86.avx512.mask.vpermi2var.d.128 + // CHECK: @llvm.x86.avx512.vpermi2var.d.128 + // CHECK: select <4 x i1> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}} return _mm_mask2_permutex2var_epi32(__A,__I,__U,__B); } __m256i test_mm256_mask2_permutex2var_epi32(__m256i __A, __m256i __I, __mmask8 __U, __m256i __B) { // CHECK-LABEL: @test_mm256_mask2_permutex2var_epi32 - // CHECK: @llvm.x86.avx512.mask.vpermi2var.d.256 + // CHECK: @llvm.x86.avx512.vpermi2var.d.256 + // CHECK: select <8 x i1> %{{.*}}, <8 x i32> %{{.*}}, <8 x i32> %{{.*}} return _mm256_mask2_permutex2var_epi32(__A,__I,__U,__B); } __m128d test_mm_mask2_permutex2var_pd(__m128d __A, __m128i __I, __mmask8 __U, __m128d __B) { // CHECK-LABEL: @test_mm_mask2_permutex2var_pd - // CHECK: @llvm.x86.avx512.mask.vpermi2var.pd.128 + // CHECK: @llvm.x86.avx512.vpermi2var.pd.128 + // CHECK: select <2 x i1> %{{.*}}, <2 x double> %{{.*}}, <2 x double> %{{.*}} return _mm_mask2_permutex2var_pd(__A,__I,__U,__B); } __m256d test_mm256_mask2_permutex2var_pd(__m256d __A, __m256i __I, __mmask8 __U, __m256d __B) { // CHECK-LABEL: @test_mm256_mask2_permutex2var_pd - // CHECK: @llvm.x86.avx512.mask.vpermi2var.pd.256 + // CHECK: @llvm.x86.avx512.vpermi2var.pd.256 + // CHECK: select <4 x i1> %{{.*}}, <4 x double> %{{.*}}, <4 x double> %{{.*}} return _mm256_mask2_permutex2var_pd(__A,__I,__U,__B); } __m128 test_mm_mask2_permutex2var_ps(__m128 __A, __m128i __I, __mmask8 __U, __m128 __B) { // CHECK-LABEL: @test_mm_mask2_permutex2var_ps - // CHECK: @llvm.x86.avx512.mask.vpermi2var.ps.128 + // CHECK: @llvm.x86.avx512.vpermi2var.ps.128 + // CHECK: select <4 x i1> %{{.*}}, <4 x float> %{{.*}}, <4 x float> %{{.*}} return _mm_mask2_permutex2var_ps(__A,__I,__U,__B); } __m256 test_mm256_mask2_permutex2var_ps(__m256 __A, __m256i __I, __mmask8 __U, __m256 __B) { // CHECK-LABEL: @test_mm256_mask2_permutex2var_ps - // CHECK: @llvm.x86.avx512.mask.vpermi2var.ps.256 + // CHECK: @llvm.x86.avx512.vpermi2var.ps.256 + // CHECK: select <8 x i1> %{{.*}}, <8 x float> %{{.*}}, <8 x float> %{{.*}} return _mm256_mask2_permutex2var_ps(__A,__I,__U,__B); } __m128i test_mm_mask2_permutex2var_epi64(__m128i __A, __m128i __I, __mmask8 __U, __m128i __B) { // CHECK-LABEL: @test_mm_mask2_permutex2var_epi64 - // CHECK: @llvm.x86.avx512.mask.vpermi2var.q.128 + // CHECK: @llvm.x86.avx512.vpermi2var.q.128 + // CHECK: select <2 x i1> %{{.*}}, <2 x i64> %{{.*}}, <2 x i64> %{{.*}} return _mm_mask2_permutex2var_epi64(__A,__I,__U,__B); } __m256i test_mm256_mask2_permutex2var_epi64(__m256i __A, __m256i __I, __mmask8 __U, __m256i __B) { // CHECK-LABEL: @test_mm256_mask2_permutex2var_epi64 - // CHECK: @llvm.x86.avx512.mask.vpermi2var.q.256 + // CHECK: @llvm.x86.avx512.vpermi2var.q.256 + // CHECK: select <4 x i1> %{{.*}}, <4 x i64> %{{.*}}, <4 x i64> %{{.*}} return _mm256_mask2_permutex2var_epi64(__A,__I,__U,__B); } __m128i test_mm_permutex2var_epi32(__m128i __A, __m128i __I, __m128i __B) { // CHECK-LABEL: @test_mm_permutex2var_epi32 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.d.128 + // CHECK: @llvm.x86.avx512.vpermi2var.d.128 return _mm_permutex2var_epi32(__A,__I,__B); } __m128i test_mm_mask_permutex2var_epi32(__m128i __A, __mmask8 __U, __m128i __I, __m128i __B) { // CHECK-LABEL: @test_mm_mask_permutex2var_epi32 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.d.128 + // CHECK: @llvm.x86.avx512.vpermi2var.d.128 + // CHECK: select <4 x i1> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}} return _mm_mask_permutex2var_epi32(__A,__U,__I,__B); } __m128i test_mm_maskz_permutex2var_epi32(__mmask8 __U, __m128i __A, __m128i __I, __m128i __B) { // CHECK-LABEL: @test_mm_maskz_permutex2var_epi32 - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.d.128 + // CHECK: @llvm.x86.avx512.vpermi2var.d.128 + // CHECK: select <4 x i1> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}} return _mm_maskz_permutex2var_epi32(__U,__A,__I,__B); } __m256i test_mm256_permutex2var_epi32(__m256i __A, __m256i __I, __m256i __B) { // CHECK-LABEL: @test_mm256_permutex2var_epi32 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.d.256 + // CHECK: @llvm.x86.avx512.vpermi2var.d.256 return _mm256_permutex2var_epi32(__A,__I,__B); } __m256i test_mm256_mask_permutex2var_epi32(__m256i __A, __mmask8 __U, __m256i __I, __m256i __B) { // CHECK-LABEL: @test_mm256_mask_permutex2var_epi32 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.d.256 + // CHECK: @llvm.x86.avx512.vpermi2var.d.256 + // CHECK: select <8 x i1> %{{.*}}, <8 x i32> %{{.*}}, <8 x i32> %{{.*}} return _mm256_mask_permutex2var_epi32(__A,__U,__I,__B); } __m256i test_mm256_maskz_permutex2var_epi32(__mmask8 __U, __m256i __A, __m256i __I, __m256i __B) { // CHECK-LABEL: @test_mm256_maskz_permutex2var_epi32 - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.d.256 + // CHECK: @llvm.x86.avx512.vpermi2var.d.256 + // CHECK: select <8 x i1> %{{.*}}, <8 x i32> %{{.*}}, <8 x i32> %{{.*}} return _mm256_maskz_permutex2var_epi32(__U,__A,__I,__B); } __m128d test_mm_permutex2var_pd(__m128d __A, __m128i __I, __m128d __B) { // CHECK-LABEL: @test_mm_permutex2var_pd - // CHECK: @llvm.x86.avx512.mask.vpermt2var.pd.128 + // CHECK: @llvm.x86.avx512.vpermi2var.pd.128 return _mm_permutex2var_pd(__A,__I,__B); } __m128d test_mm_mask_permutex2var_pd(__m128d __A, __mmask8 __U, __m128i __I, __m128d __B) { // CHECK-LABEL: @test_mm_mask_permutex2var_pd - // CHECK: @llvm.x86.avx512.mask.vpermt2var.pd.128 + // CHECK: @llvm.x86.avx512.vpermi2var.pd.128 + // CHECK: select <2 x i1> %{{.*}}, <2 x double> %{{.*}}, <2 x double> %{{.*}} return _mm_mask_permutex2var_pd(__A,__U,__I,__B); } __m128d test_mm_maskz_permutex2var_pd(__mmask8 __U, __m128d __A, __m128i __I, __m128d __B) { // CHECK-LABEL: @test_mm_maskz_permutex2var_pd - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.pd.128 + // CHECK: @llvm.x86.avx512.vpermi2var.pd.128 + // CHECK: select <2 x i1> %{{.*}}, <2 x double> %{{.*}}, <2 x double> %{{.*}} return _mm_maskz_permutex2var_pd(__U,__A,__I,__B); } __m256d test_mm256_permutex2var_pd(__m256d __A, __m256i __I, __m256d __B) { // CHECK-LABEL: @test_mm256_permutex2var_pd - // CHECK: @llvm.x86.avx512.mask.vpermt2var.pd.256 + // CHECK: @llvm.x86.avx512.vpermi2var.pd.256 return _mm256_permutex2var_pd(__A,__I,__B); } __m256d test_mm256_mask_permutex2var_pd(__m256d __A, __mmask8 __U, __m256i __I, __m256d __B) { // CHECK-LABEL: @test_mm256_mask_permutex2var_pd - // CHECK: @llvm.x86.avx512.mask.vpermt2var.pd.256 + // CHECK: @llvm.x86.avx512.vpermi2var.pd.256 + // CHECK: select <4 x i1> %{{.*}}, <4 x double> %{{.*}}, <4 x double> %{{.*}} return _mm256_mask_permutex2var_pd(__A,__U,__I,__B); } __m256d test_mm256_maskz_permutex2var_pd(__mmask8 __U, __m256d __A, __m256i __I, __m256d __B) { // CHECK-LABEL: @test_mm256_maskz_permutex2var_pd - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.pd.256 + // CHECK: @llvm.x86.avx512.vpermi2var.pd.256 + // CHECK: select <4 x i1> %{{.*}}, <4 x double> %{{.*}}, <4 x double> %{{.*}} return _mm256_maskz_permutex2var_pd(__U,__A,__I,__B); } __m128 test_mm_permutex2var_ps(__m128 __A, __m128i __I, __m128 __B) { // CHECK-LABEL: @test_mm_permutex2var_ps - // CHECK: @llvm.x86.avx512.mask.vpermt2var.ps.128 + // CHECK: @llvm.x86.avx512.vpermi2var.ps.128 return _mm_permutex2var_ps(__A,__I,__B); } __m128 test_mm_mask_permutex2var_ps(__m128 __A, __mmask8 __U, __m128i __I, __m128 __B) { // CHECK-LABEL: @test_mm_mask_permutex2var_ps - // CHECK: @llvm.x86.avx512.mask.vpermt2var.ps.128 + // CHECK: @llvm.x86.avx512.vpermi2var.ps.128 + // CHECK: select <4 x i1> %{{.*}}, <4 x float> %{{.*}}, <4 x float> %{{.*}} return _mm_mask_permutex2var_ps(__A,__U,__I,__B); } __m128 test_mm_maskz_permutex2var_ps(__mmask8 __U, __m128 __A, __m128i __I, __m128 __B) { // CHECK-LABEL: @test_mm_maskz_permutex2var_ps - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.ps.128 + // CHECK: @llvm.x86.avx512.vpermi2var.ps.128 + // CHECK: select <4 x i1> %{{.*}}, <4 x float> %{{.*}}, <4 x float> %{{.*}} return _mm_maskz_permutex2var_ps(__U,__A,__I,__B); } __m256 test_mm256_permutex2var_ps(__m256 __A, __m256i __I, __m256 __B) { // CHECK-LABEL: @test_mm256_permutex2var_ps - // CHECK: @llvm.x86.avx512.mask.vpermt2var.ps.256 + // CHECK: @llvm.x86.avx512.vpermi2var.ps.256 return _mm256_permutex2var_ps(__A,__I,__B); } __m256 test_mm256_mask_permutex2var_ps(__m256 __A, __mmask8 __U, __m256i __I, __m256 __B) { // CHECK-LABEL: @test_mm256_mask_permutex2var_ps - // CHECK: @llvm.x86.avx512.mask.vpermt2var.ps.256 + // CHECK: @llvm.x86.avx512.vpermi2var.ps.256 + // CHECK: select <8 x i1> %{{.*}}, <8 x float> %{{.*}}, <8 x float> %{{.*}} return _mm256_mask_permutex2var_ps(__A,__U,__I,__B); } __m256 test_mm256_maskz_permutex2var_ps(__mmask8 __U, __m256 __A, __m256i __I, __m256 __B) { // CHECK-LABEL: @test_mm256_maskz_permutex2var_ps - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.ps.256 + // CHECK: @llvm.x86.avx512.vpermi2var.ps.256 + // CHECK: select <8 x i1> %{{.*}}, <8 x float> %{{.*}}, <8 x float> %{{.*}} return _mm256_maskz_permutex2var_ps(__U,__A,__I,__B); } __m128i test_mm_permutex2var_epi64(__m128i __A, __m128i __I, __m128i __B) { // CHECK-LABEL: @test_mm_permutex2var_epi64 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.q.128 + // CHECK: @llvm.x86.avx512.vpermi2var.q.128 return _mm_permutex2var_epi64(__A,__I,__B); } __m128i test_mm_mask_permutex2var_epi64(__m128i __A, __mmask8 __U, __m128i __I, __m128i __B) { // CHECK-LABEL: @test_mm_mask_permutex2var_epi64 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.q.128 + // CHECK: @llvm.x86.avx512.vpermi2var.q.128 + // CHECK: select <2 x i1> %{{.*}}, <2 x i64> %{{.*}}, <2 x i64> %{{.*}} return _mm_mask_permutex2var_epi64(__A,__U,__I,__B); } __m128i test_mm_maskz_permutex2var_epi64(__mmask8 __U, __m128i __A, __m128i __I, __m128i __B) { // CHECK-LABEL: @test_mm_maskz_permutex2var_epi64 - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.q.128 + // CHECK: @llvm.x86.avx512.vpermi2var.q.128 + // CHECK: select <2 x i1> %{{.*}}, <2 x i64> %{{.*}}, <2 x i64> %{{.*}} return _mm_maskz_permutex2var_epi64(__U,__A,__I,__B); } __m256i test_mm256_permutex2var_epi64(__m256i __A, __m256i __I, __m256i __B) { // CHECK-LABEL: @test_mm256_permutex2var_epi64 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.q.256 + // CHECK: @llvm.x86.avx512.vpermi2var.q.256 return _mm256_permutex2var_epi64(__A,__I,__B); } __m256i test_mm256_mask_permutex2var_epi64(__m256i __A, __mmask8 __U, __m256i __I, __m256i __B) { // CHECK-LABEL: @test_mm256_mask_permutex2var_epi64 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.q.256 + // CHECK: @llvm.x86.avx512.vpermi2var.q.256 + // CHECK: select <4 x i1> %{{.*}}, <4 x i64> %{{.*}}, <4 x i64> %{{.*}} return _mm256_mask_permutex2var_epi64(__A,__U,__I,__B); } __m256i test_mm256_maskz_permutex2var_epi64(__mmask8 __U, __m256i __A, __m256i __I, __m256i __B) { // CHECK-LABEL: @test_mm256_maskz_permutex2var_epi64 - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.q.256 + // CHECK: @llvm.x86.avx512.vpermi2var.q.256 + // CHECK: select <4 x i1> %{{.*}}, <4 x i64> %{{.*}}, <4 x i64> %{{.*}} return _mm256_maskz_permutex2var_epi64(__U,__A,__I,__B); } diff --git a/clang/test/CodeGen/avx512vlbw-builtins.c b/clang/test/CodeGen/avx512vlbw-builtins.c index 8ca5fc95558..da16abd2a81 100644 --- a/clang/test/CodeGen/avx512vlbw-builtins.c +++ b/clang/test/CodeGen/avx512vlbw-builtins.c @@ -1617,43 +1617,49 @@ __m256i test_mm256_maskz_subs_epu16(__mmask16 __U, __m256i __A, __m256i __B) { __m128i test_mm_mask2_permutex2var_epi16(__m128i __A, __m128i __I, __mmask8 __U, __m128i __B) { // CHECK-LABEL: @test_mm_mask2_permutex2var_epi16 - // CHECK: @llvm.x86.avx512.mask.vpermi2var.hi.128 + // CHECK: @llvm.x86.avx512.vpermi2var.hi.128 + // CHECK: select <8 x i1> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}} return _mm_mask2_permutex2var_epi16(__A,__I,__U,__B); } __m256i test_mm256_mask2_permutex2var_epi16(__m256i __A, __m256i __I, __mmask16 __U, __m256i __B) { // CHECK-LABEL: @test_mm256_mask2_permutex2var_epi16 - // CHECK: @llvm.x86.avx512.mask.vpermi2var.hi.256 + // CHECK: @llvm.x86.avx512.vpermi2var.hi.256 + // CHECK: select <16 x i1> %{{.*}}, <16 x i16> %{{.*}}, <16 x i16> %{{.*}} return _mm256_mask2_permutex2var_epi16(__A,__I,__U,__B); } __m128i test_mm_permutex2var_epi16(__m128i __A, __m128i __I, __m128i __B) { // CHECK-LABEL: @test_mm_permutex2var_epi16 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.hi.128 + // CHECK: @llvm.x86.avx512.vpermi2var.hi.128 return _mm_permutex2var_epi16(__A,__I,__B); } __m128i test_mm_mask_permutex2var_epi16(__m128i __A, __mmask8 __U, __m128i __I, __m128i __B) { // CHECK-LABEL: @test_mm_mask_permutex2var_epi16 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.hi.128 + // CHECK: @llvm.x86.avx512.vpermi2var.hi.128 + // CHECK: select <8 x i1> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}} return _mm_mask_permutex2var_epi16(__A,__U,__I,__B); } __m128i test_mm_maskz_permutex2var_epi16(__mmask8 __U, __m128i __A, __m128i __I, __m128i __B) { // CHECK-LABEL: @test_mm_maskz_permutex2var_epi16 - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.hi.128 + // CHECK: @llvm.x86.avx512.vpermi2var.hi.128 + // CHECK: select <8 x i1> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}} return _mm_maskz_permutex2var_epi16(__U,__A,__I,__B); } __m256i test_mm256_permutex2var_epi16(__m256i __A, __m256i __I, __m256i __B) { // CHECK-LABEL: @test_mm256_permutex2var_epi16 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.hi.256 + // CHECK: @llvm.x86.avx512.vpermi2var.hi.256 return _mm256_permutex2var_epi16(__A,__I,__B); } __m256i test_mm256_mask_permutex2var_epi16(__m256i __A, __mmask16 __U, __m256i __I, __m256i __B) { // CHECK-LABEL: @test_mm256_mask_permutex2var_epi16 - // CHECK: @llvm.x86.avx512.mask.vpermt2var.hi.256 + // CHECK: @llvm.x86.avx512.vpermi2var.hi.256 + // CHECK: select <16 x i1> %{{.*}}, <16 x i16> %{{.*}}, <16 x i16> %{{.*}} return _mm256_mask_permutex2var_epi16(__A,__U,__I,__B); } __m256i test_mm256_maskz_permutex2var_epi16(__mmask16 __U, __m256i __A, __m256i __I, __m256i __B) { // CHECK-LABEL: @test_mm256_maskz_permutex2var_epi16 - // CHECK: @llvm.x86.avx512.maskz.vpermt2var.hi.256 + // CHECK: @llvm.x86.avx512.vpermi2var.hi.256 + // CHECK: select <16 x i1> %{{.*}}, <16 x i16> %{{.*}}, <16 x i16> %{{.*}} return _mm256_maskz_permutex2var_epi16(__U,__A,__I,__B); } __m128i test_mm_mask_maddubs_epi16(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y) { |