summaryrefslogtreecommitdiffstats
path: root/clang/test/CodeGen
diff options
context:
space:
mode:
authorCraig Topper <craig.topper@intel.com>2018-05-29 03:26:38 +0000
committerCraig Topper <craig.topper@intel.com>2018-05-29 03:26:38 +0000
commit68a272d501ee12bb54553aebb1eb5877ce42df0c (patch)
tree62dbe5fca0e6f3491f0c5c42e20b6101f03e2b73 /clang/test/CodeGen
parent2adc7d956cb7b5ca971e1ac0aa85b2c40d7b2138 (diff)
downloadbcm5719-llvm-68a272d501ee12bb54553aebb1eb5877ce42df0c.tar.gz
bcm5719-llvm-68a272d501ee12bb54553aebb1eb5877ce42df0c.zip
[X86] Merge the 3 different flavors of masked vpermi2var/vpermt2var builtins to a single version without masking. Use select builtins with appropriate operand instead.
llvm-svn: 333387
Diffstat (limited to 'clang/test/CodeGen')
-rw-r--r--clang/test/CodeGen/avx512bw-builtins.c11
-rw-r--r--clang/test/CodeGen/avx512f-builtins.c52
-rw-r--r--clang/test/CodeGen/avx512vbmi-builtins.c11
-rw-r--r--clang/test/CodeGen/avx512vbmivl-builtin.c22
-rw-r--r--clang/test/CodeGen/avx512vl-builtins.c88
-rw-r--r--clang/test/CodeGen/avx512vlbw-builtins.c22
6 files changed, 136 insertions, 70 deletions
diff --git a/clang/test/CodeGen/avx512bw-builtins.c b/clang/test/CodeGen/avx512bw-builtins.c
index d5c19939980..19eb571305f 100644
--- a/clang/test/CodeGen/avx512bw-builtins.c
+++ b/clang/test/CodeGen/avx512bw-builtins.c
@@ -963,22 +963,25 @@ __m512i test_mm512_maskz_subs_epu16(__mmask32 __U, __m512i __A, __m512i __B) {
}
__m512i test_mm512_mask2_permutex2var_epi16(__m512i __A, __m512i __I, __mmask32 __U, __m512i __B) {
// CHECK-LABEL: @test_mm512_mask2_permutex2var_epi16
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.hi.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.hi.512
+ // CHECK: select <32 x i1> %{{.*}}, <32 x i16> %{{.*}}, <32 x i16> %{{.*}}
return _mm512_mask2_permutex2var_epi16(__A,__I,__U,__B);
}
__m512i test_mm512_permutex2var_epi16(__m512i __A, __m512i __I, __m512i __B) {
// CHECK-LABEL: @test_mm512_permutex2var_epi16
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.hi.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.hi.512
return _mm512_permutex2var_epi16(__A,__I,__B);
}
__m512i test_mm512_mask_permutex2var_epi16(__m512i __A, __mmask32 __U, __m512i __I, __m512i __B) {
// CHECK-LABEL: @test_mm512_mask_permutex2var_epi16
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.hi.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.hi.512
+ // CHECK: select <32 x i1> %{{.*}}, <32 x i16> %{{.*}}, <32 x i16> %{{.*}}
return _mm512_mask_permutex2var_epi16(__A,__U,__I,__B);
}
__m512i test_mm512_maskz_permutex2var_epi16(__mmask32 __U, __m512i __A, __m512i __I, __m512i __B) {
// CHECK-LABEL: @test_mm512_maskz_permutex2var_epi16
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.hi.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.hi.512
+ // CHECK: select <32 x i1> %{{.*}}, <32 x i16> %{{.*}}, <32 x i16> %{{.*}}
return _mm512_maskz_permutex2var_epi16(__U,__A,__I,__B);
}
diff --git a/clang/test/CodeGen/avx512f-builtins.c b/clang/test/CodeGen/avx512f-builtins.c
index f324ebe1cec..ee4dd528e1f 100644
--- a/clang/test/CodeGen/avx512f-builtins.c
+++ b/clang/test/CodeGen/avx512f-builtins.c
@@ -3246,7 +3246,8 @@ unsigned long long test_mm_cvt_roundsd_si64(__m128d __A) {
#endif
__m512i test_mm512_mask2_permutex2var_epi32(__m512i __A, __m512i __I, __mmask16 __U, __m512i __B) {
// CHECK-LABEL: @test_mm512_mask2_permutex2var_epi32
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.d.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.d.512
+ // CHECK: select <16 x i1> %{{.*}}, <16 x i32> %{{.*}}, <16 x i32> %{{.*}}
return _mm512_mask2_permutex2var_epi32(__A, __I, __U, __B);
}
__m512i test_mm512_unpackhi_epi32(__m512i __A, __m512i __B) {
@@ -3270,7 +3271,8 @@ long long test_mm_cvt_roundsd_i64(__m128d __A) {
#endif
__m512d test_mm512_mask2_permutex2var_pd(__m512d __A, __m512i __I, __mmask8 __U, __m512d __B) {
// CHECK-LABEL: @test_mm512_mask2_permutex2var_pd
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.pd.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.pd.512
+ // CHECK: select <8 x i1> %{{.*}}, <8 x double> %{{.*}}, <8 x double> %{{.*}}
return _mm512_mask2_permutex2var_pd(__A, __I, __U, __B);
}
__m512i test_mm512_mask_unpackhi_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B) {
@@ -3738,13 +3740,15 @@ __m256i test_mm512_maskz_cvt_roundpd_epu32(__mmask8 U, __m512d A)
__m512 test_mm512_mask2_permutex2var_ps(__m512 __A, __m512i __I, __mmask16 __U, __m512 __B) {
// CHECK-LABEL: @test_mm512_mask2_permutex2var_ps
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.ps.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.ps.512
+ // CHECK: select <16 x i1> %{{.*}}, <16 x float> %{{.*}}, <16 x float> %{{.*}}
return _mm512_mask2_permutex2var_ps(__A, __I, __U, __B);
}
__m512i test_mm512_mask2_permutex2var_epi64(__m512i __A, __m512i __I, __mmask8 __U, __m512i __B) {
// CHECK-LABEL: @test_mm512_mask2_permutex2var_epi64
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.q.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.q.512
+ // CHECK: select <8 x i1> %{{.*}}, <8 x i64> %{{.*}}, <8 x i64> %{{.*}}
return _mm512_mask2_permutex2var_epi64(__A, __I, __U, __B);
}
@@ -3828,68 +3832,88 @@ __m512 test_mm512_maskz_permutevar_ps(__mmask16 __U, __m512 __A, __m512i __C) {
return _mm512_maskz_permutevar_ps(__U, __A, __C);
}
+__m512i test_mm512_permutex2var_epi32(__m512i __A, __m512i __I, __m512i __B) {
+ // CHECK-LABEL: @test_mm512_permutex2var_epi32
+ // CHECK: @llvm.x86.avx512.vpermi2var.d.512
+ return _mm512_permutex2var_epi32(__A, __I, __B);
+}
+
__m512i test_mm512_maskz_permutex2var_epi32(__mmask16 __U, __m512i __A, __m512i __I, __m512i __B) {
// CHECK-LABEL: @test_mm512_maskz_permutex2var_epi32
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.d.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.d.512
+ // CHECK: select <16 x i1> %{{.*}}, <16 x i32> %{{.*}}, <16 x i32> %{{.*}}
return _mm512_maskz_permutex2var_epi32(__U, __A, __I, __B);
}
__m512i test_mm512_mask_permutex2var_epi32 (__m512i __A, __mmask16 __U, __m512i __I, __m512i __B)
{
// CHECK-LABEL: @test_mm512_mask_permutex2var_epi32
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.d.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.d.512
+ // CHECK: select <16 x i1> %{{.*}}, <16 x i32> %{{.*}}, <16 x i32> %{{.*}}
return _mm512_mask_permutex2var_epi32 (__A,__U,__I,__B);
}
__m512d test_mm512_permutex2var_pd (__m512d __A, __m512i __I, __m512d __B)
{
// CHECK-LABEL: @test_mm512_permutex2var_pd
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.pd.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.pd.512
return _mm512_permutex2var_pd (__A, __I,__B);
}
__m512d test_mm512_mask_permutex2var_pd (__m512d __A, __mmask8 __U, __m512i __I, __m512d __B)
{
// CHECK-LABEL: @test_mm512_mask_permutex2var_pd
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.pd.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.pd.512
+ // CHECK: select <8 x i1> %{{.*}}, <8 x double> %{{.*}}, <8 x double> %{{.*}}
return _mm512_mask_permutex2var_pd (__A,__U,__I,__B);
}
__m512d test_mm512_maskz_permutex2var_pd(__mmask8 __U, __m512d __A, __m512i __I, __m512d __B) {
// CHECK-LABEL: @test_mm512_maskz_permutex2var_pd
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.pd.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.pd.512
+ // CHECK: select <8 x i1> %{{.*}}, <8 x double> %{{.*}}, <8 x double> %{{.*}}
return _mm512_maskz_permutex2var_pd(__U, __A, __I, __B);
}
__m512 test_mm512_permutex2var_ps (__m512 __A, __m512i __I, __m512 __B)
{
// CHECK-LABEL: @test_mm512_permutex2var_ps
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.ps.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.ps.512
return _mm512_permutex2var_ps (__A, __I, __B);
}
__m512 test_mm512_mask_permutex2var_ps (__m512 __A, __mmask16 __U, __m512i __I, __m512 __B)
{
// CHECK-LABEL: @test_mm512_mask_permutex2var_ps
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.ps.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.ps.512
+ // CHECK: select <16 x i1> %{{.*}}, <16 x float> %{{.*}}, <16 x float> %{{.*}}
return _mm512_mask_permutex2var_ps (__A,__U,__I,__B);
}
__m512 test_mm512_maskz_permutex2var_ps(__mmask16 __U, __m512 __A, __m512i __I, __m512 __B) {
// CHECK-LABEL: @test_mm512_maskz_permutex2var_ps
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.ps.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.ps.512
+ // CHECK: select <16 x i1> %{{.*}}, <16 x float> %{{.*}}, <16 x float> %{{.*}}
return _mm512_maskz_permutex2var_ps(__U, __A, __I, __B);
}
+__m512i test_mm512_permutex2var_epi64 (__m512i __A, __m512i __I, __m512i __B){
+ // CHECK-LABEL: @test_mm512_permutex2var_epi64
+ // CHECK: @llvm.x86.avx512.vpermi2var.q.512
+ return _mm512_permutex2var_epi64(__A, __I, __B);
+}
+
__m512i test_mm512_mask_permutex2var_epi64 (__m512i __A, __mmask8 __U, __m512i __I, __m512i __B){
// CHECK-LABEL: @test_mm512_mask_permutex2var_epi64
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.q.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.q.512
+ // CHECK: select <8 x i1> %{{.*}}, <8 x i64> %{{.*}}, <8 x i64> %{{.*}}
return _mm512_mask_permutex2var_epi64(__A, __U, __I, __B);
}
__m512i test_mm512_maskz_permutex2var_epi64(__mmask8 __U, __m512i __A, __m512i __I, __m512i __B) {
// CHECK-LABEL: @test_mm512_maskz_permutex2var_epi64
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.q.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.q.512
+ // CHECK: select <8 x i1> %{{.*}}, <8 x i64> %{{.*}}, <8 x i64> %{{.*}}
return _mm512_maskz_permutex2var_epi64(__U, __A, __I, __B);
}
__mmask16 test_mm512_testn_epi32_mask(__m512i __A, __m512i __B) {
diff --git a/clang/test/CodeGen/avx512vbmi-builtins.c b/clang/test/CodeGen/avx512vbmi-builtins.c
index d670f3f8abf..0347916af09 100644
--- a/clang/test/CodeGen/avx512vbmi-builtins.c
+++ b/clang/test/CodeGen/avx512vbmi-builtins.c
@@ -5,25 +5,28 @@
__m512i test_mm512_mask2_permutex2var_epi8(__m512i __A, __m512i __I, __mmask64 __U, __m512i __B) {
// CHECK-LABEL: @test_mm512_mask2_permutex2var_epi8
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.qi.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.qi.512
+ // CHECK: select <64 x i1> %{{.*}}, <64 x i8> %{{.*}}, <64 x i8> %{{.*}}
return _mm512_mask2_permutex2var_epi8(__A, __I, __U, __B);
}
__m512i test_mm512_permutex2var_epi8(__m512i __A, __m512i __I, __m512i __B) {
// CHECK-LABEL: @test_mm512_permutex2var_epi8
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.qi.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.qi.512
return _mm512_permutex2var_epi8(__A, __I, __B);
}
__m512i test_mm512_mask_permutex2var_epi8(__m512i __A, __mmask64 __U, __m512i __I, __m512i __B) {
// CHECK-LABEL: @test_mm512_mask_permutex2var_epi8
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.qi.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.qi.512
+ // CHECK: select <64 x i1> %{{.*}}, <64 x i8> %{{.*}}, <64 x i8> %{{.*}}
return _mm512_mask_permutex2var_epi8(__A, __U, __I, __B);
}
__m512i test_mm512_maskz_permutex2var_epi8(__mmask64 __U, __m512i __A, __m512i __I, __m512i __B) {
// CHECK-LABEL: @test_mm512_maskz_permutex2var_epi8
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.qi.512
+ // CHECK: @llvm.x86.avx512.vpermi2var.qi.512
+ // CHECK: select <64 x i1> %{{.*}}, <64 x i8> %{{.*}}, <64 x i8> %{{.*}}
return _mm512_maskz_permutex2var_epi8(__U, __A, __I, __B);
}
diff --git a/clang/test/CodeGen/avx512vbmivl-builtin.c b/clang/test/CodeGen/avx512vbmivl-builtin.c
index 05aa626fbda..da8986f2e7d 100644
--- a/clang/test/CodeGen/avx512vbmivl-builtin.c
+++ b/clang/test/CodeGen/avx512vbmivl-builtin.c
@@ -45,49 +45,55 @@ __m256i test_mm256_mask_permutexvar_epi8(__m256i __W, __mmask32 __M, __m256i __A
__m128i test_mm_mask2_permutex2var_epi8(__m128i __A, __m128i __I, __mmask16 __U, __m128i __B) {
// CHECK-LABEL: @test_mm_mask2_permutex2var_epi8
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.qi.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.qi.128
+ // CHECK: select <16 x i1> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}}
return _mm_mask2_permutex2var_epi8(__A, __I, __U, __B);
}
__m256i test_mm256_mask2_permutex2var_epi8(__m256i __A, __m256i __I, __mmask32 __U, __m256i __B) {
// CHECK-LABEL: @test_mm256_mask2_permutex2var_epi8
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.qi.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.qi.256
+ // CHECK: select <32 x i1> %{{.*}}, <32 x i8> %{{.*}}, <32 x i8> %{{.*}}
return _mm256_mask2_permutex2var_epi8(__A, __I, __U, __B);
}
__m128i test_mm_permutex2var_epi8(__m128i __A, __m128i __I, __m128i __B) {
// CHECK-LABEL: @test_mm_permutex2var_epi8
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.qi.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.qi.128
return _mm_permutex2var_epi8(__A, __I, __B);
}
__m128i test_mm_mask_permutex2var_epi8(__m128i __A, __mmask16 __U, __m128i __I, __m128i __B) {
// CHECK-LABEL: @test_mm_mask_permutex2var_epi8
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.qi.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.qi.128
+ // CHECK: select <16 x i1> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}}
return _mm_mask_permutex2var_epi8(__A, __U, __I, __B);
}
__m128i test_mm_maskz_permutex2var_epi8(__mmask16 __U, __m128i __A, __m128i __I, __m128i __B) {
// CHECK-LABEL: @test_mm_maskz_permutex2var_epi8
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.qi.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.qi.128
+ // CHECK: select <16 x i1> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}}
return _mm_maskz_permutex2var_epi8(__U, __A, __I, __B);
}
__m256i test_mm256_permutex2var_epi8(__m256i __A, __m256i __I, __m256i __B) {
// CHECK-LABEL: @test_mm256_permutex2var_epi8
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.qi.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.qi.256
return _mm256_permutex2var_epi8(__A, __I, __B);
}
__m256i test_mm256_mask_permutex2var_epi8(__m256i __A, __mmask32 __U, __m256i __I, __m256i __B) {
// CHECK-LABEL: @test_mm256_mask_permutex2var_epi8
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.qi.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.qi.256
+ // CHECK: select <32 x i1> %{{.*}}, <32 x i8> %{{.*}}, <32 x i8> %{{.*}}
return _mm256_mask_permutex2var_epi8(__A, __U, __I, __B);
}
__m256i test_mm256_maskz_permutex2var_epi8(__mmask32 __U, __m256i __A, __m256i __I, __m256i __B) {
// CHECK-LABEL: @test_mm256_maskz_permutex2var_epi8
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.qi.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.qi.256
+ // CHECK: select <32 x i1> %{{.*}}, <32 x i8> %{{.*}}, <32 x i8> %{{.*}}
return _mm256_maskz_permutex2var_epi8(__U, __A, __I, __B);
}
diff --git a/clang/test/CodeGen/avx512vl-builtins.c b/clang/test/CodeGen/avx512vl-builtins.c
index 6e54592d727..f3ac6c95b91 100644
--- a/clang/test/CodeGen/avx512vl-builtins.c
+++ b/clang/test/CodeGen/avx512vl-builtins.c
@@ -3284,162 +3284,186 @@ __m256 test_mm256_maskz_sub_ps(__mmask8 __U, __m256 __A, __m256 __B) {
}
__m128i test_mm_mask2_permutex2var_epi32(__m128i __A, __m128i __I, __mmask8 __U, __m128i __B) {
// CHECK-LABEL: @test_mm_mask2_permutex2var_epi32
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.d.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.d.128
+ // CHECK: select <4 x i1> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}}
return _mm_mask2_permutex2var_epi32(__A,__I,__U,__B);
}
__m256i test_mm256_mask2_permutex2var_epi32(__m256i __A, __m256i __I, __mmask8 __U, __m256i __B) {
// CHECK-LABEL: @test_mm256_mask2_permutex2var_epi32
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.d.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.d.256
+ // CHECK: select <8 x i1> %{{.*}}, <8 x i32> %{{.*}}, <8 x i32> %{{.*}}
return _mm256_mask2_permutex2var_epi32(__A,__I,__U,__B);
}
__m128d test_mm_mask2_permutex2var_pd(__m128d __A, __m128i __I, __mmask8 __U, __m128d __B) {
// CHECK-LABEL: @test_mm_mask2_permutex2var_pd
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.pd.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.pd.128
+ // CHECK: select <2 x i1> %{{.*}}, <2 x double> %{{.*}}, <2 x double> %{{.*}}
return _mm_mask2_permutex2var_pd(__A,__I,__U,__B);
}
__m256d test_mm256_mask2_permutex2var_pd(__m256d __A, __m256i __I, __mmask8 __U, __m256d __B) {
// CHECK-LABEL: @test_mm256_mask2_permutex2var_pd
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.pd.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.pd.256
+ // CHECK: select <4 x i1> %{{.*}}, <4 x double> %{{.*}}, <4 x double> %{{.*}}
return _mm256_mask2_permutex2var_pd(__A,__I,__U,__B);
}
__m128 test_mm_mask2_permutex2var_ps(__m128 __A, __m128i __I, __mmask8 __U, __m128 __B) {
// CHECK-LABEL: @test_mm_mask2_permutex2var_ps
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.ps.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.ps.128
+ // CHECK: select <4 x i1> %{{.*}}, <4 x float> %{{.*}}, <4 x float> %{{.*}}
return _mm_mask2_permutex2var_ps(__A,__I,__U,__B);
}
__m256 test_mm256_mask2_permutex2var_ps(__m256 __A, __m256i __I, __mmask8 __U, __m256 __B) {
// CHECK-LABEL: @test_mm256_mask2_permutex2var_ps
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.ps.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.ps.256
+ // CHECK: select <8 x i1> %{{.*}}, <8 x float> %{{.*}}, <8 x float> %{{.*}}
return _mm256_mask2_permutex2var_ps(__A,__I,__U,__B);
}
__m128i test_mm_mask2_permutex2var_epi64(__m128i __A, __m128i __I, __mmask8 __U, __m128i __B) {
// CHECK-LABEL: @test_mm_mask2_permutex2var_epi64
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.q.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.q.128
+ // CHECK: select <2 x i1> %{{.*}}, <2 x i64> %{{.*}}, <2 x i64> %{{.*}}
return _mm_mask2_permutex2var_epi64(__A,__I,__U,__B);
}
__m256i test_mm256_mask2_permutex2var_epi64(__m256i __A, __m256i __I, __mmask8 __U, __m256i __B) {
// CHECK-LABEL: @test_mm256_mask2_permutex2var_epi64
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.q.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.q.256
+ // CHECK: select <4 x i1> %{{.*}}, <4 x i64> %{{.*}}, <4 x i64> %{{.*}}
return _mm256_mask2_permutex2var_epi64(__A,__I,__U,__B);
}
__m128i test_mm_permutex2var_epi32(__m128i __A, __m128i __I, __m128i __B) {
// CHECK-LABEL: @test_mm_permutex2var_epi32
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.d.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.d.128
return _mm_permutex2var_epi32(__A,__I,__B);
}
__m128i test_mm_mask_permutex2var_epi32(__m128i __A, __mmask8 __U, __m128i __I, __m128i __B) {
// CHECK-LABEL: @test_mm_mask_permutex2var_epi32
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.d.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.d.128
+ // CHECK: select <4 x i1> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}}
return _mm_mask_permutex2var_epi32(__A,__U,__I,__B);
}
__m128i test_mm_maskz_permutex2var_epi32(__mmask8 __U, __m128i __A, __m128i __I, __m128i __B) {
// CHECK-LABEL: @test_mm_maskz_permutex2var_epi32
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.d.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.d.128
+ // CHECK: select <4 x i1> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}}
return _mm_maskz_permutex2var_epi32(__U,__A,__I,__B);
}
__m256i test_mm256_permutex2var_epi32(__m256i __A, __m256i __I, __m256i __B) {
// CHECK-LABEL: @test_mm256_permutex2var_epi32
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.d.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.d.256
return _mm256_permutex2var_epi32(__A,__I,__B);
}
__m256i test_mm256_mask_permutex2var_epi32(__m256i __A, __mmask8 __U, __m256i __I, __m256i __B) {
// CHECK-LABEL: @test_mm256_mask_permutex2var_epi32
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.d.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.d.256
+ // CHECK: select <8 x i1> %{{.*}}, <8 x i32> %{{.*}}, <8 x i32> %{{.*}}
return _mm256_mask_permutex2var_epi32(__A,__U,__I,__B);
}
__m256i test_mm256_maskz_permutex2var_epi32(__mmask8 __U, __m256i __A, __m256i __I, __m256i __B) {
// CHECK-LABEL: @test_mm256_maskz_permutex2var_epi32
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.d.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.d.256
+ // CHECK: select <8 x i1> %{{.*}}, <8 x i32> %{{.*}}, <8 x i32> %{{.*}}
return _mm256_maskz_permutex2var_epi32(__U,__A,__I,__B);
}
__m128d test_mm_permutex2var_pd(__m128d __A, __m128i __I, __m128d __B) {
// CHECK-LABEL: @test_mm_permutex2var_pd
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.pd.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.pd.128
return _mm_permutex2var_pd(__A,__I,__B);
}
__m128d test_mm_mask_permutex2var_pd(__m128d __A, __mmask8 __U, __m128i __I, __m128d __B) {
// CHECK-LABEL: @test_mm_mask_permutex2var_pd
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.pd.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.pd.128
+ // CHECK: select <2 x i1> %{{.*}}, <2 x double> %{{.*}}, <2 x double> %{{.*}}
return _mm_mask_permutex2var_pd(__A,__U,__I,__B);
}
__m128d test_mm_maskz_permutex2var_pd(__mmask8 __U, __m128d __A, __m128i __I, __m128d __B) {
// CHECK-LABEL: @test_mm_maskz_permutex2var_pd
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.pd.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.pd.128
+ // CHECK: select <2 x i1> %{{.*}}, <2 x double> %{{.*}}, <2 x double> %{{.*}}
return _mm_maskz_permutex2var_pd(__U,__A,__I,__B);
}
__m256d test_mm256_permutex2var_pd(__m256d __A, __m256i __I, __m256d __B) {
// CHECK-LABEL: @test_mm256_permutex2var_pd
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.pd.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.pd.256
return _mm256_permutex2var_pd(__A,__I,__B);
}
__m256d test_mm256_mask_permutex2var_pd(__m256d __A, __mmask8 __U, __m256i __I, __m256d __B) {
// CHECK-LABEL: @test_mm256_mask_permutex2var_pd
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.pd.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.pd.256
+ // CHECK: select <4 x i1> %{{.*}}, <4 x double> %{{.*}}, <4 x double> %{{.*}}
return _mm256_mask_permutex2var_pd(__A,__U,__I,__B);
}
__m256d test_mm256_maskz_permutex2var_pd(__mmask8 __U, __m256d __A, __m256i __I, __m256d __B) {
// CHECK-LABEL: @test_mm256_maskz_permutex2var_pd
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.pd.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.pd.256
+ // CHECK: select <4 x i1> %{{.*}}, <4 x double> %{{.*}}, <4 x double> %{{.*}}
return _mm256_maskz_permutex2var_pd(__U,__A,__I,__B);
}
__m128 test_mm_permutex2var_ps(__m128 __A, __m128i __I, __m128 __B) {
// CHECK-LABEL: @test_mm_permutex2var_ps
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.ps.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.ps.128
return _mm_permutex2var_ps(__A,__I,__B);
}
__m128 test_mm_mask_permutex2var_ps(__m128 __A, __mmask8 __U, __m128i __I, __m128 __B) {
// CHECK-LABEL: @test_mm_mask_permutex2var_ps
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.ps.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.ps.128
+ // CHECK: select <4 x i1> %{{.*}}, <4 x float> %{{.*}}, <4 x float> %{{.*}}
return _mm_mask_permutex2var_ps(__A,__U,__I,__B);
}
__m128 test_mm_maskz_permutex2var_ps(__mmask8 __U, __m128 __A, __m128i __I, __m128 __B) {
// CHECK-LABEL: @test_mm_maskz_permutex2var_ps
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.ps.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.ps.128
+ // CHECK: select <4 x i1> %{{.*}}, <4 x float> %{{.*}}, <4 x float> %{{.*}}
return _mm_maskz_permutex2var_ps(__U,__A,__I,__B);
}
__m256 test_mm256_permutex2var_ps(__m256 __A, __m256i __I, __m256 __B) {
// CHECK-LABEL: @test_mm256_permutex2var_ps
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.ps.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.ps.256
return _mm256_permutex2var_ps(__A,__I,__B);
}
__m256 test_mm256_mask_permutex2var_ps(__m256 __A, __mmask8 __U, __m256i __I, __m256 __B) {
// CHECK-LABEL: @test_mm256_mask_permutex2var_ps
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.ps.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.ps.256
+ // CHECK: select <8 x i1> %{{.*}}, <8 x float> %{{.*}}, <8 x float> %{{.*}}
return _mm256_mask_permutex2var_ps(__A,__U,__I,__B);
}
__m256 test_mm256_maskz_permutex2var_ps(__mmask8 __U, __m256 __A, __m256i __I, __m256 __B) {
// CHECK-LABEL: @test_mm256_maskz_permutex2var_ps
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.ps.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.ps.256
+ // CHECK: select <8 x i1> %{{.*}}, <8 x float> %{{.*}}, <8 x float> %{{.*}}
return _mm256_maskz_permutex2var_ps(__U,__A,__I,__B);
}
__m128i test_mm_permutex2var_epi64(__m128i __A, __m128i __I, __m128i __B) {
// CHECK-LABEL: @test_mm_permutex2var_epi64
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.q.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.q.128
return _mm_permutex2var_epi64(__A,__I,__B);
}
__m128i test_mm_mask_permutex2var_epi64(__m128i __A, __mmask8 __U, __m128i __I, __m128i __B) {
// CHECK-LABEL: @test_mm_mask_permutex2var_epi64
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.q.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.q.128
+ // CHECK: select <2 x i1> %{{.*}}, <2 x i64> %{{.*}}, <2 x i64> %{{.*}}
return _mm_mask_permutex2var_epi64(__A,__U,__I,__B);
}
__m128i test_mm_maskz_permutex2var_epi64(__mmask8 __U, __m128i __A, __m128i __I, __m128i __B) {
// CHECK-LABEL: @test_mm_maskz_permutex2var_epi64
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.q.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.q.128
+ // CHECK: select <2 x i1> %{{.*}}, <2 x i64> %{{.*}}, <2 x i64> %{{.*}}
return _mm_maskz_permutex2var_epi64(__U,__A,__I,__B);
}
__m256i test_mm256_permutex2var_epi64(__m256i __A, __m256i __I, __m256i __B) {
// CHECK-LABEL: @test_mm256_permutex2var_epi64
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.q.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.q.256
return _mm256_permutex2var_epi64(__A,__I,__B);
}
__m256i test_mm256_mask_permutex2var_epi64(__m256i __A, __mmask8 __U, __m256i __I, __m256i __B) {
// CHECK-LABEL: @test_mm256_mask_permutex2var_epi64
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.q.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.q.256
+ // CHECK: select <4 x i1> %{{.*}}, <4 x i64> %{{.*}}, <4 x i64> %{{.*}}
return _mm256_mask_permutex2var_epi64(__A,__U,__I,__B);
}
__m256i test_mm256_maskz_permutex2var_epi64(__mmask8 __U, __m256i __A, __m256i __I, __m256i __B) {
// CHECK-LABEL: @test_mm256_maskz_permutex2var_epi64
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.q.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.q.256
+ // CHECK: select <4 x i1> %{{.*}}, <4 x i64> %{{.*}}, <4 x i64> %{{.*}}
return _mm256_maskz_permutex2var_epi64(__U,__A,__I,__B);
}
diff --git a/clang/test/CodeGen/avx512vlbw-builtins.c b/clang/test/CodeGen/avx512vlbw-builtins.c
index 8ca5fc95558..da16abd2a81 100644
--- a/clang/test/CodeGen/avx512vlbw-builtins.c
+++ b/clang/test/CodeGen/avx512vlbw-builtins.c
@@ -1617,43 +1617,49 @@ __m256i test_mm256_maskz_subs_epu16(__mmask16 __U, __m256i __A, __m256i __B) {
__m128i test_mm_mask2_permutex2var_epi16(__m128i __A, __m128i __I, __mmask8 __U, __m128i __B) {
// CHECK-LABEL: @test_mm_mask2_permutex2var_epi16
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.hi.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.hi.128
+ // CHECK: select <8 x i1> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}}
return _mm_mask2_permutex2var_epi16(__A,__I,__U,__B);
}
__m256i test_mm256_mask2_permutex2var_epi16(__m256i __A, __m256i __I, __mmask16 __U, __m256i __B) {
// CHECK-LABEL: @test_mm256_mask2_permutex2var_epi16
- // CHECK: @llvm.x86.avx512.mask.vpermi2var.hi.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.hi.256
+ // CHECK: select <16 x i1> %{{.*}}, <16 x i16> %{{.*}}, <16 x i16> %{{.*}}
return _mm256_mask2_permutex2var_epi16(__A,__I,__U,__B);
}
__m128i test_mm_permutex2var_epi16(__m128i __A, __m128i __I, __m128i __B) {
// CHECK-LABEL: @test_mm_permutex2var_epi16
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.hi.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.hi.128
return _mm_permutex2var_epi16(__A,__I,__B);
}
__m128i test_mm_mask_permutex2var_epi16(__m128i __A, __mmask8 __U, __m128i __I, __m128i __B) {
// CHECK-LABEL: @test_mm_mask_permutex2var_epi16
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.hi.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.hi.128
+ // CHECK: select <8 x i1> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}}
return _mm_mask_permutex2var_epi16(__A,__U,__I,__B);
}
__m128i test_mm_maskz_permutex2var_epi16(__mmask8 __U, __m128i __A, __m128i __I, __m128i __B) {
// CHECK-LABEL: @test_mm_maskz_permutex2var_epi16
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.hi.128
+ // CHECK: @llvm.x86.avx512.vpermi2var.hi.128
+ // CHECK: select <8 x i1> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}}
return _mm_maskz_permutex2var_epi16(__U,__A,__I,__B);
}
__m256i test_mm256_permutex2var_epi16(__m256i __A, __m256i __I, __m256i __B) {
// CHECK-LABEL: @test_mm256_permutex2var_epi16
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.hi.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.hi.256
return _mm256_permutex2var_epi16(__A,__I,__B);
}
__m256i test_mm256_mask_permutex2var_epi16(__m256i __A, __mmask16 __U, __m256i __I, __m256i __B) {
// CHECK-LABEL: @test_mm256_mask_permutex2var_epi16
- // CHECK: @llvm.x86.avx512.mask.vpermt2var.hi.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.hi.256
+ // CHECK: select <16 x i1> %{{.*}}, <16 x i16> %{{.*}}, <16 x i16> %{{.*}}
return _mm256_mask_permutex2var_epi16(__A,__U,__I,__B);
}
__m256i test_mm256_maskz_permutex2var_epi16(__mmask16 __U, __m256i __A, __m256i __I, __m256i __B) {
// CHECK-LABEL: @test_mm256_maskz_permutex2var_epi16
- // CHECK: @llvm.x86.avx512.maskz.vpermt2var.hi.256
+ // CHECK: @llvm.x86.avx512.vpermi2var.hi.256
+ // CHECK: select <16 x i1> %{{.*}}, <16 x i16> %{{.*}}, <16 x i16> %{{.*}}
return _mm256_maskz_permutex2var_epi16(__U,__A,__I,__B);
}
__m128i test_mm_mask_maddubs_epi16(__m128i __W, __mmask8 __U, __m128i __X, __m128i __Y) {
OpenPOWER on IntegriCloud