diff options
| author | Michael Zuckerman <Michael.zuckerman@intel.com> | 2016-02-23 13:41:13 +0000 |
|---|---|---|
| committer | Michael Zuckerman <Michael.zuckerman@intel.com> | 2016-02-23 13:41:13 +0000 |
| commit | 0231f1649bd0d74828db9b41481421a67f469a6a (patch) | |
| tree | cd2c914db25fbc0d0475e384f4aed17c221581a9 /clang/lib/Headers | |
| parent | 30e7a8f694a19553f64b3a3a5de81ce317b9ec2f (diff) | |
| download | bcm5719-llvm-0231f1649bd0d74828db9b41481421a67f469a6a.tar.gz bcm5719-llvm-0231f1649bd0d74828db9b41481421a67f469a6a.zip | |
[CLANG] [AVX512] [BUILTIN] Adding pro{lv|r}{d|q}{128|256|512} builtin to clang
Differential Revision: http://reviews.llvm.org/D17506
llvm-svn: 261635
Diffstat (limited to 'clang/lib/Headers')
| -rw-r--r-- | clang/lib/Headers/avx512fintrin.h | 97 | ||||
| -rw-r--r-- | clang/lib/Headers/avx512vlintrin.h | 201 |
2 files changed, 298 insertions, 0 deletions
diff --git a/clang/lib/Headers/avx512fintrin.h b/clang/lib/Headers/avx512fintrin.h index 65d65ce7297..8399731b2f5 100644 --- a/clang/lib/Headers/avx512fintrin.h +++ b/clang/lib/Headers/avx512fintrin.h @@ -3363,6 +3363,103 @@ _mm512_maskz_cvtepu16_epi64 (__mmask8 __U, __m128i __A) (__v8di)\ _mm512_setzero_si512 (),\ (__mmask8) (U)); }) +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_rolv_epi32 (__m512i __A, __m512i __B) +{ + return (__m512i) __builtin_ia32_prolvd512_mask ((__v16si) __A, + (__v16si) __B, + (__v16si) + _mm512_setzero_si512 (), + (__mmask16) -1); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_rolv_epi32 (__m512i __W, __mmask16 __U, __m512i __A, __m512i __B) +{ + return (__m512i) __builtin_ia32_prolvd512_mask ((__v16si) __A, + (__v16si) __B, + (__v16si) __W, + (__mmask16) __U); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_rolv_epi32 (__mmask16 __U, __m512i __A, __m512i __B) +{ + return (__m512i) __builtin_ia32_prolvd512_mask ((__v16si) __A, + (__v16si) __B, + (__v16si) + _mm512_setzero_si512 (), + (__mmask16) __U); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_rolv_epi64 (__m512i __A, __m512i __B) +{ + return (__m512i) __builtin_ia32_prolvq512_mask ((__v8di) __A, + (__v8di) __B, + (__v8di) + _mm512_setzero_si512 (), + (__mmask8) -1); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_rolv_epi64 (__m512i __W, __mmask8 __U, __m512i __A, __m512i __B) +{ + return (__m512i) __builtin_ia32_prolvq512_mask ((__v8di) __A, + (__v8di) __B, + (__v8di) __W, + (__mmask8) __U); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_rolv_epi64 (__mmask8 __U, __m512i __A, __m512i __B) +{ + return (__m512i) __builtin_ia32_prolvq512_mask ((__v8di) __A, + (__v8di) __B, + (__v8di) + _mm512_setzero_si512 (), + (__mmask8) __U); +} + +#define _mm512_ror_epi32( __A, __B) __extension__ ({ \ +__builtin_ia32_prord512_mask ((__v16si)( __A),( __B),\ + (__v16si)\ + _mm512_setzero_si512 (),\ + (__mmask16) -1);\ +} + +#define _mm512_mask_ror_epi32( __W, __U, __A, __B) __extension__ ({ \ +__builtin_ia32_prord512_mask ((__v16si)( __A),( __B),\ + (__v16si)( __W),\ + (__mmask16)( __U));\ +} + +#define _mm512_maskz_ror_epi32( __U, __A, __B) __extension__ ({ \ +__builtin_ia32_prord512_mask ((__v16si)( __A),( __B),\ + (__v16si)\ + _mm512_setzero_si512 (),\ + (__mmask16)( __U));\ +} + +#define _mm512_ror_epi64( __A, __B) __extension__ ({ \ +__builtin_ia32_prorq512_mask ((__v8di)( __A),( __B),\ + (__v8di)\ + _mm512_setzero_si512 (),\ + (__mmask8) -1);\ +} + +#define _mm512_mask_ror_epi64( __W, __U, __A, __B) __extension__ ({ \ +__builtin_ia32_prorq512_mask ((__v8di)( __A),( __B),\ + (__v8di)( __W),\ + (__mmask8)( __U));\ +} + +#define _mm512_maskz_ror_epi64( __U, __A, __B) __extension__ ({ \ +__builtin_ia32_prorq512_mask ((__v8di)( __A),( __B),\ + (__v8di)\ + _mm512_setzero_si512 (),\ + (__mmask8)( __U));\ +} #undef __DEFAULT_FN_ATTRS diff --git a/clang/lib/Headers/avx512vlintrin.h b/clang/lib/Headers/avx512vlintrin.h index ace03d55fb9..1c512d1f0cd 100644 --- a/clang/lib/Headers/avx512vlintrin.h +++ b/clang/lib/Headers/avx512vlintrin.h @@ -5015,6 +5015,207 @@ _mm256_maskz_cvtepu16_epi64 (__mmask8 __U, __m128i __A) _mm256_setzero_si256 (),\ (__mmask8) (u)); }) +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_rolv_epi32 (__m128i __A, __m128i __B) +{ + return (__m128i) __builtin_ia32_prolvd128_mask ((__v4si) __A, + (__v4si) __B, + (__v4si) + _mm_setzero_si128 (), + (__mmask8) -1); +} + +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_mask_rolv_epi32 (__m128i __W, __mmask8 __U, __m128i __A, + __m128i __B) +{ + return (__m128i) __builtin_ia32_prolvd128_mask ((__v4si) __A, + (__v4si) __B, + (__v4si) __W, + (__mmask8) __U); +} + +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_maskz_rolv_epi32 (__mmask8 __U, __m128i __A, __m128i __B) +{ + return (__m128i) __builtin_ia32_prolvd128_mask ((__v4si) __A, + (__v4si) __B, + (__v4si) + _mm_setzero_si128 (), + (__mmask8) __U); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_rolv_epi32 (__m256i __A, __m256i __B) +{ + return (__m256i) __builtin_ia32_prolvd256_mask ((__v8si) __A, + (__v8si) __B, + (__v8si) + _mm256_setzero_si256 (), + (__mmask8) -1); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_mask_rolv_epi32 (__m256i __W, __mmask8 __U, __m256i __A, + __m256i __B) +{ + return (__m256i) __builtin_ia32_prolvd256_mask ((__v8si) __A, + (__v8si) __B, + (__v8si) __W, + (__mmask8) __U); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_maskz_rolv_epi32 (__mmask8 __U, __m256i __A, __m256i __B) +{ + return (__m256i) __builtin_ia32_prolvd256_mask ((__v8si) __A, + (__v8si) __B, + (__v8si) + _mm256_setzero_si256 (), + (__mmask8) __U); +} + +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_rolv_epi64 (__m128i __A, __m128i __B) +{ + return (__m128i) __builtin_ia32_prolvq128_mask ((__v2di) __A, + (__v2di) __B, + (__v2di) + _mm_setzero_di (), + (__mmask8) -1); +} + +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_mask_rolv_epi64 (__m128i __W, __mmask8 __U, __m128i __A, + __m128i __B) +{ + return (__m128i) __builtin_ia32_prolvq128_mask ((__v2di) __A, + (__v2di) __B, + (__v2di) __W, + (__mmask8) __U); +} + +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_maskz_rolv_epi64 (__mmask8 __U, __m128i __A, __m128i __B) +{ + return (__m128i) __builtin_ia32_prolvq128_mask ((__v2di) __A, + (__v2di) __B, + (__v2di) + _mm_setzero_di (), + (__mmask8) __U); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_rolv_epi64 (__m256i __A, __m256i __B) +{ + return (__m256i) __builtin_ia32_prolvq256_mask ((__v4di) __A, + (__v4di) __B, + (__v4di) + _mm256_setzero_si256 (), + (__mmask8) -1); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_mask_rolv_epi64 (__m256i __W, __mmask8 __U, __m256i __A, + __m256i __B) +{ + return (__m256i) __builtin_ia32_prolvq256_mask ((__v4di) __A, + (__v4di) __B, + (__v4di) __W, + (__mmask8) __U); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_maskz_rolv_epi64 (__mmask8 __U, __m256i __A, __m256i __B) +{ + return (__m256i) __builtin_ia32_prolvq256_mask ((__v4di) __A, + (__v4di) __B, + (__v4di) + _mm256_setzero_si256 (), + (__mmask8) __U); +} + +#define _mm_ror_epi32( __A, __B) __extension__ ({ \ +__builtin_ia32_prord128_mask ((__v4si)( __A),( __B),\ + (__v4si)\ + _mm_setzero_si128 (),\ + (__mmask8) -1);\ +} + +#define _mm_mask_ror_epi32( __W, __U, __A ,__B) __extension__ ({ \ +__builtin_ia32_prord128_mask ((__v4si) __A, __B,\ + (__v4si)( __W),\ + (__mmask8)( __U));\ +} + +#define _mm_maskz_ror_epi32( __U, __A, __B) __extension__ ({ \ +__builtin_ia32_prord128_mask ((__v4si)( __A),( __B),\ + (__v4si)\ + _mm_setzero_si128 (),\ + (__mmask8)( __U));\ +} + +#define _mm256_ror_epi32( __A, __B) __extension__ ({ \ +__builtin_ia32_prord256_mask ((__v8si)( __A),( __B),\ + (__v8si)\ + _mm256_setzero_si256 (),\ + (__mmask8) -1);\ +} + +#define _mm256_mask_ror_epi32( __W, __U, __A ,__B) __extension__ ({ \ +__builtin_ia32_prord256_mask ((__v8si) __A, __B,\ + (__v8si)( __W),\ + (__mmask8)( __U));\ +} + +#define _mm256_maskz_ror_epi32( __U, __A, __B) __extension__ ({ \ +__builtin_ia32_prord256_mask ((__v8si)( __A),( __B),\ + (__v8si)\ + _mm256_setzero_si256 (),\ + (__mmask8)( __U));\ +} + +#define _mm_ror_epi64( __A, __B) __extension__ ({ \ +__builtin_ia32_prorq128_mask ((__v2di)( __A),( __B),\ + (__v2di)\ + _mm_setzero_di (),\ + (__mmask8) -1);\ +} + +#define _mm_mask_ror_epi64( __W, __U, __A ,__B) __extension__ ({ \ +__builtin_ia32_prorq128_mask ((__v2di) __A, __B,\ + (__v2di)( __W),\ + (__mmask8)( __U));\ +} + +#define _mm_maskz_ror_epi64( __U, __A, __B) __extension__ ({ \ +__builtin_ia32_prorq128_mask ((__v2di)( __A),( __B),\ + (__v2di)\ + _mm_setzero_di (),\ + (__mmask8)( __U));\ +} + +#define _mm256_ror_epi64( __A, __B) __extension__ ({ \ +__builtin_ia32_prorq256_mask ((__v4di)( __A),( __B),\ + (__v4di)\ + _mm256_setzero_si256 (),\ + (__mmask8) -1);\ +} + +#define _mm256_mask_ror_epi64( __W, __U, __A ,__B) __extension__ ({ \ +__builtin_ia32_prorq256_mask ((__v4di) __A, __B,\ + (__v4di)( __W),\ + (__mmask8)( __U));\ +} + +#define _mm256_maskz_ror_epi64( __U, __A, __B) __extension__ ({ \ +__builtin_ia32_prorq256_mask ((__v4di)( __A),( __B),\ + (__v4di)\ + _mm256_setzero_si256 (),\ + (__mmask8)( __U));\ +} + + #undef __DEFAULT_FN_ATTRS #undef __DEFAULT_FN_ATTRS_BOTH |

