[v5,05/18] x86-64: Add vector exp10/exp10f implementation to libmvec

Implement vectorized exp10/exp10f containing SSE, AVX, AVX2 and
AVX512 versions for libmvec as per vector ABI.  It also contains
accuracy and ABI tests for vector exp10/exp10f with regenerated ulps.
---
 bits/libm-simd-decl-stubs.h                   |  11 +
 math/bits/mathcalls.h                         |   2 +-
 .../unix/sysv/linux/x86_64/libmvec.abilist    |   8 +
 sysdeps/x86/fpu/bits/math-vector.h            |   4 +
 .../x86/fpu/finclude/math-vector-fortran.h    |   4 +
 sysdeps/x86_64/fpu/Makeconfig                 |   1 +
 sysdeps/x86_64/fpu/Versions                   |   2 +
 sysdeps/x86_64/fpu/libm-test-ulps             |  20 +
 .../fpu/multiarch/svml_d_exp102_core-sse2.S   |  20 +
 .../x86_64/fpu/multiarch/svml_d_exp102_core.c |  27 ++
 .../fpu/multiarch/svml_d_exp102_core_sse4.S   | 418 +++++++++++++++++
 .../fpu/multiarch/svml_d_exp104_core-sse.S    |  20 +
 .../x86_64/fpu/multiarch/svml_d_exp104_core.c |  27 ++
 .../fpu/multiarch/svml_d_exp104_core_avx2.S   | 429 ++++++++++++++++++
 .../fpu/multiarch/svml_d_exp108_core-avx2.S   |  20 +
 .../x86_64/fpu/multiarch/svml_d_exp108_core.c |  27 ++
 .../fpu/multiarch/svml_d_exp108_core_avx512.S | 287 ++++++++++++
 .../fpu/multiarch/svml_s_exp10f16_core-avx2.S |  20 +
 .../fpu/multiarch/svml_s_exp10f16_core.c      |  28 ++
 .../multiarch/svml_s_exp10f16_core_avx512.S   | 269 +++++++++++
 .../fpu/multiarch/svml_s_exp10f4_core-sse2.S  |  20 +
 .../fpu/multiarch/svml_s_exp10f4_core.c       |  28 ++
 .../fpu/multiarch/svml_s_exp10f4_core_sse4.S  | 311 +++++++++++++
 .../fpu/multiarch/svml_s_exp10f8_core-sse.S   |  20 +
 .../fpu/multiarch/svml_s_exp10f8_core.c       |  28 ++
 .../fpu/multiarch/svml_s_exp10f8_core_avx2.S  | 331 ++++++++++++++
 sysdeps/x86_64/fpu/svml_d_exp102_core.S       |  29 ++
 sysdeps/x86_64/fpu/svml_d_exp104_core.S       |  29 ++
 sysdeps/x86_64/fpu/svml_d_exp104_core_avx.S   |  25 +
 sysdeps/x86_64/fpu/svml_d_exp108_core.S       |  25 +
 sysdeps/x86_64/fpu/svml_s_exp10f16_core.S     |  25 +
 sysdeps/x86_64/fpu/svml_s_exp10f4_core.S      |  29 ++
 sysdeps/x86_64/fpu/svml_s_exp10f8_core.S      |  29 ++
 sysdeps/x86_64/fpu/svml_s_exp10f8_core_avx.S  |  25 +
 .../fpu/test-double-libmvec-exp10-avx.c       |   1 +
 .../fpu/test-double-libmvec-exp10-avx2.c      |   1 +
 .../fpu/test-double-libmvec-exp10-avx512f.c   |   1 +
 .../x86_64/fpu/test-double-libmvec-exp10.c    |   3 +
 .../x86_64/fpu/test-double-vlen2-wrappers.c   |   1 +
 .../fpu/test-double-vlen4-avx2-wrappers.c     |   1 +
 .../x86_64/fpu/test-double-vlen4-wrappers.c   |   1 +
 .../x86_64/fpu/test-double-vlen8-wrappers.c   |   1 +
 .../fpu/test-float-libmvec-exp10f-avx.c       |   1 +
 .../fpu/test-float-libmvec-exp10f-avx2.c      |   1 +
 .../fpu/test-float-libmvec-exp10f-avx512f.c   |   1 +
 .../x86_64/fpu/test-float-libmvec-exp10f.c    |   3 +
 .../x86_64/fpu/test-float-vlen16-wrappers.c   |   1 +
 .../x86_64/fpu/test-float-vlen4-wrappers.c    |   1 +
 .../fpu/test-float-vlen8-avx2-wrappers.c      |   1 +
 .../x86_64/fpu/test-float-vlen8-wrappers.c    |   1 +
 50 files changed, 2617 insertions(+), 1 deletion(-)
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_d_exp102_core-sse2.S
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_d_exp102_core.c
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_d_exp102_core_sse4.S
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_d_exp104_core-sse.S
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_d_exp104_core.c
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_d_exp104_core_avx2.S
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_d_exp108_core-avx2.S
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_d_exp108_core.c
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_d_exp108_core_avx512.S
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_s_exp10f16_core-avx2.S
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_s_exp10f16_core.c
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_s_exp10f16_core_avx512.S
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_s_exp10f4_core-sse2.S
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_s_exp10f4_core.c
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_s_exp10f4_core_sse4.S
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_s_exp10f8_core-sse.S
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_s_exp10f8_core.c
 create mode 100644 sysdeps/x86_64/fpu/multiarch/svml_s_exp10f8_core_avx2.S
 create mode 100644 sysdeps/x86_64/fpu/svml_d_exp102_core.S
 create mode 100644 sysdeps/x86_64/fpu/svml_d_exp104_core.S
 create mode 100644 sysdeps/x86_64/fpu/svml_d_exp104_core_avx.S
 create mode 100644 sysdeps/x86_64/fpu/svml_d_exp108_core.S
 create mode 100644 sysdeps/x86_64/fpu/svml_s_exp10f16_core.S
 create mode 100644 sysdeps/x86_64/fpu/svml_s_exp10f4_core.S
 create mode 100644 sysdeps/x86_64/fpu/svml_s_exp10f8_core.S
 create mode 100644 sysdeps/x86_64/fpu/svml_s_exp10f8_core_avx.S
 create mode 100644 sysdeps/x86_64/fpu/test-double-libmvec-exp10-avx.c
 create mode 100644 sysdeps/x86_64/fpu/test-double-libmvec-exp10-avx2.c
 create mode 100644 sysdeps/x86_64/fpu/test-double-libmvec-exp10-avx512f.c
 create mode 100644 sysdeps/x86_64/fpu/test-double-libmvec-exp10.c
 create mode 100644 sysdeps/x86_64/fpu/test-float-libmvec-exp10f-avx.c
 create mode 100644 sysdeps/x86_64/fpu/test-float-libmvec-exp10f-avx2.c
 create mode 100644 sysdeps/x86_64/fpu/test-float-libmvec-exp10f-avx512f.c
 create mode 100644 sysdeps/x86_64/fpu/test-float-libmvec-exp10f.c

Message ID	20211229064000.1465621-6-skpgkp2@gmail.com
State	New
Headers	show Return-Path: <libc-alpha-bounces+incoming=patchwork.ozlabs.org@sourceware.org> DMARC-Filter: OpenDMARC Filter v1.4.1 sourceware.org 8E8073858D39 To: libc-alpha@sourceware.org Subject: [PATCH v5 05/18] x86-64: Add vector exp10/exp10f implementation to libmvec Date: Tue, 28 Dec 2021 22:39:47 -0800 Message-Id: <20211229064000.1465621-6-skpgkp2@gmail.com> In-Reply-To: <20211229064000.1465621-1-skpgkp2@gmail.com> References: <20211229064000.1465621-1-skpgkp2@gmail.com> MIME-Version: 1.0 Content-Transfer-Encoding: 8bit Precedence: list From: Sunil K Pandey via Libc-alpha <libc-alpha@sourceware.org> Reply-To: Sunil K Pandey <skpgkp2@gmail.com> Cc: andrey.kolesov@intel.com, marius.cornea@intel.com Errors-To: libc-alpha-bounces+incoming=patchwork.ozlabs.org@sourceware.org Sender: "Libc-alpha" <libc-alpha-bounces+incoming=patchwork.ozlabs.org@sourceware.org>
Series	x86-64: Add vector math functions to libmvec \| expand [v5,00/18] x86-64: Add vector math functions to libmvec [v5,01/18] x86-64: Add vector atan/atanf implementation to libmvec [v5,02/18] x86-64: Add vector asin/asinf implementation to libmvec [v5,03/18] x86-64: Add vector hypot/hypotf implementation to libmvec [v5,04/18] x86-64: Add vector exp2/exp2f implementation to libmvec [v5,05/18] x86-64: Add vector exp10/exp10f implementation to libmvec [v5,06/18] x86-64: Add vector cosh/coshf implementation to libmvec [v5,07/18] x86-64: Add vector expm1/expm1f implementation to libmvec [v5,08/18] x86-64: Add vector sinh/sinhf implementation to libmvec [v5,09/18] x86-64: Add vector cbrt/cbrtf implementation to libmvec [v5,10/18] x86-64: Add vector atan2/atan2f implementation to libmvec [v5,11/18] x86-64: Add vector log10/log10f implementation to libmvec [v5,12/18] x86-64: Add vector log2/log2f implementation to libmvec [v5,13/18] x86-64: Add vector log1p/log1pf implementation to libmvec [v5,14/18] x86-64: Add vector atanh/atanhf implementation to libmvec [v5,15/18] x86-64: Add vector acosh/acoshf implementation to libmvec [v5,16/18] x86-64: Add vector erf/erff implementation to libmvec [v5,17/18] x86-64: Add vector tanh/tanhf implementation to libmvec [v5,18/18] x86-64: Add vector asinh/asinhf implementation to libmvec

[v5,05/18] x86-64: Add vector exp10/exp10f implementation to libmvec

Commit Message

Comments

Patch