docs/latest/UMESimdCommon_8h_source.html

// internal header; common parts to multiple UMESIMD backends

#ifndef VECCORE_UMESIMDCOMMON_H

#define VECCORE_UMESIMDCOMMON_H


namespace vecCore {


// type traits for UME::SIMD


template <uint32_t N>

struct TypeTraits<UME::SIMD::SIMDVecMask<N>> {

  using MaskType   = typename UME::SIMD::SIMDVecMask<N>;

  using IndexType  = int;

  using ScalarType = bool;

  static constexpr size_t Size = N;

};


template <typename T, uint32_t N>

struct TypeTraits<UME::SIMD::SIMDVec_f<T, N>> {

  using ScalarType = T;

  using MaskType   = typename UME::SIMD::SIMDVecMask<N>;

  using IndexType  = typename UME::SIMD::SIMDVec_u<uint32_t, N>;

  static constexpr size_t Size = N;

};


template <typename T, uint32_t N>

struct TypeTraits<UME::SIMD::SIMDVec_i<T, N>> {

  using ScalarType = T;

  using MaskType   = typename UME::SIMD::SIMDVecMask<N>;

  using IndexType  = typename UME::SIMD::SIMDVec_u<uint32_t, N>;

  static constexpr size_t Size = N;

};


template <typename T, uint32_t N>

struct TypeTraits<UME::SIMD::SIMDVec_u<T, N>> {

  using ScalarType = T;

  using MaskType   = typename UME::SIMD::SIMDVecMask<N>;

  using IndexType  = typename UME::SIMD::SIMDVec_u<uint32_t, N>;

  static constexpr size_t Size = N;

};


// backend functions for UME::SIMD


template <uint32_t N>

VECCORE_FORCE_INLINE

bool MaskFull(const UME::SIMD::SIMDVecMask<N> &cond)

{

  return cond.hland();

}


template <uint32_t N>

VECCORE_FORCE_INLINE

bool MaskEmpty(const UME::SIMD::SIMDVecMask<N> &cond)

{

  return !cond.hlor();

}


template <uint32_t N>

struct IndexingImplementation<UME::SIMD::SIMDVecMask<N>> {

  using M = UME::SIMD::SIMDVecMask<N>;


  VECCORE_FORCE_INLINE VECCORE_ATT_HOST_DEVICE static bool Get(const M &mask, int i) { return mask[i]; }


  VECCORE_FORCE_INLINE VECCORE_ATT_HOST_DEVICE static void Set(M &mask, int i, const bool val)

  {

    mask.insert(i, val);

  }

};


template <typename T, uint32_t N>

struct LoadStoreImplementation<UME::SIMD::SIMDVec_f<T, N>> {

  using V = UME::SIMD::SIMDVec_f<T, N>;


  template <typename S = Scalar<V>>

  static inline void Load(V &v, S const *ptr)

  {

    v.load(ptr);

  }


  template <typename S = Scalar<V>>

  static inline void Store(V const &v, S *ptr)

  {

    v.store(ptr);

  }

};


template <typename T, uint32_t N>

struct LoadStoreImplementation<UME::SIMD::SIMDVec_i<T, N>> {

  using V = UME::SIMD::SIMDVec_i<T, N>;


  template <typename S = Scalar<V>>

  static inline void Load(V &v, S const *ptr)

  {

    v.load(ptr);

  }


  template <typename S = Scalar<V>>

  static inline void Store(V const &v, S *ptr)

  {

    v.store(ptr);

  }

};


template <typename T, uint32_t N>

struct LoadStoreImplementation<UME::SIMD::SIMDVec_u<T, N>> {

  using V = UME::SIMD::SIMDVec_u<T, N>;


  template <typename S = Scalar<V>>

  static inline void Load(V &v, S const *ptr)

  {

    v.load(ptr);

  }


  template <typename S = Scalar<V>>

  static inline void Store(V const &v, S *ptr)

  {

    v.store(ptr);

  }

};


template <uint32_t N>

struct LoadStoreImplementation<UME::SIMD::SIMDVecMask<N>> {

  using M = UME::SIMD::SIMDVecMask<N>;


  template <typename S = Scalar<M>>

  static inline void Load(M &mask, S const *ptr)

  {

    mask.load(ptr);

  }


  template <typename S = Scalar<M>>

  static inline void Store(M const &mask, S *ptr)

  {

    mask.store(ptr);

  }

};


template <typename T, uint32_t N>

struct MaskingImplementation<UME::SIMD::SIMDVec_f<T, N>> {

  using V = UME::SIMD::SIMDVec_f<T, N>;

  using M = UME::SIMD::SIMDVecMask<N>;


  static inline void Assign(V &dst, M const &mask, V const &src) { dst.assign(mask, src); }


  static inline void Blend(V &dst, M const &mask, V const &src1, V const &src2) { dst = src2.blend(mask, src1); }

};


template <typename T, uint32_t N>

struct MaskingImplementation<UME::SIMD::SIMDVec_i<T, N>> {

  using V = UME::SIMD::SIMDVec_i<T, N>;

  using M = UME::SIMD::SIMDVecMask<N>;


  static inline void Assign(V &dst, M const &mask, V const &src) { dst.assign(mask, src); }


  static inline void Blend(V &dst, M const &mask, V const &src1, V const &src2) { dst = src2.blend(mask, src1); }

};


template <typename T, uint32_t N>

struct MaskingImplementation<UME::SIMD::SIMDVec_u<T, N>> {

  using V = UME::SIMD::SIMDVec_u<T, N>;

  using M = UME::SIMD::SIMDVecMask<N>;


  static inline void Assign(V &dst, M const &mask, V const &src) { dst.assign(mask, src); }


  static inline void Blend(V &dst, M const &mask, V const &src1, V const &src2) { dst = src2.blend(mask, src1); }

};


inline namespace math {


template <typename T, uint32_t N>

VECCORE_FORCE_INLINE

void SinCos(const UME::SIMD::SIMDVec_f<T, N> &x, UME::SIMD::SIMDVec_f<T, N> *s, UME::SIMD::SIMDVec_f<T, N> *c)

{

  *s = x.sin();

  *c = x.cos();

}


#define UMESIMD_MATH_UNARY_FUNCTION(F, f) \

template <typename T, uint32_t N>         \

VECCORE_FORCE_INLINE                      \

typename UME::SIMD::SIMDVec_f<T, N>       \

F(const UME::SIMD::SIMDVec_f<T, N> &x)    \

{ return x.f(); }


// UMESIMD_MATH_UNARY_FUNCTION(Abs, abs)  // Generic implementation is faster


// UMESIMD_MATH_UNARY_FUNCTION(Sin, sin) // broken

// UMESIMD_MATH_UNARY_FUNCTION(Cos, cos) // broken

UMESIMD_MATH_UNARY_FUNCTION(Tan, tan)

UMESIMD_MATH_UNARY_FUNCTION(ATan, atan)


// UMESIMD_MATH_UNARY_FUNCTION(Exp, exp) // broken

// UMESIMD_MATH_UNARY_FUNCTION(Log, log) // broken

// UMESIMD_MATH_UNARY_FUNCTION(Sqrt, sqrt) // slower than std::sqrt()

// UMESIMD_MATH_UNARY_FUNCTION(Rsqrt, rsqrt) // slower than std::sqrt(1/x)


UMESIMD_MATH_UNARY_FUNCTION(Round, round)

// UMESIMD_MATH_UNARY_FUNCTION(Floor, floor) // slower than std::floor()

// UMESIMD_MATH_UNARY_FUNCTION(Ceil, ceil) // slower than std::ceil()


#undef UMESIMD_MATH_UNARY_FUNCTION


template <typename T, uint32_t N>

VECCORE_FORCE_INLINE

UME::SIMD::SIMDVecMask<N> IsInf(const UME::SIMD::SIMDVec_f<T, N> &x)

{

  return x.isinf();

}


} // end namespace math

} // end namespace vecCore


#endif

VECCORE_ATT_HOST_DEVICE
#define VECCORE_ATT_HOST_DEVICE
Definition: CUDA.h:10

VECCORE_FORCE_INLINE
#define VECCORE_FORCE_INLINE
Definition: Common.h:32

UMESIMD_MATH_UNARY_FUNCTION
#define UMESIMD_MATH_UNARY_FUNCTION(F, f)
Definition: UMESimdCommon.h:177

vecCore::math::SinCos
VECCORE_FORCE_INLINE void SinCos(const UME::SIMD::SIMDVec_f< T, N > &x, UME::SIMD::SIMDVec_f< T, N > *s, UME::SIMD::SIMDVec_f< T, N > *c)
Definition: UMESimdCommon.h:171

vecCore::math::IsInf
VECCORE_FORCE_INLINE UME::SIMD::SIMDVecMask< N > IsInf(const UME::SIMD::SIMDVec_f< T, N > &x)
Definition: UMESimdCommon.h:204

vecCore::math::Tan
VECCORE_FORCE_INLINE Vc::SimdArray< T, N > Tan(const Vc::SimdArray< T, N > &x)
Definition: VcSimdArray.h:148

vecCore
Definition: Deprecated.h:12

vecCore::MaskEmpty
VECCORE_ATT_HOST_DEVICE bool MaskEmpty(const M &mask)
Definition: Implementation.h:222

vecCore::MaskFull
VECCORE_ATT_HOST_DEVICE bool MaskFull(const M &mask)
Definition: Implementation.h:213

vecCore::IndexingImplementation< UME::SIMD::SIMDVecMask< N > >::Set
VECCORE_FORCE_INLINE static VECCORE_ATT_HOST_DEVICE void Set(M &mask, int i, const bool val)
Definition: UMESimdCommon.h:63

vecCore::IndexingImplementation< UME::SIMD::SIMDVecMask< N > >::Get
VECCORE_FORCE_INLINE static VECCORE_ATT_HOST_DEVICE bool Get(const M &mask, int i)
Definition: UMESimdCommon.h:61

vecCore::IndexingImplementation< UME::SIMD::SIMDVecMask< N > >::M
UME::SIMD::SIMDVecMask< N > M
Definition: UMESimdCommon.h:59

vecCore::IndexingImplementation
Definition: Implementation.h:94

vecCore::LoadStoreImplementation< UME::SIMD::SIMDVecMask< N > >::M
UME::SIMD::SIMDVecMask< N > M
Definition: UMESimdCommon.h:122

vecCore::LoadStoreImplementation< UME::SIMD::SIMDVecMask< N > >::Load
static void Load(M &mask, S const *ptr)
Definition: UMESimdCommon.h:125

vecCore::LoadStoreImplementation< UME::SIMD::SIMDVecMask< N > >::Store
static void Store(M const &mask, S *ptr)
Definition: UMESimdCommon.h:131

vecCore::LoadStoreImplementation< UME::SIMD::SIMDVec_f< T, N > >::V
UME::SIMD::SIMDVec_f< T, N > V
Definition: UMESimdCommon.h:71

vecCore::LoadStoreImplementation< UME::SIMD::SIMDVec_f< T, N > >::Load
static void Load(V &v, S const *ptr)
Definition: UMESimdCommon.h:74

vecCore::LoadStoreImplementation< UME::SIMD::SIMDVec_f< T, N > >::Store
static void Store(V const &v, S *ptr)
Definition: UMESimdCommon.h:80

vecCore::LoadStoreImplementation< UME::SIMD::SIMDVec_i< T, N > >::V
UME::SIMD::SIMDVec_i< T, N > V
Definition: UMESimdCommon.h:88

vecCore::LoadStoreImplementation< UME::SIMD::SIMDVec_i< T, N > >::Store
static void Store(V const &v, S *ptr)
Definition: UMESimdCommon.h:97

vecCore::LoadStoreImplementation< UME::SIMD::SIMDVec_i< T, N > >::Load
static void Load(V &v, S const *ptr)
Definition: UMESimdCommon.h:91

vecCore::LoadStoreImplementation< UME::SIMD::SIMDVec_u< T, N > >::V
UME::SIMD::SIMDVec_u< T, N > V
Definition: UMESimdCommon.h:105

vecCore::LoadStoreImplementation< UME::SIMD::SIMDVec_u< T, N > >::Store
static void Store(V const &v, S *ptr)
Definition: UMESimdCommon.h:114

vecCore::LoadStoreImplementation< UME::SIMD::SIMDVec_u< T, N > >::Load
static void Load(V &v, S const *ptr)
Definition: UMESimdCommon.h:108

vecCore::LoadStoreImplementation
Definition: Implementation.h:122

vecCore::MaskingImplementation< UME::SIMD::SIMDVec_f< T, N > >::V
UME::SIMD::SIMDVec_f< T, N > V
Definition: UMESimdCommon.h:139

vecCore::MaskingImplementation< UME::SIMD::SIMDVec_f< T, N > >::M
UME::SIMD::SIMDVecMask< N > M
Definition: UMESimdCommon.h:140

vecCore::MaskingImplementation< UME::SIMD::SIMDVec_f< T, N > >::Assign
static void Assign(V &dst, M const &mask, V const &src)
Definition: UMESimdCommon.h:142

vecCore::MaskingImplementation< UME::SIMD::SIMDVec_f< T, N > >::Blend
static void Blend(V &dst, M const &mask, V const &src1, V const &src2)
Definition: UMESimdCommon.h:144

vecCore::MaskingImplementation< UME::SIMD::SIMDVec_i< T, N > >::Assign
static void Assign(V &dst, M const &mask, V const &src)
Definition: UMESimdCommon.h:152

vecCore::MaskingImplementation< UME::SIMD::SIMDVec_i< T, N > >::V
UME::SIMD::SIMDVec_i< T, N > V
Definition: UMESimdCommon.h:149

vecCore::MaskingImplementation< UME::SIMD::SIMDVec_i< T, N > >::Blend
static void Blend(V &dst, M const &mask, V const &src1, V const &src2)
Definition: UMESimdCommon.h:154

vecCore::MaskingImplementation< UME::SIMD::SIMDVec_i< T, N > >::M
UME::SIMD::SIMDVecMask< N > M
Definition: UMESimdCommon.h:150

vecCore::MaskingImplementation< UME::SIMD::SIMDVec_u< T, N > >::Assign
static void Assign(V &dst, M const &mask, V const &src)
Definition: UMESimdCommon.h:162

vecCore::MaskingImplementation< UME::SIMD::SIMDVec_u< T, N > >::Blend
static void Blend(V &dst, M const &mask, V const &src1, V const &src2)
Definition: UMESimdCommon.h:164

vecCore::MaskingImplementation< UME::SIMD::SIMDVec_u< T, N > >::V
UME::SIMD::SIMDVec_u< T, N > V
Definition: UMESimdCommon.h:159

vecCore::MaskingImplementation< UME::SIMD::SIMDVec_u< T, N > >::M
UME::SIMD::SIMDVecMask< N > M
Definition: UMESimdCommon.h:160

vecCore::MaskingImplementation
Definition: Implementation.h:265

vecCore::TypeTraits< UME::SIMD::SIMDVecMask< N > >::ScalarType
bool ScalarType
Definition: UMESimdCommon.h:13

vecCore::TypeTraits< UME::SIMD::SIMDVecMask< N > >::IndexType
int IndexType
Definition: UMESimdCommon.h:12

vecCore::TypeTraits< UME::SIMD::SIMDVecMask< N > >::MaskType
typename UME::SIMD::SIMDVecMask< N > MaskType
Definition: UMESimdCommon.h:11

vecCore::TypeTraits< UME::SIMD::SIMDVec_f< T, N > >::ScalarType
T ScalarType
Definition: UMESimdCommon.h:19

vecCore::TypeTraits< UME::SIMD::SIMDVec_f< T, N > >::IndexType
typename UME::SIMD::SIMDVec_u< uint32_t, N > IndexType
Definition: UMESimdCommon.h:21

vecCore::TypeTraits< UME::SIMD::SIMDVec_f< T, N > >::MaskType
typename UME::SIMD::SIMDVecMask< N > MaskType
Definition: UMESimdCommon.h:20

vecCore::TypeTraits< UME::SIMD::SIMDVec_i< T, N > >::MaskType
typename UME::SIMD::SIMDVecMask< N > MaskType
Definition: UMESimdCommon.h:28

vecCore::TypeTraits< UME::SIMD::SIMDVec_i< T, N > >::ScalarType
T ScalarType
Definition: UMESimdCommon.h:27

vecCore::TypeTraits< UME::SIMD::SIMDVec_i< T, N > >::IndexType
typename UME::SIMD::SIMDVec_u< uint32_t, N > IndexType
Definition: UMESimdCommon.h:29

vecCore::TypeTraits< UME::SIMD::SIMDVec_u< T, N > >::IndexType
typename UME::SIMD::SIMDVec_u< uint32_t, N > IndexType
Definition: UMESimdCommon.h:37

vecCore::TypeTraits< UME::SIMD::SIMDVec_u< T, N > >::MaskType
typename UME::SIMD::SIMDVecMask< N > MaskType
Definition: UMESimdCommon.h:36

vecCore::TypeTraits< UME::SIMD::SIMDVec_u< T, N > >::ScalarType
T ScalarType
Definition: UMESimdCommon.h:35

vecCore::TypeTraits
Definition: Scalar.h:10

vecCore::TypeTraits::Size
static constexpr size_t Size
Definition: Scalar.h:14