Content - afc8564102e969a73426fdc2250c82ecb82ee569 - eb3e303/CUDAMoments.h

visit type:

Tip revision: c7a7ea5e53bb65f6806f6a6b3044a4348839c508 authored by Cambridge on 07 February 2018, 03:35:56 UTC
hybrid single-tree and dual-tree traversal version lockstepping is done; this version is faster than original ChaNGa GPU code

Tip revision: c7a7ea5

CUDAMoments.h

#ifndef CUDAMoments_h
#define CUDAMoments_h 1

#include "cuda_typedef.h"

/** CUDA version of momEvalFmomrcm. */
#ifdef CUDA_UNIT_TEST
__global__ void
#else
__device__ inline void __attribute__(( always_inline ))
#endif
CUDA_momEvalFmomrcm(const CudaMultipoleMoments* _m,
                    const CudaVector3D* _r,
                    cudatype dir,
                    CudaVector3D* out,
                    cudatype* pot);

#ifdef CAMBRIDGE

__device__ inline bool __attribute__(( always_inline ))
cuda_intersect(CUDABucketNode &b, CudaSphere &s);

__device__ inline bool __attribute__(( always_inline ))
cuda_intersect(CudaSphere &s1, CudaSphere &s2);

__device__ inline bool __attribute__(( always_inline ))
cuda_contains(const CudaSphere &s, const CudaVector3D &v);

__device__ inline bool __attribute__(( always_inline ))
cuda_contained(const CUDATreeNode &b, const CudaSphere &s);

__device__ inline int __attribute__(( always_inline ))
cuda_openSoftening(CUDATreeNode &node, CUDABucketNode &myNode);

__device__ inline int __attribute__(( always_inline ))
cuda_encodeOffset(int reqID, int x, int y, int z);

__device__ inline int __attribute__(( always_inline ))
cuda_reEncodeOffset(int reqID, int offsetID);

__device__ inline CudaVector3D __attribute__(( always_inline ))
cuda_decodeOffset(int reqID, CudaVector3D fPeriod);

__device__ inline CudaVector3D __attribute__(( always_inline ))
cuda_openCriterionNode(CUDATreeNode &node,
                    CUDABucketNode &myNode,
                    int localIndex,
                    cudatype theta,
                    cudatype thetaMono);

__device__ inline void __attribute__(( always_inline ))
cuda_SPLINEQ(cudatype invr, cudatype r2, cudatype twoh, cudatype& a,
       cudatype& b,cudatype& c,cudatype& d);

__device__ inline void __attribute__(( always_inline ))
cuda_SPLINE(cudatype r2, cudatype twoh, cudatype &a, cudatype &b); 

__device__ inline int __attribute__(( always_inline ))
cuda_OptAction(int fakeOpen, int nodetype);

#endif

#endif  /* CUDAMoments_h */

Browse the archive

https://github.com/N-BodyShop/changa