Revision f309b82a20358a6a6560b87f8325f73ab06c3123 authored by Jevin Jiang on 05 August 2024, 18:06:42 UTC, committed by jax authors on 06 August 2024, 06:17:11 UTC
we also emulate shuffled store using (store + shuffled load + store) for previous generations.

PiperOrigin-RevId: 659612665
1 parent f255fb7
History
File Mode Size
cpu
cuda
gpu
mlir
mosaic
rocm
tools
triton
BUILD -rw-r--r-- 7.2 KB
README.md -rw-r--r-- 402 bytes
absl_status_casters.h -rw-r--r-- 7.7 KB
cpu_feature_guard.c -rw-r--r-- 5.6 KB
cuda_plugin_extension.cc -rw-r--r-- 4.9 KB
ducc_fft.py -rw-r--r-- 2.9 KB
ffi_helpers.h -rw-r--r-- 2.6 KB
gpu_common_utils.py -rw-r--r-- 905 bytes
gpu_linalg.py -rw-r--r-- 3.7 KB
gpu_prng.py -rw-r--r-- 3.6 KB
gpu_rnn.py -rw-r--r-- 5.4 KB
gpu_solver.py -rw-r--r-- 19.0 KB
gpu_sparse.py -rw-r--r-- 13.1 KB
gpu_triton.py -rw-r--r-- 2.3 KB
handle_pool.h -rw-r--r-- 3.3 KB
hlo_helpers.py -rw-r--r-- 10.1 KB
init.py -rw-r--r-- 629 bytes
jax.bzl -rw-r--r-- 10.8 KB
kernel_helpers.h -rw-r--r-- 1.7 KB
kernel_nanobind_helpers.h -rw-r--r-- 2.6 KB
lapack.py -rw-r--r-- 26.1 KB
rocm_plugin_extension.cc -rw-r--r-- 5.2 KB
setup.py -rw-r--r-- 3.4 KB
symlink_files.bzl -rw-r--r-- 6.0 KB
utils.cc -rw-r--r-- 7.2 KB

README.md

back to top