File | Mode | Size |
---|---|---|
hexagon_remote | ||
internal | ||
nvidia_libdevice_bitcode | ||
.clang-tidy | -rw-r--r-- | 189 bytes |
CMakeLists.txt | -rw-r--r-- | 10.8 KB |
HalideBuffer.h | -rw-r--r-- | 102.2 KB |
HalidePyTorchCudaHelpers.h | -rw-r--r-- | 1.8 KB |
HalidePyTorchHelpers.h | -rw-r--r-- | 3.9 KB |
HalideRuntime.h | -rw-r--r-- | 93.9 KB |
HalideRuntimeCuda.h | -rw-r--r-- | 3.8 KB |
HalideRuntimeD3D12Compute.h | -rw-r--r-- | 4.3 KB |
HalideRuntimeHexagonDma.h | -rw-r--r-- | 4.1 KB |
HalideRuntimeHexagonHost.h | -rw-r--r-- | 6.9 KB |
HalideRuntimeMetal.h | -rw-r--r-- | 4.3 KB |
HalideRuntimeOpenCL.h | -rw-r--r-- | 5.3 KB |
HalideRuntimeOpenGLCompute.h | -rw-r--r-- | 2.5 KB |
HalideRuntimeQurt.h | -rw-r--r-- | 770 bytes |
HalideRuntimeWebGPU.h | -rw-r--r-- | 1.4 KB |
aarch64.ll | -rw-r--r-- | 8.0 KB |
aarch64_cpu_features.cpp | -rw-r--r-- | 306 bytes |
alignment_128.cpp | -rw-r--r-- | 133 bytes |
alignment_32.cpp | -rw-r--r-- | 132 bytes |
alignment_64.cpp | -rw-r--r-- | 132 bytes |
allocation_cache.cpp | -rw-r--r-- | 1.5 KB |
android_clock.cpp | -rw-r--r-- | 133 bytes |
android_host_cpu_count.cpp | -rw-r--r-- | 199 bytes |
android_io.cpp | -rw-r--r-- | 279 bytes |
android_ioctl.h | -rw-r--r-- | 1.8 KB |
arm.ll | -rw-r--r-- | 11.0 KB |
arm_cpu_features.cpp | -rw-r--r-- | 1.1 KB |
arm_no_neon.ll | -rw-r--r-- | 51 bytes |
cache.cpp | -rw-r--r-- | 20.7 KB |
can_use_target.cpp | -rw-r--r-- | 2.7 KB |
cl_functions.h | -rw-r--r-- | 16.8 KB |
constants.h | -rw-r--r-- | 596 bytes |
cpu_features.h | -rw-r--r-- | 1.5 KB |
cuda.cpp | -rw-r--r-- | 53.3 KB |
cuda_functions.h | -rw-r--r-- | 3.4 KB |
d3d12compute.cpp | -rw-r--r-- | 133.9 KB |
destructors.cpp | -rw-r--r-- | 359 bytes |
device_buffer_utils.h | -rw-r--r-- | 7.6 KB |
device_interface.cpp | -rw-r--r-- | 29.6 KB |
device_interface.h | -rw-r--r-- | 3.4 KB |
errors.cpp | -rw-r--r-- | 12.8 KB |
fake_get_symbol.cpp | -rw-r--r-- | 1.9 KB |
fake_thread_pool.cpp | -rw-r--r-- | 6.0 KB |
float16_t.cpp | -rw-r--r-- | 2.5 KB |
fopen.cpp | -rw-r--r-- | 204 bytes |
fopen_lfs.cpp | -rw-r--r-- | 208 bytes |
force_include_types.cpp | -rw-r--r-- | 434 bytes |
fuchsia_clock.cpp | -rw-r--r-- | 1018 bytes |
fuchsia_host_cpu_count.cpp | -rw-r--r-- | 163 bytes |
fuchsia_yield.cpp | -rw-r--r-- | 213 bytes |
gpu_context_common.h | -rw-r--r-- | 8.5 KB |
gpu_device_selection.cpp | -rw-r--r-- | 991 bytes |
halide_buffer_t.cpp | -rw-r--r-- | 7.7 KB |
hashmap.h | -rw-r--r-- | 14.1 KB |
hexagon_cache_allocator.cpp | -rw-r--r-- | 5.7 KB |
hexagon_cpu_features.cpp | -rw-r--r-- | 306 bytes |
hexagon_dma.cpp | -rw-r--r-- | 29.1 KB |
hexagon_dma_pool.cpp | -rw-r--r-- | 7.4 KB |
hexagon_dma_pool.h | -rw-r--r-- | 986 bytes |
hexagon_host.cpp | -rw-r--r-- | 40.2 KB |
hvx_128.ll | -rw-r--r-- | 25.7 KB |
ios_io.cpp | -rw-r--r-- | 265 bytes |
linux_clock.cpp | -rw-r--r-- | 2.0 KB |
linux_host_cpu_count.cpp | -rw-r--r-- | 132 bytes |
linux_yield.cpp | -rw-r--r-- | 128 bytes |
metal.cpp | -rw-r--r-- | 48.2 KB |
metal_objc_arm.cpp | -rw-r--r-- | 67 bytes |
metal_objc_platform_dependent.cpp | -rw-r--r-- | 2.4 KB |
metal_objc_platform_dependent.h | -rw-r--r-- | 576 bytes |
metal_objc_x86.cpp | -rw-r--r-- | 67 bytes |
mini_cl.h | -rw-r--r-- | 19.4 KB |
mini_cuda.h | -rw-r--r-- | 15.5 KB |
mini_d3d12.h | -rw-r--r-- | 223.6 KB |
mini_hexagon_dma.h | -rw-r--r-- | 10.4 KB |
mini_opengl.h | -rw-r--r-- | 9.5 KB |
mini_qurt.h | -rw-r--r-- | 9.3 KB |
mini_qurt_vtcm.h | -rw-r--r-- | 137 bytes |
mini_webgpu.h | -rw-r--r-- | 96.0 KB |
module_aot_ref_count.cpp | -rw-r--r-- | 708 bytes |
module_jit_ref_count.cpp | -rw-r--r-- | 1.3 KB |
msan.cpp | -rw-r--r-- | 4.1 KB |
msan_stubs.cpp | -rw-r--r-- | 644 bytes |
objc_support.h | -rw-r--r-- | 4.0 KB |
opencl.cpp | -rw-r--r-- | 73.3 KB |
opengl_egl_context.cpp | -rw-r--r-- | 6.5 KB |
opengl_glx_context.cpp | -rw-r--r-- | 4.8 KB |
openglcompute.cpp | -rw-r--r-- | 37.0 KB |
osx_clock.cpp | -rw-r--r-- | 1.4 KB |
osx_get_symbol.cpp | -rw-r--r-- | 2.0 KB |
osx_host_cpu_count.cpp | -rw-r--r-- | 132 bytes |
osx_opengl_context.cpp | -rw-r--r-- | 3.9 KB |
osx_yield.cpp | -rw-r--r-- | 128 bytes |
posix_aligned_alloc.cpp | -rw-r--r-- | 1.5 KB |
posix_allocator.cpp | -rw-r--r-- | 1.2 KB |
posix_clock.cpp | -rw-r--r-- | 1.3 KB |
posix_error_handler.cpp | -rw-r--r-- | 1.1 KB |
posix_get_symbol.cpp | -rw-r--r-- | 1.9 KB |
posix_io.cpp | -rw-r--r-- | 160 bytes |
posix_math.ll | -rw-r--r-- | 11.0 KB |
posix_print.cpp | -rw-r--r-- | 536 bytes |
posix_threads.cpp | -rw-r--r-- | 3.9 KB |
posix_threads_tsan.cpp | -rw-r--r-- | 57 bytes |
posix_timer_profiler.cpp | -rw-r--r-- | 1.8 KB |
posix_timeval.h | -rw-r--r-- | 183 bytes |
powerpc.ll | -rw-r--r-- | 1.1 KB |
powerpc_cpu_features.cpp | -rw-r--r-- | 915 bytes |
prefetch.cpp | -rw-r--r-- | 501 bytes |
printer.h | -rw-r--r-- | 7.6 KB |
profiler.cpp | -rw-r--r-- | 57 bytes |
profiler_common.cpp | -rw-r--r-- | 18.4 KB |
profiler_inlined.cpp | -rw-r--r-- | 1.8 KB |
pseudostack.cpp | -rw-r--r-- | 1.1 KB |
ptx_dev.ll | -rw-r--r-- | 15.0 KB |
qurt_allocator.cpp | -rw-r--r-- | 3.4 KB |
qurt_hvx.cpp | -rw-r--r-- | 3.2 KB |
qurt_hvx_vtcm.cpp | -rw-r--r-- | 373 bytes |
qurt_threads.cpp | -rw-r--r-- | 3.3 KB |
qurt_threads_tsan.cpp | -rw-r--r-- | 56 bytes |
qurt_yield.cpp | -rw-r--r-- | 115 bytes |
riscv_cpu_features.cpp | -rw-r--r-- | 343 bytes |
runtime_api.cpp | -rw-r--r-- | 9.2 KB |
runtime_atomics.h | -rw-r--r-- | 9.3 KB |
runtime_internal.h | -rw-r--r-- | 11.5 KB |
scoped_mutex_lock.h | -rw-r--r-- | 548 bytes |
scoped_spin_lock.h | -rw-r--r-- | 681 bytes |
synchronization_common.h | -rw-r--r-- | 29.1 KB |
thread_pool_common.h | -rw-r--r-- | 32.1 KB |
timer_profiler.cpp | -rw-r--r-- | 57 bytes |
to_string.cpp | -rw-r--r-- | 9.8 KB |
trace_helper.cpp | -rw-r--r-- | 1.3 KB |
tracing.cpp | -rw-r--r-- | 14.0 KB |
wasm_cpu_features.cpp | -rw-r--r-- | 631 bytes |
wasm_math.ll | -rw-r--r-- | 14.4 KB |
webgpu.cpp | -rw-r--r-- | 41.7 KB |
webgpu_dawn.cpp | -rw-r--r-- | 412 bytes |
webgpu_emscripten.cpp | -rw-r--r-- | 412 bytes |
win32_math.ll | -rw-r--r-- | 12.0 KB |
windows_clock.cpp | -rw-r--r-- | 1.3 KB |
windows_cuda.cpp | -rw-r--r-- | 36 bytes |
windows_d3d12compute_arm.cpp | -rw-r--r-- | 657 bytes |
windows_d3d12compute_x86.cpp | -rw-r--r-- | 655 bytes |
windows_get_symbol.cpp | -rw-r--r-- | 2.7 KB |
windows_io.cpp | -rw-r--r-- | 160 bytes |
windows_opencl.cpp | -rw-r--r-- | 38 bytes |
windows_profiler.cpp | -rw-r--r-- | 40 bytes |
windows_threads.cpp | -rw-r--r-- | 3.6 KB |
windows_threads_tsan.cpp | -rw-r--r-- | 59 bytes |
windows_yield.cpp | -rw-r--r-- | 218 bytes |
write_debug_image.cpp | -rw-r--r-- | 12.9 KB |
x86.ll | -rw-r--r-- | 7.2 KB |
x86_amx.ll | -rw-r--r-- | 5.4 KB |
x86_avx.ll | -rw-r--r-- | 5.4 KB |
x86_avx2.ll | -rw-r--r-- | 4.4 KB |
x86_avx512.ll | -rw-r--r-- | 10.1 KB |
x86_cpu_features.cpp | -rw-r--r-- | 3.8 KB |
x86_sse41.ll | -rw-r--r-- | 3.7 KB |