CUDA Utilities

Utilities for CUDA programming

Wrap all the CUDA API calls within gpuErrchk. For example:

gpuErrchk(cudaMemcpy(d_x, x, N * sizeof(float), cudaMemcpyHostToDevice));

Use gpuErrchk to check for errors in your kernels. For example:

#ifdef DEBUG
		gpuErrchk(cudaPeekAtLastError());
		gpuErrchk(cudaDeviceSynchronize());
#endif

If DEBUG is defined, then the CUDA error check of the kernels will be executed.

Use iDivUp to find the number of blocks to be launched by a CUDA kernel. For example:

BLOCKSIZE = 256;
N = 10000;       // Number of elements to be processed
kernel<<<iDivUp(N, BLOCKSIZE), BLOCKSIZE>>>(...);

Name		Name	Last commit message	Last commit date
Latest commit History 181 Commits
License		License
Bessel.cu		Bessel.cu
Bessel.cuh		Bessel.cuh
InputOutput.cpp		InputOutput.cpp
InputOutput.cu		InputOutput.cu
InputOutput.cuh		InputOutput.cuh
InputOutput.h		InputOutput.h
Matlab_like.cu		Matlab_like.cu
Matlab_like.cuh		Matlab_like.cuh
Polynomials.cu		Polynomials.cu
Polynomials.cuh		Polynomials.cuh
README.md		README.md
cfloat3.cu		cfloat3.cu
cfloat3.cuh		cfloat3.cuh
cuFFT_auxiliary.cu		cuFFT_auxiliary.cu
cuFFT_auxiliary.cuh		cuFFT_auxiliary.cuh
cublasWrappers.cu		cublasWrappers.cu
cublasWrappers.cuh		cublasWrappers.cuh
cusparseWrappers.cu		cusparseWrappers.cu
cusparseWrappers.cuh		cusparseWrappers.cuh
float2Overloads.cu		float2Overloads.cu
float2Overloads.cuh		float2Overloads.cuh
float3Overloads.cu		float3Overloads.cu
float3Overloads.cuh		float3Overloads.cuh

Provide feedback