在交互式环境中编写、测试和优化CUDA代码
选择不同的CUDA编程示例进行学习和实践
基础的CUDA并行计算示例,学习线程索引和数据并行处理。
优化内存访问模式的矩阵乘法,学习共享内存的使用。
学习并行归约算法和线程同步技术。
深入分析CUDA代码的性能特征