感谢本站网友Broadwell的线索传递!
Nvidia最近发布了CUDA 12.0开发工具的更新这次更新带来了很多变化,包括支持最新的Hopper和阿达·洛芙莱斯GPU架构,升级C++方言,正式支持JIT LTO,改进和引入新的API等等
本站了解到CUDA 12.0的主要功能如下
Cu12.0为NVIDIA的Hopper和阿达·洛芙莱斯架构提供可编程功能CU12为Hopper和Ada架构提供了许多张量运算选项,其中许多支持通用的PTX中间表示合作网格阵列支持C内置函数,用于SM多播的可编程L2缓存,基因组学/DPX指令以及其他新功能
标记为CUDA_VISIBLE_DEVICES的GPU支持虚拟内存管理API。
应用程序和库开发人员可以通过编程来更新CUDA流的优先级。
与之前的API相比,改进后的CUDA动态并行化API的性能有了大幅提升。
现在正式支持通过nvJitLink库进行即时链接优化。
支持GCC 12.1主机编译器。
NVCC和NVRTC对C++20方言的支持。
NVRTC将其默认的C++方言从C++14更新到C++17。
[责任编辑:文辉]
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。