NVIDIA A40 GPU 可提供先进的视觉计算功能,包括实时光线追踪、AI 加速和多工作负载灵活性,从而加速深度学习、数据科学和基于计算的工作负载。由 NVIDIA A40 和 NVIDIA RTX 虚拟工作站 (vWS) 以及 NVIDIA 虚拟计算服务器软件提供动力支持的虚拟工作站受益于各种行业应用程序和专业软件的广泛测试,可提供极佳的性能和稳定性。
GPU 架构
NVIDIA Ampere 架构
GPU 显存
带有 ECC 的 48 GB GDDR6
显存带宽
696 GB/秒
互联接口
NVIDIA NVLink 112.5 GB/s (双向)
PCIe 4.0 31.5 GB/s(双向)
基于 NVIDIA Ampere 架构的CUDA 核心
10752
NVIDIA 第二代 RT Core
84
NVIDIA 第三代 Tensor Core
336
FP32 TFLOPS 峰值 (非 Tensor)
37.4
使用 FP16 累加的 FP16 Tensor TFLOPS 峰值
149.7| 299.4*
TF32 Tensor TFLOPS 峰值
74.8| 149.6*
RT Core 性能 TFLOPS
73.1
使用 FP32 累加的 BF16 Tensor TFLOPS 峰值
149.7| 299.4*
INT8 Tensor TOPS 峰值
299.3| 598.6*
INT 4 Tensor TOPS 峰值
598.7 | 1197.4*
外形规格
4.4"(高)x 10.5"(长)双插槽
显示端口
3 个 DisplayPort 1.4**;支持 NVIDIA Mosaic 和 Quadro? Sync4
最大功耗
300 瓦
电源接口
8 引脚 CPU
散热解决方案
被动式
虚拟 GPU (vGPU) 软件支持
NVIDIA vPC/vApp、NVIDIA RTX 虚拟工作站、NVIDIA 虚拟计算服务器
NVENC | NVDEC
1x| 2x(包括 AV1 解码)
通过硬件信任根进行安全可靠的引导
是
NEBS Ready
3 级
计算 API
CUDA、DirectCompute、OpenCL、OpenACC
图形 API
DirectX 12.07、Shader Model5.17、OpenGL 4.68、Vulkan 1.18
MIG 支持
否