NVIDIA A40 是一款适用于视觉计算的强大数据中心 GPU,采用NVIDIA Ampere 架构,NVIDIA A40将 RT Core、Tensor Core 和 CUDA® 核心与 48 GB图形显存相完美结合,而被广泛的用于数据中心严苛要求的视觉计算工作负载环境的加速,同时随时随地访问的强大虚拟工作站到专用的渲染节点,NVIDIA A40 将新一代 NVIDIA RTX™ 技术引入数据中心,处理更先进的专业可视化工作负载。
规格
| 架构 | NVIDIA Ampere 架构 |
| 显存 | 带有 ECC 的 48 GB GDDR6 |
| 显存带宽 | 696 GB/秒 |
| 互联接口 |
NVIDIA® NVLink ® 112.5 GB/s (双向) PCIe 4.0 31.5 GB/s(双向 |
|
基于 NVIDIA Ampere 架构的 CUDA 核心 |
10752 |
| NVIDIA 第二代 RT Core | 84 |
| NVIDIA 第三代 Tensor Core | 336 |
| FP32 TFLOPS 峰值 (非 Tensor) | 37.4 |
|
使用 FP16 累加的 FP16 Tensor TFLOPS 峰值 |
149.7| 299.4* |
| TF32 Tensor TFLOPS 峰值 | 74.8| 149.6* |
| RT Core 性能 TFLOPS | 73.1 |
|
使用 FP32 累加的 BF16 Tensor TFLOPS 峰值 |
149.7| 299.4 |
|
INT8 Tensor TOPS 峰值 INT 4 Tensor TOPS 峰值 |
299.3| 598.6* 598.7 | 1197.4* |
| 外形规格 | 4.4"(高)x 10.5"(长)双插槽 |
| 显示端口 |
3 个 DisplayPort 1.4**;支持 NVIDIA Mosaic 和 Quadro ® Sync |
| 最大功耗 | 300瓦 |
| 电源接口 | 8 引脚 CPU |
| 散热解决方案 | 被动式 |
| 虚拟 GPU (vGPU) 软件支持 | NVIDIA vPC/vApp、NVIDIA RTX 虚拟、工作站、NVIDIA 虚拟计算服务器 |
| NVENC | NVDEC | 1x| 2x(包括 AV1 解码) |
| 通过硬件信任根进行安全可靠的引导 | 是 |
| NEBS Ready | 3级 |
| 计算API |
CUDA、DirectCompute、 OpenCL™、OpenACC |
| 图形API | DirectX 12.07 、Shader Model 5.17 、OpenGL 4.68 、Vulkan 1.18 |
| MIG 支持 | 否 |

