通用(yòng)計算、異構計算、協同計算、邊緣計算等多(duō)元産(chǎn)品布局
NVIDIA A10 Tensor Core GPU 與 NVIDIA RTX 虛拟工(gōng)作(zuò)站 (vWS) 軟件相結合,将主流圖形和視頻與 AI 服務(wù)引入主流企業服務(wù)器,為(wèi)設計師、工(gōng)程師、藝術家和科(kē)學(xué)家帶來應對當今挑戰所需的解決方案。A10 基于最新(xīn)的 NVIDIA Ampere 架構而構建,将第二代 RT Core、第三代 Tensor Core 和新(xīn)型流式傳輸微處理(lǐ)器與 24 GB 的 GDDR6 顯存相結合 (皆在 150W 功率範圍内),實現通用(yòng)的圖形、渲染、AI 和計算性能(néng)。從可(kě)在世界各地訪問的虛拟工(gōng)作(zuò)站、渲染節點, 到運行各種工(gōng)作(zuò)負載的數據中(zhōng)心,A10 皆能(néng)以單寬、全高、全長(cháng) PCIe 外形提供出色性能(néng)。 NVIDIA A10 支持作(zuò)為(wèi) NVIDIA-Certified Systems™ 的一部分(fēn),在本地數據中(zhōng)心、雲和邊緣中(zhōng)使用(yòng)。
NVIDIA A10 基于由 NVIDIA NGC™ 目錄、CUDA-X™ 庫、超過 230 萬名(míng)開發者和 1800 多(duō)個 GPU 優化應用(yòng)程序組成的豐富的 AI 框架生态系統而構建,幫助企業應對其業務(wù)中(zhōng)的關鍵挑戰。
速度提升一倍的單精(jīng)度浮點 (FP32) 運算處理(lǐ)和改善的能(néng)效可(kě)顯著提高圖形和計算工(gōng)作(zuò)流程的性能(néng),例如複雜的 3D 計算機輔助設計 (CAD) 和計算機輔助工(gōng)程 (CAE)。
憑借高達 2 倍于上一代産(chǎn)品的吞吐量,以及并行運行光線(xiàn)追蹤與着色或降噪功能(néng)的能(néng)力,第二代 RT Core 可(kě)大幅加快電(diàn)影内容的逼真渲染、建築設計評估以及産(chǎn)品設計的虛拟原型制作(zuò)等工(gōng)作(zuò)負載的運行速度。這項技(jì )術還可(kě)提升光線(xiàn)追蹤動态模糊的渲染速度,從而更快獲得結果,并增加視覺準确度。
Tensor Float 32 (TF32) 精(jīng)度提供的訓練吞吐量高達上一代的 5 倍,而且無需更改代碼即可(kě)加速 AI 和數據科(kē)學(xué)模型的訓練。從硬件上支持結構化稀疏使推理(lǐ)吞吐量提升一倍。Tensor Core 還為(wèi)圖形處理(lǐ)引入了諸多(duō) AI 功能(néng),例如為(wèi)選定應用(yòng)程序帶來了深度學(xué)習超級采樣 (DLSS)、AI 降噪和增強編輯等功能(néng)。
超高速 GDDR6 顯存,為(wèi)渲染、數據科(kē)學(xué)、工(gōng)程模拟和其他(tā) GPU 顯存密集型工(gōng)作(zuò)負載提供 600 GB/s 帶寬。
PCI Express 4.0 提供的帶寬比 PCIe Gen 3 多(duō)一倍,提高了 CPU内存的數據傳輸速度,從而可(kě)以更快地處理(lǐ) AI、數據科(kē)學(xué)和 3D 設計等數據密集型任務(wù)。更快的 PCIe 性能(néng)還能(néng)加速 GPU 直接顯存訪問 (DMA) 傳輸,這在 GPU 與支持 NVIDIA GPUDirect® for Video 的設備之間提供了更快的視頻數據輸入/輸出通信速度,從而帶來強大的直播解決方案。 A10 還向後兼容 PCI Express 3.0,這提供了部署靈活性。
NVIDIA A10 采用(yòng)單插槽、全高、全長(cháng)節能(néng)設計,可(kě)兼容全球 OEM 供應商(shāng)生産(chǎn)的各式服務(wù)器。 NVIDIA A10 包含通過硬件信任根技(jì )術進行安(ān)全可(kě)靠的引導,确保固件不會被篡改或損壞。
A10 技(jì )術規格和功能(néng) | |
---|---|
FP32 | 31.2 兆次浮點運算 |
TF32 Tensor 核心 | 62.5 兆次浮點運算 | 125 兆次浮點運算* |
BFLOAT16 Tensor 核心 | 125 兆次浮點運算 | 250 兆次浮點運算* |
FP16 Tensor 核心 | 125 兆次浮點運算 | 250 兆次浮點運算* |
INT8 Tensor 核心 | 250 兆次浮點運算 | 500 兆次浮點運算* |
INT4 Tensor 核心 | 500 兆次浮點運算 | 1,000 兆次浮點運算* |
RT 核心 | 72 個 RT 核心 |
編碼/譯碼 | 1 個編碼器 2 個譯碼器 (+AV1 解碼) |
GPU 内存 | 24GB GDDR6 |
GPU 内存帶寬 | 每秒(miǎo) 600 GB |
互連技(jì )術 | 第四代 PCIe 64GB/秒(miǎo) |
尺寸規格 | 單插槽、全高全長(cháng)尺寸 (FHFL) |
最大散熱設計功耗 (TDP) | 150W |
虛拟化 GPU 軟件支持 | NVIDIA 虛拟 PC、NVIDIA 虛拟應用(yòng)程序、NVIDIA RTX 虛拟化工(gōng)作(zuò)站、NVIDIA 虛拟化運算服務(wù)器 |