雲端服務供應商與伺服器製造商運用NVIDIA AI提升AI訓練標準

眾家企業刷新訓練人工智慧(AI)模型速度的紀錄,包括戴爾科技、浪潮、美超微(Supermicro),以及首度在MLPerf基準測試中亮相的Azure,均採用NVIDIA AI。NVIDIA的平台在公布的MLPerf訓練1.1結果中,創下所有八項熱門作業負載中的紀錄。

NVIDIA A100 Tensor核心GPU不僅提供最佳的標準化單晶片效能,並透過NVIDIA InfiniBand連網技術及軟體堆疊進行擴充,在Selene系統上提供最快的訓練時間。Selene是NVIDIA基於模組化NVIDIA DGX SuperPOD的AI超級電腦。

根據最新公布的結果,在訓練AI模型方面,Azure的NDm A100 v4是當今全球最快的執行個體。其在最新一輪完成每一項測試,並能擴充至2,048個A100 GPU。

Azure不僅展現絕佳的效能,現在更於全美六個地區供任何人租用與使用。

AI訓練是一項艱鉅的任務,因此需要強大的軟硬體支援。我們希望用戶能運用其所挑選的服務或系統,在破紀錄的速度下完成模型訓練。因此,我們透過NVIDIA AI為雲端服務、託管服務,以及企業與科學運算中心提供產品支援。

在OEM廠商中,浪潮運用其8路GPU系統,包含NF5488A5與液體冷卻NF5688MB,刷新最多單節點效能紀錄。戴爾科技與美超微則憑藉搭載4路A100 GPU的系統刷新紀錄。

此次共有十家NVIDIA合作夥伴提交測試結果,包含八家OEM廠商及兩家雲端服務供應商,其所提交的件數占總數90%以上。

這是第五輪的效能測試,也是至今NVIDIA商業生態系在MLPerf效能訓練基準測試中表現最為亮眼的一次。

我們的合作夥伴積極參與這項測試,因MLPerf是唯一業界標準且經同業審核的AI訓練與推論基準,其為客戶評估AI平台和廠商的寶貴工具。

百度Paddle Paddle、戴爾科技、富士通、技嘉、慧與科技、浪潮、聯想以及美超微皆提交於單節點和多節點的本地端資料中心測試結果。

幾乎所有我們的OEM合作夥伴皆在NVIDIA認證系統上執行效能測試,我們為需要加速運算的企業客戶進行伺服器驗證。

各方提交的結果展現出NVIDIA平台應用的廣度與成熟度,並且能為任何規模的企業提供最佳的解決方案。

NVIDIA AI是唯一提交數據於所有測試項目與使用案例的平台參與者,充份展現NVIDIA AI的多元性及絕佳效能。既快速又具彈性的系統,提供客戶加快作業速度所需的生產力。

訓練基準測試涵蓋當今最熱門的八項AI作業負載與情境,包括電腦視覺、自然語言處理、推薦系統,以及強化學習等。

MLPerf的測試透明且客觀,因此用戶可以依據結果做出採購決策。此業界基準測試小組成立於2018年5月,並取得數十家業界領導廠商的全力支持,包括阿里巴巴、安謀、Google、英特爾,以及NVIDIA等。