HPE推出大規模AI開發與訓練模型解決方案

加速AI從概念驗證到生產的旅程

Hewlett Packard Enterprise (NYSE: HPE)發布新HPE機器學習開發系統(HPE Machine Learning Development System),協助企業組織大規模建立與訓練機器學習模型,加速創造價值。這個專為AI設計的系統是端對端解決方案,整合機器學習軟體平台、運算、加速器和網路,幫助客戶更快開發與訓練大量的AI模型,同時提升模型準確度。

HPE機器學習開發系統建置於HPE策略投資收購公司—Determined AI的強大的機器學習(ML)平台上(現已正式命名為HPE機器學習開發環境),並結合HPE世界級的AI與高效能運算(HPC)產品。藉由新HPE機器學習開發系統,使用者可以縮短建立與訓練機器學習模型的時間,從數月、數週到數天,加速創造價值。

HPE機器學習開發系統(HPE Machine Learning Development System)。
HPE機器學習開發系統(HPE Machine Learning Development System)。

使用HPE機器學習開發系統的企業 飛快展開大規模多模態AI模型訓練

HPE宣布德國AI新創公司Aleph Alpha使用HPE機器學習開發系統訓練多模態AI模型,包括自然語言處理(NLP)與電腦視覺。藉由結合五種語言的影像與文字處理能力跟人類般的情境脈絡理解能力,這些模型可以讓現代AI技術應用在各種語言以及基於影像轉換的使用案例;例如,使用AI助理產生複雜文字、更高理解度的摘要、在數百個檔案中精準搜尋資訊,以及在對話情境中運用專業知識。

在結合和監控數百個GPU情況下,Aleph Alpha不僅能立即安裝與使用HPE機器學習開發系統,還能以前所未有的速度和效率訓練模型。

Aleph Alpha創辦人暨執行長Jonas Andrulis指出,「HPE機器學習開發系統可以提供超過150 TeraFlops以上的驚人效率與效能。我們結合現有研究資料執行大量工作負載時,整合型解決方案大大提升部署與監控效率。」

HPE執行副總裁暨HPC與AI部門總經理Justin Hotard表示,企業希望導入AI與機器學習技術,以創造產品和服務的差異性,但大規模建立與訓練準確的AI模型需要部署複雜的基礎架構,「HPE機器學習開發系統,結合我們為深度學習所提供的端對端HPC解決方案以及創新的機器學習軟體平台到單一系統,提供一個立即可用的高效能解決方案,協助客戶加快運用AI創造價值與獲得成效。」

使用完整的機器學習解決方案移除障礙,充分發揮AI潛力

企業組織的AI基礎架構仍不夠成熟。根據IDC研究,若企業想要加速實驗或建立原型以開發AI產品和服務,AI基礎架構是最重要也是最昂貴的投資。若要使用AI基礎架構支援大規模的模型開發與訓練,企業必須經歷複雜且繁瑣的流程,包括採購、安裝設定與管理極為相似的軟體生態系統和基礎架構,而生態系統與基礎架構又涵蓋專業的運算、儲存、連線和加速器等資源。

HPE機器學習開發系統讓企業組織擺脫AI基礎架構的高複雜性。透過結合軟體平台以及加速器、網路與服務等專業運算資源的單一解決方案,讓企業組織可以立即大規模地建立與訓練最佳化的機器學習模型。

使用HPE機器學習開發系統,加速創造價值

此系統提供機器學習演算法的多種關鍵功能,包括卓越的分散式訓練、自動超參數最佳化與神經網路架構搜索,能更快提升模型的準確性。

HPE機器學習開發系統提供最佳化的運算、加速計算及連線。這些都是關鍵效能的驅動因素,可有效擴大模型規模以適應各種 工作負載。客戶可以從 32 個 NVIDIA GPUs小型配置,逐步擴大到 256 NVIDIA GPUs配置。在32個NVIDIA GPUs組態中,HPE機器學習開發系統可擴充自然語言處理(NLP)與電腦視覺等工作負載的效率達到90%。根據內部測試,使用32個GPUs的HPE機器學習開發系統處理NLP工作負載時,傳輸率比其他搭載32個相同GPUs解決方案快5.7倍,連線效能則是次優1

(請參考部落格:HPE機器學習開發系統:真實世界的NLP與電腦視覺模型效能評比 – HPE HPC與AI部門副總裁Evan Sparks撰稿)

透過立即可用的AI模型開發與訓練 加速從概念驗證到生產環境

HPE機器學習開發系統是整合型解決方案,能提供預先配置且完整安裝的AI基礎架構,讓客戶透過單一解決方案大規模開發與訓練模型。在此解決方案中,HPE Pointnext Services會提供現場安裝與軟體設定服務,讓使用者立即使用與訓練機器學習模型,更快透過資料獲得更準確的洞察力。