智通財經APP獲悉,英偉達(NVDA.US)發布了一款更新的人工智能(AI)處理器,以增強芯片容量和速度,進而鞏固公司在這個新興市場的主導地位。據了解,英偉達在洛杉矶舉行的Siggraph大會上表示,圖形芯片和處理器相結合的Grace Hopper超級芯片(下稱GH200)將從一種新型內存中獲益。該産品依賴于高帶寬存儲器3(即HBM3e),後者能夠以每秒鍾高達5TB的速度訪問信息。英偉達表示,這款名爲GH200的超級芯片將于2024年第二季度投産。
英偉達的股價今年上漲了兩倍多,估值約爲1.1萬億美元,是2023年費城證券交易所半導體指數成分股中漲幅最大的公司。盡管英偉達周二下跌了約2%,但在宣布推出GH200芯片後,該公司短暫收複了失地。
GH200內存增3.5倍、帶寬增叁倍
英偉達CEO黃仁勳在Siggraph大會上發表主題演講時表示,GH200是“世界上最快的內存”。他稱,爲了滿足生成式 AI 不斷增長的需求,數據中心需要有針對特殊需求的加速計算平台。新的GH200 Grace Hopper 超級芯片平台提供了卓越的內存技術和帶寬,以此提高吞吐量,提升無損耗連接GPU聚合性能的能力,並且擁有可以在整個數據中心輕松部署的服務器設計。
黃仁勳表示,在AI時代,英偉達的技術可以替代傳統數據中心,投資800 萬美元的新技術可以取代用舊設備建造的1億美元設施,而且用電量可以減少20倍。“這就是數據中心在向加速計算轉變的原因。你買的越多,越省錢。”
此外,英偉達的超大規模和高性能計算主管Ian Buck介紹,GH200比英偉達基于H100 的數據中心系統配備了更多內存和帶寬。它采用的英偉達的Hopper GPU,並結合基于Arm架構的英偉達Grace CPU。
相比前代平台,新GH200 Grace Hopper平台的雙芯片配置將內存容量提高3.5倍,帶寬增加叁倍,一個服務器就有144個Arm Neoverse高性能內核、8 petaflops 的 AI 性能和282GB的最新HBM3e內存技術。
HBM3e是一種高帶寬內存,帶寬達每秒5TB。該內存比當前的HBM3快50%,可提供總共每秒10TB的組合帶寬,使新平台能運行比前代大3.5倍的模型,同時通過快叁倍的內存帶寬提高性能。
工具包AI Workbench+升級版Omniverse平台 企業入門AI項目不再複雜
據悉,除了GH200之外,英偉達周二還發布了新的統一工具包AI Workbench,以及對英偉達Omniverse軟件服務的重大升級。
英偉達稱,AI Workbench讓企業的AI項目入門不再複雜。通過在本地系統運行的簡化界面進行訪問,它讓開發者能使用自定義數據微調Hugging Face、GitHub 和 NGC 等常用存儲庫中的模型,然後可以在多個平台上輕松共享模型。
借助AI Workbench,開發者只需點擊幾下即可自定義和運行生成式AI,而且他們能夠將所有必要的企業級模型、框架、軟件開發套件和庫整合到一個統一的開發者工作區中。
AI Workbench爲開發者提供了統一且便于使用的工具包,可在個人電腦(PC)或工作站上快速創建、測試和微調生成式AI模型,然後將其擴展到幾乎任何數據中心、公共雲或者英偉達的DGX雲。
此外,英偉達還將生成式人工智能添加到其Ominverse産品中,這是一個旨在支持虛擬世界風格的虛擬世界的平台,該公司正利用這項技術幫助企業客戶創建工廠和車輛等現實世界物品的網絡版本。
據悉,升級版Omniverse平台是一個高性能3D場景描述技術OpenUSD的原生軟件平台,用于跨3D工具和應用的連接、描述和模擬,能加快創建虛擬世界和工業數字化高級工作流程。Cesium、Convai、Move AI、SideFX Houdini 和 Wonder Dynamics現已通過 OpenUSD 連接到 Omniverse。
新平台的亮點包括更新開發原生OpenUSD應用及擴展的引擎——Omniverse Kit,以及英偉達Omniverse Audio2Face基礎應用和空間計算功能的更新。
Omniverse 和模擬技術副總裁 Rev Lebaredian表示,更新後的Omniverse 讓開發人員可以通過OpenUSD利用生成式AI強化他們的工具,並且讓工業企業能構建更大、更複雜的世界級模擬,作爲其工業應用的數字測試場。
爲了鼓勵其他人使用這項技術,英偉達認可了一種名爲“通用場景描述”的標准,這一標准最初是由迪士尼公司(Walt Disney Co.)旗下的皮克斯(Pixar)開發的。這家芯片制造商已經與皮克斯、歐特克公司、奧多比公司和蘋果公司結成聯盟,試圖加速采用該技術。
在硬件方面,英偉達發布了叁款新的工作站RTX顯卡。英偉達表示,RTX 5000現在的售價爲4000美元,將使生成人工智能和圖像渲染的速度提高一倍以上。這家芯片制造商還推出了基于L40S圖形芯片的新服務器,以及使用四塊RTX 6000卡的頂級工作站設計。