藉由NVIDIA人工智能數據平台(NVIDIAAIDataPlatform)加速人工智能推理(AIReasoning),並為NVIDIA雲端合作夥伴及企業部署(NVIDIACloudPartnersandEnterpriseDeployments)獲得全新存儲認證加州聖荷西市和坎貝爾市2025年3月19日--來自GTC2025:WEKA這家原生於人工智能(AI)的數據平台公司,宣佈將與NVIDIA人工智能數據平台(NVIDIAAIDataPlatform)參考設計進行整合,並已獲得NVIDIA存儲認證,旨在為未來的代理人工智能(AI)和推理模型提供優化的人工智能(AI)基礎設施。此外,該公司還宣佈,針對NVIDIACloudPartner(NCP)參考架構(ReferenceArchitecture)與NVIDIAGB200NVL72以及針對企業人工智能(AI)工廠部署的NVIDIA認證系統™存儲認證(NVIDIA-CertifiedSystems™Storage)認證,已獲得新的認證,並適用於NVIDIA企業參考架構(NVIDIAEnterpriseReferenceArchitectures)。優化人工智慧基礎架構,迎接代理式人工智慧的未來WEKA亦推出全新的增強記憶體網格™(AugmentedMemoryGrid™)功能,將WEKA數據平台(WEKADataPlatform)軟件與NVIDIA加速計算、網絡及企業軟件整合,旨在加速人工智能(AI)推理,最大化每秒處理的令牌數量,並大幅提升令牌效率。藉由WEKA高效能存儲(High-PerformanceStorage)為人工智能代理(AIAgents)提供動力,NVIDIA人工智能數據平台(NVIDIAAIDataPlatform)正在重新定義企業基礎設施,以迎接代理人工智能(AI)時代的來臨。它提供可自訂的參考設計,將NVIDIABlackwell平台、NVIDIABlueField®DPUs、NVIDIASpectrum-X™網絡、NVIDIAAIEnterprise軟件與企業存儲整合,將數據轉化為可執行的情報。組織現在可以利用NVIDIA人工智能數據平台(NVIDIAAIDataPlatform)與WEKA數據平台(WEKADataPlatform)軟件的優勢,打造一個大規模可擴展、高效能的企業人工智能基礎,將人工智能查詢代理與業務知識連接,並實現卓越的人工智能推理效能及更高的複雜推理準確度。突破人工智能(AI)記憶體瓶頸,藉由WEKA增強記憶體網格(WEKAAugmentedMemoryGrid)人工智能(AI)代理持續擴展自主決策、複雜問題解決及適應性學習的能力,這使得對能夠支持更長上下文視窗、擴展模型參數以及增加系統記憶體需求的人工智能(AI)基礎設施的需求日益增長。藉由WEKA增強記憶體網格(WEKAAugmentedMemoryGrid),人工智能(AI)模型可以擴展記憶體以支援大型模型推理,提供額外數百萬TB的容量,比現今單一TB固定增量高出三個數量級。同時,WEKA增強記憶體網格(WEKAAugmentedMemoryGrid)能夠在微秒延遲下提供接近記憶體速度的效能,實現更快速的令牌處理,從而達成前所未有的推理結果。主要優勢包括:顯著縮短首次令牌處理時間:在處理105,000個令牌時,WEKA增強記憶體網格(WEKAAugmentedMemoryGrid)將首次令牌處理時間縮短了41倍,相較於重新計算預填上下文。優化的令牌處理:推理集群可以實現更高的令牌吞吐量,並將整個推理系統的令牌吞吐成本降低最多達24%。憑藉全新NVIDIA存儲認證推動企業人工智能(AI)創新WEKApod™Nitro數據平台設備(WEKApod™NitroDataPlatformAppliances)已獲得認證,成為首批支持NVIDIACloudPartner(NCP)部署的高效能存儲解決方案之一,並與NVIDIAHGXH200、B200及GB200NVL72配合使用,旨在為NCP供應商提供強大的基礎設施服務,助力人工智能(AI)開發者和創新者。WEKApod設備提供高效能密度和能源效率—單個8U入門級配置最多可支援1,152顆GPU。WEKApod™Nitro設備也獲得了全新的NVIDIA認證系統存儲認證,適用於基於NVIDIA企業參考架構指南並搭配NVIDIA認證系統(NVIDIA-CertifiedSystems)部署人工智能(AI)工廠的企業。此認證驗證了WEKA數據平台(WEKADataPlatform)與NVIDIA最佳實踐的兼容性,確保為各類企業人工智能(AI)和高效能計算(HPC)工作負載提供最佳的存儲效能、效率和可擴展性。「WEKA與NVIDIA合作,為各機構提供高效能的人工智能(AI)儲存解決方案,結合NVIDIA人工智能數據平台(NVIDIAAIDataPlatform),解決限制人工智能(AI)創新的數據挑戰,並消除對模型能力和基礎設施效率的妥協,」WEKA產品總監NileshPatel表示。「正如突破音速障礙開啟了航空航天創新的新領域,WEKA增強記憶體網格(WEKAAugmentedMemoryGrid)正在打破人工智能(AI)記憶體的藩籬,擴展GPU記憶體並優化NVIDIA人工智能數據平台(NVIDIAAIDataPlatform)上的代幣效率。這一突破將改變人工智能(AI)令牌經濟學,使創新更快、更具成本效益,同時不妥協於性能表現。」「尋求利用自主人工智能(AI)和推理模型力量的企業,需為這些高要求的工作負載提供前所未有的效率和可擴展性,」NVIDIA儲存網絡技術副總裁RobDavis如是說。「結合NVIDIA和WEKA技術,使人工智能(AI)代理在推理過程中能以最先進的速度和精確度存取和處理數據。」服務範圍WEKA的NCP參考架構將於本月底推出,支援NVIDIABlackwell系統。WEKA增強記憶體網格(WEKAAugmentedMemoryGrid)功能將於2025年春季正式對WEKA數據平台(WEKADataPlatform)客戶開放。詳情請參閱本公司網誌:全新增強記憶體網格(AugmentedMemoryGrid)功能徹底革新人工智能推理基礎設施(AIInferenceInfrastructure)的經濟學。WEKA與NVIDIABlackwell一同釋放人工智能推理(AIReasoning)潛能歡迎蒞臨NVIDIAGTC2025展位:與會者可以前往GTC博覽會大廳(GTCExpoHall)的WEKA展位,體驗全新增強記憶體網格(AugmentedMemoryGrid)功能。客戶支持語錄TogetherAI在TogetherAI,我們對速度和效率充滿熱忱。「這就是為什麼我們打造了Together推理引擎(TogetherInferenceEngine),提供業界最快的推理速度,」TogetherAI技術總監CeZhang如是說。「我們很高興能夠利用WEKA增強記憶體網格(WEKAAugmentedMemoryGrid),縮短提示緩存的時間,並提高在多個節點間使用這些緩存的靈活性—從而降低延遲,並惠及超過50萬名在TogetherAI平台上開發的人工智能(AI)開發者。」YottaDataServices「WEKA數據平台(WEKADataPlatform)在提升印度最快人工智能(AI)超級計算平台YottaShaktiSupercloud的性能和可擴展性方面,發揮了關鍵作用,」YottaDataServices(NVIDIA雲端合作夥伴)聯合創辦人、董事總經理兼行政總裁SunilGupta如是說。「WEKA增強記憶體網格(WEKAAugmentedMemoryGrid)功能及其作為NVIDIABlackwell部署的高效能數據儲存認證,為雲端規模的人工智能(AI)帶來全新的效率。透過擴展GPU記憶體並最大化我們ShaktiSupercloud隊伍的利用率,WEKA將幫助我們為客戶提供更好的人工智能(AI)性能、更快的推理速度以及更高的成本效益。」WEKA簡介WEKA正在設計一種為人工智能(AI)時代打造的新型企業數據架構。WEKA®數據平台(WEKA®DataPlatform)採用雲端原生及人工智能(AI)原生架構,樹立人工智能(AI)基礎設施的標竿。該平台可靈活部署於任何地方,支援本地、雲端和邊緣運算環境之間的無縫數據轉移。該平台將傳統數據孤島轉化為動態數據管道,可加速GPU運算、人工智能(AI)模型訓練和推理以及其他高性能工作負載,使之能更高效地運作、減少能耗,並降低相關的碳排放。WEKA幫助全球最具創新精神的企業和研究機構解決複雜的數據挑戰,更快速、更可持續地探索新發現、見解和成果,其客戶更是包括財富50強中的12間企業。請瀏覽www.weka.io了解更多資訊,或在LinkedIn和X上關注WEKA。「WEKA」及WEKA標誌乃WekaIO,Inc.的註冊商標。此處使用的其他商業名稱可能為其他商標擁有者分別擁有。
藉由NVIDIA人工智能數據平台(NVIDIA AI Data Platform)加速人工智能推理(AI Reasoning),並為NVIDIA雲端合作夥伴及企業部署(NVIDIA Cloud Partners and Enterprise Deployments)獲得全新存儲認證
加州聖荷西市和坎貝爾市2025年3月19日 -- 來自GTC 2025:WEKA這家原生於人工智能(AI)的數據平台公司,宣佈將與NVIDIA人工智能數據平台(NVIDIA AI Data Platform)參考設計進行整合,並已獲得NVIDIA存儲認證,旨在為未來的代理人工智能(AI)和推理模型提供優化的人工智能(AI)基礎設施。此外,該公司還宣佈,針對NVIDIA Cloud Partner(NCP)參考架構(Reference Architecture)與NVIDIA GB200 NVL72以及針對企業人工智能(AI)工廠部署的NVIDIA認證系統™存儲認證(NVIDIA-Certified Systems™ Storage)認證,已獲得新的認證,並適用於NVIDIA企業參考架構(NVIDIA Enterprise Reference Architectures)。
優化人工智慧基礎架構,迎接代理式人工智慧的未來
【請點我,AI告訴你更多和這新聞有關的資訊】
NVIDIA人工智能數據平台是一個為AI應用程序優化的基礎設施解決方案,它整合了NVIDIA的硬件(如Blackwell GPU、BlueField DPU、Spectrum-X網絡)和軟件(AI Enterprise)組件,目的是提供高效能的AI計算環境。
AI推理(AI Reasoning)是指AI模型在訓練完成後,應用於實際數據分析和決策的過程。這與模型訓練不同,推理階段更注重速度和效率,因為它是AI系統實際運作的環節。
代理人工智能(AI Agents)是一種能夠自主決策和執行任務的AI系統,它們能夠基於上下文理解問題、制定策略並執行適當的操作。這些代理需要強大的記憶能力來處理長上下文視窗和複雜任務。
令牌(Token)在NLP領域中是指文本被分解為的基本單位,可能是單詞、部分單詞或字符。令牌處理速度和效率是衡量AI推理系統性能的重要指標。首次令牌處理時間(TTFT, Time To First Token)是指系統從接收到查詢到產生第一個回應令牌所需的時間。
增強記憶體網格(Augmented Memory Grid)是WEKA推出的技術,它通過將存儲系統變成類似於GPU記憶體的延伸,解決了大型AI模型面臨的記憶體限制問題。該技術使AI模型能夠訪問遠超單一GPU記憶體容量的數據空間,同時保持接近記憶體速度的訪問性能。
NVIDIA認證系統(NVIDIA-Certified Systems)是NVIDIA針對企業級硬件設立的認證標準,確保這些系統能夠滿足AI和高性能計算工作負載的需求。獲得NVIDIA存儲認證意味著這些存儲解決方案已被驗證可以與NVIDIA的GPU、網絡和軟件堆棧良好協作。
在AI基礎設施中,存儲系統的性能對於整體系統效率至關重要。高性能存儲可以減少GPU等待數據的時間,提高整體系統利用率,並降低總體擁有成本(TCO)。特別是在處理大型語言模型(LLM)時,高效的存儲系統可以顯著影響推理性能和經濟效益。
AI工廠(AI Factory)是NVIDIA提出的概念,指的是用於大規模部署和運行AI應用的標準化基礎設施和流程。它類似於傳統的工業工廠,但專注於AI模型的生產和部署,強調可擴展性、效率和標準化。
WEKA亦推出全新的增強記憶體網格™(Augmented Memory Grid™)功能,將WEKA數據平台(WEKA Data Platform)軟件與NVIDIA加速計算、網絡及企業軟件整合,旨在加速人工智能(AI)推理,最大化每秒處理的令牌數量,並大幅提升令牌效率。
藉由WEKA高效能存儲(High-Performance Storage)為人工智能代理(AI Agents)提供動力,
NVIDIA人工智能數據平台(NVIDIA AI Data Platform)正在重新定義企業基礎設施,以迎接代理人工智能(AI)時代的來臨。它提供可自訂的參考設計,將NVIDIA Blackwell平台、NVIDIA BlueField® DPUs、NVIDIA Spectrum-X™網絡、NVIDIA AI Enterprise軟件與企業存儲整合,將數據轉化為可執行的情報。 組織現在可以利用NVIDIA人工智能數據平台(NVIDIA AI Data Platform)與WEKA數據平台(WEKA Data Platform)軟件的優勢,打造一個大規模可擴展、高效能的企業人工智能基礎,將人工智能查詢代理與業務知識連接,並實現卓越的人工智能推理效能及更高的複雜推理準確度。
突破人工智能(AI)記憶體瓶頸,藉由WEKA增強記憶體網格(WEKA Augmented Memory Grid)
人工智能(AI)代理持續擴展自主決策、複雜問題解決及適應性學習的能力,這使得對能夠支持更長上下文視窗、擴展模型參數以及增加系統記憶體需求的人工智能(AI)基礎設施的需求日益增長。藉由WEKA增強記憶體網格(WEKA Augmented Memory Grid),人工智能(AI)模型可以擴展記憶體以支援大型模型推理,提供額外數百萬TB的容量,比現今單一TB固定增量高出三個數量級。 同時,WEKA增強記憶體網格(WEKA Augmented Memory Grid)能夠在微秒延遲下提供接近記憶體速度的效能,實現更快速的令牌處理,從而達成前所未有的推理結果。主要優勢包括:
- 顯著縮短首次令牌處理時間: 在處理105,000個令牌時,WEKA增強記憶體網格(WEKA Augmented Memory Grid)將首次令牌處理時間縮短了41倍,相較於重新計算預填上下文。
- 優化的令牌處理: 推理集群可以實現更高的令牌吞吐量,並將整個推理系統的令牌吞吐成本降低最多達24%。
憑藉全新NVIDIA存儲認證推動企業人工智能(AI)創新
WEKApod™ Nitro數據平台設備(WEKApod™ Nitro Data Platform Appliances)已獲得認證,成為首批支持NVIDIA Cloud Partner(NCP)部署的高效能存儲解決方案之一,並與NVIDIA HGX H200、B200及GB200 NVL72配合使用,旨在為NCP供應商提供強大的基礎設施服務,助力人工智能(AI)開發者和創新者。WEKApod設備提供高效能密度和能源效率 — 單個8U入門級配置最多可支援1,152顆GPU。
WEKApod™ Nitro設備也獲得了全新的NVIDIA認證系統存儲認證,適用於基於NVIDIA企業參考架構指南並搭配NVIDIA認證系統(NVIDIA-Certified Systems)部署人工智能(AI)工廠的企業。此認證驗證了WEKA數據平台(WEKA Data Platform)與NVIDIA最佳實踐的兼容性,確保為各類企業人工智能(AI)和高效能計算(HPC)工作負載提供最佳的存儲效能、效率和可擴展性。
「WEKA與NVIDIA合作,為各機構提供高效能的人工智能(AI)儲存解決方案,結合NVIDIA人工智能數據平台(NVIDIA AI Data Platform),解決限制人工智能(AI)創新的數據挑戰,並消除對模型能力和基礎設施效率的妥協,」WEKA產品總監Nilesh Patel表示。「正如突破音速障礙開啟了航空航天創新的新領域,WEKA增強記憶體網格(WEKA Augmented Memory Grid)正在打破人工智能(AI)記憶體的藩籬,擴展GPU記憶體並優化NVIDIA人工智能數據平台(NVIDIA AI Data Platform)上的代幣效率。這一突破將改變人工智能(AI)令牌經濟學,使創新更快、更具成本效益,同時不妥協於性能表現。」
「尋求利用自主人工智能(AI)和推理模型力量的企業,需為這些高要求的工作負載提供前所未有的效率和可擴展性,」NVIDIA儲存網絡技術副總裁Rob Davis如是說。「結合NVIDIA和WEKA技術,使人工智能(AI)代理在推理過程中能以最先進的速度和精確度存取和處理數據。」
服務範圍
- WEKA的NCP參考架構將於本月底推出,支援NVIDIA Blackwell系統。
- WEKA增強記憶體網格(WEKA Augmented Memory Grid)功能將於2025年春季正式對WEKA數據平台(WEKA Data Platform)客戶開放。
詳情
請參閱本公司網誌:
歡迎蒞臨NVIDIA GTC 2025展位:與會者可以前往GTC博覽會大廳(GTC Expo Hall)的WEKA展位,體驗全新增強記憶體網格(Augmented Memory Grid)功能。
客戶支持語錄
Together AI
在Together AI,我們對速度和效率充滿熱忱。「這就是為什麼我們打造了Together推理引擎(Together Inference Engine),提供業界最快的推理速度,」Together AI技術總監Ce Zhang如是說。「我們很高興能夠利用WEKA增強記憶體網格(WEKA Augmented Memory Grid),縮短提示緩存的時間,並提高在多個節點間使用這些緩存的靈活性—從而降低延遲,並惠及超過50萬名在Together AI平台上開發的人工智能(AI)開發者。」
Yotta Data Services
「WEKA數據平台(WEKA Data Platform)在提升印度最快人工智能(AI)超級計算平台Yotta Shakti Supercloud的性能和可擴展性方面,發揮了關鍵作用,」Yotta Data Services(NVIDIA雲端合作夥伴)聯合創辦人、董事總經理兼行政總裁Sunil Gupta如是說。「WEKA增強記憶體網格(WEKA Augmented Memory Grid)功能及其作為NVIDIA Blackwell部署的高效能數據儲存認證,為雲端規模的人工智能(AI)帶來全新的效率。透過擴展GPU記憶體並最大化我們Shakti Supercloud隊伍的利用率,WEKA將幫助我們為客戶提供更好的人工智能(AI)性能、更快的推理速度以及更高的成本效益。」
WEKA簡介
WEKA正在設計一種為人工智能(AI)時代打造的新型企業數據架構。WEKA®數據平台(WEKA® Data Platform)採用雲端原生及人工智能(AI)原生架構,樹立人工智能(AI)基礎設施的標竿。該平台可靈活部署於任何地方,支援本地、雲端和邊緣運算環境之間的無縫數據轉移。該平台將傳統數據孤島轉化為動態數據管道,可加速GPU運算、人工智能(AI)模型訓練和推理以及其他高性能工作負載,使之能更高效地運作、減少能耗,並降低相關的碳排放。WEKA幫助全球最具創新精神的企業和研究機構解決複雜的數據挑戰,更快速、更可持續地探索新發現、見解和成果,其客戶更是包括財富50強中的12間企業。請瀏覽www.weka.io了解更多資訊,或在LinkedIn和X上關注WEKA。
「WEKA」及WEKA標誌乃WekaIO, Inc.的註冊商標。此處使用的其他商業名稱可能為其他商標擁有者分別擁有。
【請點我,AI告訴你更多和這新聞有關的資訊】
現正直播