Granite3.2是小型的AI模型,通過對開發人員友好的授權條款,提供推理、視覺和護欄功能更新後的Granite時間序列模型可提供長期預測,參數少於10M;適用於金融與經濟趨勢分析、供應鏈需求預測,以及零售業的季節性庫存規劃等用例香港2025年3月4日--IBM於2月底推出其Granite大型語言模型家族的最新一代產品Granite3.2,持續推動小型、高效、企業專用的AI,為實際應用創造效益。IBM推出Granite3.2大語言模型,體現IBM發展企業專用、小型、高效與實用AI的策略。所有Granite3.2模型均採用寬鬆的Apache2.0開源授權條款,可在HuggingFace下載。部分模型現已在IBMwatsonx.ai、Ollama、Replicate和LMStudio上提供,預計不久將支援RHELAI1.5,為企業與開源社區注入更強大的AI能力。主要亮點全新視覺語言模型:專為理解文件任務而設計,在關鍵企業基準測試DocVQA、ChartQA、AI2D和OCRBench[1]中,表現可媲美甚至超越更大規模的模型(如Llama3.211B和Pixtral12B)。除了強大的訓練數據外,IBM也利用其開源Docling工具包處理8千5百萬份PDF文件,並生成2千6百萬個合成問答配對,提升視覺語言模型在處理大量文件工作流時的能力。增強推理功能:Granite3.2的2B與8B模型加入了「思維鏈」(ChainofThought,CoT)推理機制,且使用者可以開啟或關閉推理功能以優化效率。通過這項能力,8B模型在ArenaHard和AlpacaEval等指令遵循基準測試中的表現[2],比前一代優異比例達到兩位數,且不影響其他領域的安全性或性能。此外,通過創新的推理擴展方法,Granite3.28B模型可以調整至接近Claude3.5Sonnet或GPT-4o在數學推理基準(如AIME2024和MATH500[3])上的表現。GraniteGuardian安全模型更輕巧:在保持Granite3.1Guardian模型性能的同時,模型尺寸減少三成。此外,Granite3.2系列還引入了語言化信心評估(VerbalizedConfidence)新功能,可提供更精細的風險評估,幫助安全監測系統識別不確定性。IBM持續推動企業專用的小型AI模型策略,並已在測試中展現高效能。例如,Granite3.18B模型在Salesforce大型語言模型CRM基準測試中獲得高分,顯示其在實際應用中的準確度和可靠性。IBMGranite模型家族擁有廣大的合作夥伴生態體系,許多領先的軟件公司已將Granite模型嵌入其技術。Granite3.2是IBM在推動企業專用小型AI方面的重要進展,體現了IBM致力於提供小型、高效、實用AI的產品策略。CrushBank首席技術官DavidTan表示:「在CrushBank,我們親眼目睹了IBM開放、高效的人工智能模型如何為企業人工智能帶來真正的價值--在性能、成本效益和可擴展性之間實現適當的平衡。Granite3.2通過新的推理功能更進一步,我們很高興能在構建新的代理(智能體)解決方案時探索這些功能。」Granite3.2是IBM產品組合和戰略發展的重要一步,旨在為企業提供小型實用的AI。雖然思維鏈在推理任務中表現強大,但它需要大量計算資源,並非所有任務都必須啟用。因此,IBM在Granite3.2模型中加入了程式化開關功能,使用者可以根據需求開啟或關閉推理模式;模型可在不啟用推理的情況下運行較簡單的任務,以降低不必要的計算成本。此外,其他推理技術(例如推理擴展InferenceScaling)已顯示Granite3.28B模型能夠在標準數學推理基準測試中,媲美甚至超越更大模型的性能。持續發展這項推理技術也是IBM研究團隊的重點方向[4],以進一步提升AI的效能與應用範圍。除了Granite3.2的指令、視覺和防護模型之外,IBM也推出了新一代TinyTimeMixers(TTM)時間序列模型,這些模型的參數少於1千萬,具備長期預測能力,可進行長達兩年的長期預測。這些模型為長期趨勢分析提供強大工具,適用於金融與經濟趨勢分析、供應鏈需求預測,以及零售業的季節性庫存規劃。IBMAI研究副總裁SriramRaghavan表示:「AI的下一個時代將聚焦效率、整合與實際應用的影響力—企業應該能夠在不過度消耗計算資源的情境下,取得強大的AI效益。IBM最新的Granite模型發展專注於開放式解決方案,逐步推動AI的普及,使其更具成本效益,為現代企業創造更大價值。」欲了解Granite3.2的技術細節,請參閱相關技術文章。關於IBMIBM是全球領先的混合雲與人工智能、以及企業服務提供商,為全球175個國家和地區的客戶服務,幫助企業把握其數據洞察、簡化業務流程、降本增效,獲得行業競爭優勢。IBM混合雲平台和紅帽OpenShift為全球超過4,000家政府和企業機構的關鍵性基礎設施提供有力支撐,例如來自金融服務、電訊和醫療健康等行業的客戶,幫助他們快速、高效、安全地實現數碼轉型。IBM在人工智能、量子運算、特定行業的雲解決方案以及企業服務等方面的突破性創新,使其可以為客戶提供開放和靈活的選擇。IBM對信任、透明、責任、包容和服務的歷久彌新的承諾,是我們業務發展的基石。查詢更多資料,請瀏覽:www.ibm.com/傳媒查詢:郭韜
[email protected][1]視覺模型(VisionModel)的基準測試結果可在IBM技術文章《IBMGranite3.2:推理、視覺、預測與更多應用》(2025年2月26日發布)中查閱。[2]指令模型(InstructModel)的基準測試結果可在IBM技術文章《IBMGranite3.2:推理、視覺、預測與更多應用》(2025年2月26日發布)中查閱。[3]推理擴展(InferenceScaling)的基準測試結果可在IBM技術研究部落格《Granite3.2中的推理:利用推理擴展技術》(2025年2月26日發布)中查閱。[4]推理擴展技術在Granite3.2中的應用,IBM技術研究部落格,2025年2月26日發布IBMCorporationlogo.
- Granite 3.2是小型的 AI 模型,通過對開發人員友好的授權條款,提供推理、視覺和護欄功能
- 更新後的 Granite 時間序列模型可提供長期預測,參數少於10M;適用於金融與經濟趨勢分析、供應鏈需求預測,以及零售業的季節性庫存規劃等用例
香港2025年3月4日 -- IBM於2月底推出其 Granite 大型語言模型家族的最新一代產品 Granite 3.2,持續推動小型、高效、企業專用的 AI,為實際應用創造效益。
IBM 推出 Granite 3.2 大語言模型,體現 IBM 發展企業專用、小型、高效與實用 AI 的策略。
所有 Granite 3.2 模型均採用寬鬆的 Apache 2.0 開源授權條款,可在 Hugging Face 下載。部分模型現已在 IBM watsonx.ai、Ollama、Replicate 和 LM Studio 上提供,預計不久將支援 RHEL AI 1.5,為企業與開源社區注入更強大的 AI 能力。
【請點我,AI告訴你更多和這新聞有關的資訊】
Granite3.2是IBM最新推出的大型語言模型家族,特點是體積小但性能高,專為企業應用設計。以下是關於此技術及相關領域的延伸知識:
大型語言模型(LLM)的小型化趨勢:近年來,AI領域出現了模型小型化的趨勢,即在保持高性能的同時減少模型參數量。這種趨勢被稱為"Small Language Models" (SLM),旨在解決大型模型在部署時的高計算成本、能源消耗和碳排放問題。小型模型有助於在邊緣設備上運行AI,減少雲端依賴,並降低企業採用AI的成本門檻。
Apache 2.0開源授權:這是一種寬鬆的開源軟件許可證,允許使用者自由地使用、修改和分發軟件,包括商業用途。使用Apache 2.0授權的模型意味著企業可以將其整合到商業產品中而無需支付許可費,促進了AI技術的廣泛採用。
思維鏈(Chain of Thought)技術:這是一種提升LLM推理能力的技術,通過讓模型在回答問題時顯示其思考過程,模仿人類解決問題的方式。研究表明,這種方法能顯著提高模型在複雜推理任務中的表現,尤其是數學和邏輯問題。
視覺語言模型(VLM):這類模型能同時處理圖像和文本信息,對於理解文件、圖表和其他視覺元素至關重要。Granite3.2的視覺模型特別針對企業文檔處理進行了優化,這在金融、法律和醫療等領域具有重要應用價值。
時間序列分析與AI:時間序列預測是企業決策中的關鍵能力,尤其在金融市場分析、供應鏈管理和需求預測等領域。IBM的TinyTimeMixers模型專注於長期預測,能在參數量極小的情況下提供高準確度的長達兩年的預測能力。
推理擴展(Inference Scaling):這是一種創新技術,能夠顯著提升小型模型在複雜數學和推理任務上的表現,使其接近或超越參數量大得多的模型。這種技術對於在資源受限環境中部署AI模型具有重要意義。
企業AI的安全性考量:Granite3.2引入的GraniteGuardian安全模型和語言化信心評估功能反映了企業對AI安全性和可靠性的關注。這些功能有助於降低AI生成不當內容的風險,並提供更透明的不確定性評估。
AI的民主化趨勢:IBM通過提供小型高效的開源模型,推動了AI技術的普及化。這種策略使得更多規模較小的組織能夠採用和部署AI技術,而不受計算資源或預算的限制。
HuggingFace、Ollama、Replicate等平台:這些是當前AI社區中主要的模型
主要亮點
- 全新視覺語言模型:專為理解文件任務而設計,在關鍵企業基準測試 DocVQA、ChartQA、AI2D 和 OCRBench[1] 中,表現可媲美甚至超越更大規模的模型(如 Llama 3.2 11B 和 Pixtral 12B)。除了強大的訓練數據外,IBM 也利用其開源 Docling 工具包處理8千5百萬份 PDF 文件,並生成2千6百萬個合成問答配對,提升視覺語言模型在處理大量文件工作流時的能力。
- 增強推理功能:Granite 3.2的2B與8B模型加入了「思維鏈」(Chain of Thought,CoT)推理機制,且使用者可以開啟或關閉推理功能以優化效率。通過這項能力,8B 模型在 ArenaHard 和 Alpaca Eval 等指令遵循基準測試中的表現[2],比前一代優異比例達到兩位數,且不影響其他領域的安全性或性能。此外,通過創新的推理擴展方法,Granite 3.2 8B 模型可以調整至接近 Claude 3.5 Sonnet 或 GPT-4o 在數學推理基準(如 AIME2024 和 MATH500[3])上的表現。
- Granite Guardian 安全模型更輕巧:在保持 Granite 3.1 Guardian 模型性能的同時,模型尺寸減少三成。此外,Granite 3.2 系列還引入了語言化信心評估(Verbalized Confidence)新功能,可提供更精細的風險評估,幫助安全監測系統識別不確定性。
IBM 持續推動企業專用的小型 AI 模型策略,並已在測試中展現高效能。例如,Granite 3.1 8B 模型在 Salesforce 大型語言模型CRM基準測試中獲得高分,顯示其在實際應用中的準確度和可靠性。
IBM Granite 模型家族擁有廣大的合作夥伴生態體系,許多領先的軟件公司已將Granite模型嵌入其技術。Granite 3.2 是 IBM 在推動企業專用小型 AI 方面的重要進展,體現了 IBM 致力於提供小型、高效、實用 AI 的產品策略。
CrushBank 首席技術官 David Tan 表示:「在 CrushBank,我們親眼目睹了 IBM 開放、高效的人工智能模型如何為企業人工智能帶來真正的價值--在性能、成本效益和可擴展性之間實現適當的平衡。Granite 3.2 通過新的推理功能更進一步,我們很高興能在構建新的代理(智能體)解決方案時探索這些功能。」
Granite 3.2 是 IBM 產品組合和戰略發展的重要一步,旨在為企業提供小型實用的 AI。雖然思維鏈在推理任務中表現強大,但它需要大量計算資源,並非所有任務都必須啟用。因此,IBM 在 Granite 3.2 模型中加入了程式化開關功能,使用者可以根據需求開啟或關閉推理模式;模型可在不啟用推理的情況下運行較簡單的任務,以降低不必要的計算成本。
此外,其他推理技術(例如推理擴展 Inference Scaling) 已顯示 Granite 3.2 8B 模型能夠在標準數學推理基準測試中,媲美甚至超越更大模型的性能。持續發展這項推理技術也是 IBM 研究團隊的重點方向[4],以進一步提升 AI 的效能與應用範圍。
除了 Granite 3.2 的指令、視覺和防護模型之外,IBM 也推出了新一代 TinyTimeMixers(TTM)時間序列模型,這些模型的參數少於1千萬,具備長期預測能力,可進行長達兩年的長期預測。這些模型為長期趨勢分析提供強大工具,適用於金融與經濟趨勢分析、供應鏈需求預測,以及零售業的季節性庫存規劃。
IBM AI 研究副總裁 Sriram Raghavan 表示:「AI 的下一個時代將聚焦效率、整合與實際應用的影響力 — 企業應該能夠在不過度消耗計算資源的情境下,取得強大的 AI 效益。IBM 最新的 Granite 模型發展專注於開放式解決方案,逐步推動 AI 的普及,使其更具成本效益,為現代企業創造更大價值。」
欲了解Granite 3.2 的技術細節,請參閱相關技術文章。
關於 IBM
IBM 是全球領先的混合雲與人工智能、以及企業服務提供商,為全球175個國家和地區的客戶服務,幫助企業把握其數據洞察、簡化業務流程、降本增效,獲得行業競爭優勢。 IBM 混合雲平台和紅帽OpenShift 為全球超過4,000家政府和企業機構的關鍵性基礎設施提供有力支撐,例如來自金融服務、電訊和醫療健康等行業的客戶,幫助他們快速、高效、安全地實現數碼轉型。 IBM 在人工智能、量子運算、特定行業的雲解決方案以及企業服務等方面的突破性創新,使其可以為客戶提供開放和靈活的選擇。 IBM 對信任、透明、責任、包容和服務的歷久彌新的承諾,是我們業務發展的基石。查詢更多資料,請瀏覽:www.ibm.com/
傳媒查詢:
郭韜 [email protected]
IBM Corporation logo.
【請點我,AI告訴你更多和這新聞有關的資訊】
現正直播