←回上一頁

OpenAI推出Flex模式：以較慢速度換取更經濟的AI模型使用成本

2025-04-18 08:20 　　撰稿 / AI

OpenAI近日推出全新API選項「Flex處理模式」(Flex processing)，讓用戶能夠透過接受較慢的回應速度和偶爾資源不可用的情況，來獲得更低廉的AI模型使用費用。這項功能目前處於beta測試階段，支援OpenAI最新發布的o3和o4-mini推理模型。

根據OpenAI官方說明，Flex模式主要針對優先級較低、非生產環境的工作負載設計，例如模型評估、資料增補與非同步運算等場景。啟用Flex模式後，用戶可享受約50%的成本節省：o3模型的Flex價格為每百萬輸入tokens 5美元、輸出tokens 20美元，相較標準價格的10美元與40美元大幅降低；o4-mini模型則從原本每百萬輸入tokens 1.10美元與輸出tokens 4.40美元，降至0.55美元與2.20美元。

此舉被視為OpenAI在競爭激烈的AI市場中的策略性調整，特別是在Google同日推出Gemini 2.5 Flash模型的背景下。值得注意的是，OpenAI同時加強了平台安全措施，要求使用階層1至3的用戶完成新的身份驗證流程才能存取o3模型及其他特定功能，以防止惡意用戶違反平台使用政策。