OpenAI近日推出全新API選項「Flex處理模式」(Flex processing),讓用戶能夠透過接受較慢的回應速度和偶爾資源不可用的情況,來獲得更低廉的AI模型使用費用。這項功能目前處於beta測試階段,支援OpenAI最新發布的o3和o4-mini推理模型。
根據OpenAI官方說明,Flex模式主要針對優先級較低、非生產環境的工作負載設計,例如模型評估、資料增補與非同步運算等場景。啟用Flex模式後,用戶可享受約50%的成本節省:o3模型的Flex價格為每百萬輸入tokens 5美元、輸出tokens 20美元,相較標準價格的10美元與40美元大幅降低;o4-mini模型則從原本每百萬輸入tokens 1.10美元與輸出tokens 4.40美元,降至0.55美元與2.20美元。
此舉被視為OpenAI在競爭激烈的AI市場中的策略性調整,特別是在Google同日推出Gemini 2.5 Flash模型的背景下。值得注意的是,OpenAI同時加強了平台安全措施,要求使用階層1至3的用戶完成新的身份驗證流程才能存取o3模型及其他特定功能,以防止惡意用戶違反平台使用政策。