OpenAI於美國時間16日發布全新AI推理模型「o3」,這是業界首個能夠「用圖像思考」的人工智慧系統。該模型突破性地能夠理解並分析用戶上傳的草圖或圖表,即使是品質不佳的圖像,o3也能有效處理並提供思考過程清晰的答案。
根據CNBC報導,除了主力推理模型o3外,OpenAI同時推出了更輕量級的「o4-mini」模型。這是該公司自去年9月發布o1模型以來的最新推理系統升級。新模型專注於通過多步驟思考過程解決複雜問題,大幅提升了AI的推理能力。
OpenAI表示,o3模型允許用戶上傳白板筆記、草圖或其他視覺資料,AI可直接對這些內容進行分析與討論。該模型還具備圖像編輯功能,能夠旋轉、縮放或應用其他編輯工具。更重要的是,o3成為首個能夠獨立運用所有ChatGPT工具的推理模型,包括網頁瀏覽、Python編程、圖像理解和生成等功能,這使其在解決複雜問題時更加高效,也向AI獨立行動能力邁出了重要一步。
技術上,o3模型針對數學、編程、科學和圖像理解領域進行了專門優化,而o4-mini則提供更快的運行速度。兩款模型最大的突破在於能夠「用圖像思考」—不僅能識別圖像,還能將視覺信息直接整合到推理過程中,實現更全面的問題分析。
自2022年底推出ChatGPT以來,OpenAI持續快速迭代其AI技術,從最初的文本生成擴展到圖像、語音和視頻領域。目前,該公司在AI領域保持領先地位,但也面臨來自Google等科技巨頭的激烈競爭。