OpenAI 正式推出 o1-preview:AI 智慧大升級!
人工智慧領域的領頭羊 OpenAI 於本週四發布了最新 AI 模型「o1-preview」。這款新模型強調在解答用戶問題前「多花點時間思考」,使其能更好地解決複雜的多步驟問題,尤其是在程式編寫與數學題目方面表現尤為出色。
全新訓練方式,準確度大提升
o1 模型採用了一種全新的訓練方式,透過「強化學習」技術教導系統逐步解決問題。根據 OpenAI 研究主管 Jerry Tworek 的說法,o1 使用了特別為它量身訂做的訓練數據集,並透過「思維鏈」來處理問題,讓 AI 可以像人類一樣進行邏輯推理。這種新方法不僅讓模型的準確度大幅提升,還減少了過去常見的「AI 幻覺」現象。
數學與編程能力一流
根據 OpenAI 首席研究官 Bob McGrew 的介紹,o1 在數學與編程領域展現出驚人的能力。在國際數學奧林匹克競賽的資格考試中,o1 的答對率高達 83%,遠遠超過前代 GPT-4o 的 13%。此外,o1 在著名的線上程式競賽 Codeforces 中的表現也名列前茅,達到參賽者的前 89%。這證明了它在解決複雜問題上的強大推理與計算能力。
ChatGPT Plus 用戶搶先體驗
目前,ChatGPT Plus 和 Team 用戶已經能搶先體驗到 o1-preview 和 o1-mini 兩個版本,而企業和教育用戶則將於下週初獲得使用權限。值得一提的是,OpenAI 計劃未來將 o1-mini 免費開放給所有 ChatGPT 用戶使用,敬請期待!
使用成本較高,但值得期待
雖然 o1 模型在某些方面表現亮眼,但相較於 GPT-4o,使用成本確實較高。o1-preview 的 API 使用成本為每百萬輸入詞元 15 美元,輸出詞元為 60 美元,這分別是 GPT-4o 的兩倍與三倍。對於開發者來說,這意味著要為更強大的推理能力支付更高的代價。
功能部分不及 GPT-4o,但具里程碑意義
需要注意的是,o1 模型在某些方面(如事實性知識、網頁瀏覽、文件和圖像處理)還不及 GPT-4o。然而,OpenAI 將這次的發展視為人工智慧邁向類人推理能力的重要一步,並將計數器重設為「1」,象徵 AI 能力的新起點。
OpenAI 認為,o1 模型的推出代表了人工智慧在推理任務上的重大進步,為未來更多複雜的 AI 應用打下堅實基礎。
未來展望
OpenAI 計劃在未來的更新版本中進一步提升 o1 模型在物理、化學和生物學等學科的推理能力,並預計這些能力將達到與博士生相當的水準。這一系列進展勢必讓 OpenAI 繼續領跑全球人工智慧技術的最前沿。