OpenAI破天荒決策!CEO親證今夏將開放模型權重
4月1日消息,OpenAI首席執行官薩姆·奧特曼(Sam Altman)本周一透露,OpenAI將在今夏發布一款“開放權重”的人工智能模型。
本文引用地址:http://www.j9360.com/article/202504/468864.htm奧特曼在社交媒體平臺X上寫道,“我們未來幾個月內將推出一款具有推理能力的全新開放權重語言模型,對此倍感振奮。”
此舉既是對中國DeepSeek R1模型迅猛成功的回應,也因應Meta的Llama系列模型日益流行的壓力。
今年1月份DeepSeek發布R1模型后不久,奧特曼曾公開反思,OpenAI在開放模型的問題上“站在歷史錯誤的一邊”,暗示戰略調整勢在必行。本周一,他表示公司醞釀開放權重模型已有時日,“現在已到了必須行動的時刻”。
鑒于DeepSeek宣稱其模型訓練成本僅為主流大模型的零頭,OpenAI或許需要證明其新模型的低成本訓練能力。
HuggingFace主營業務是托管開放模型。公司聯合創始人兼首席執行官克萊門特·德朗格(Clement Delangue)稱,“這無疑是振奮人心的消息。隨著DeepSeek的出現,整個行業正在認識到開放權重的力量”
當前,OpenAI主要通過聊天機器人和云端服務提供其人工智能技術。而R1、Llama等開源權重模型不僅可以免費下載,還允許進行修改。所謂模型權重,指的是大型神經網絡內部的參數值——這些參數在模型訓練過程中確定。相較于閉源模型,開源權重模型使用成本更低,且能夠針對敏感場景進行定制,例如處理需要高度保密的信息。
OpenAI技術團隊成員史蒂文·海德爾(Steven Heidel)在轉發奧特曼的公告時補充說,“我們今年將發布一款可在自有硬件上運行的新模型。”
OpenAI負責人工智能安全研究的研究員約翰內斯·海德克(Johannes Heidecke)也通過社交媒體平臺X強調,公司將實施嚴格測試,確保開放權重模型不被濫用。一些人工智能研究人員擔心,開放權重模型可能助長網絡攻擊乃至生化武器研發的可能。對此海德克明確表示,“雖然開放模式帶來了獨特挑戰,但會遵循我們的預備框架,確保開放權重模型不易被濫用。”
周一OpenAI還在官網發布信息,邀請開發者申請內測即將發布的新模型。奧特曼透露,未來幾周公司將舉辦多場活動,向開發者展示新模型原型。
作為人工智能領域首個推行開放策略的頭部企業,Meta于2023年7月發布Llama初代模型,此后開放權重模型(參數可公開)數量激增。然而研究人員指出,Llama等模型的透明度仍存爭議:其訓練數據與核心技術細節始終未公開。此外,Meta的許可協議明確限制第三方通過Llama衍生工具獲利,形成“技術開源、商業設限”的獨特模式。
評論