OpenAI正打造“最強”開源模型 最早夏初發布
4月24日消息,今年3月下旬,OpenAI宣布將在年內推出自GPT-2以來的首個"開源"語言模型。隨著該公司與AI開發者社區的交流持續推進,關于這款模型的更多細節也逐步浮出水面。
本文引用地址:http://www.j9360.com/article/202504/469753.htm據知情人士透露,OpenAI研究副總裁艾丹·克拉克(Aidan Clark)正主導這項開發工作,目前仍處于初期階段。OpenAI計劃在今年初夏發布該模型,目標是打造一個在開源推理模型中達到頂尖水平的產品。這款模型定位為推理能力模型,類似于OpenAI現有的o系列產品。
知情人士稱,OpenAI正考慮為該模型采用一種高度寬松的開源許可協議,幾乎不設使用或商業限制。這與Meta的Llama、谷歌的Gemma等開源模型形成對比,后者因使用條款過于繁瑣而受到批評。OpenAI顯然希望避免步其后塵。
目前,OpenAI面臨來自包括中國AI實驗室DeepSeek在內的開源策略競爭者的挑戰。這些"開源"競爭者將模型提供給AI社區用于實驗,在某些情況下還允許商業化使用,與OpenAI此前更為封閉的做法形成鮮明對照。
這種開放策略已被證明對部分企業極其成功。Meta在3月初宣布,Llama系列模型的累計下載量已突破10億次。而DeepSeek也迅速積累了大量用戶,并獲得本土投資者的關注。
據悉,OpenAI此次推出的開源模型將支持純文本輸入輸出,可在高端消費級硬件上運行。開發者還可能可以選擇是否啟用“推理模式”——推理功能雖能提升準確性,但會以增加延遲為代價,這與Anthropic等公司近期發布的推理模型相似。
如果此次發布反響積極,OpenAI還計劃后續推出更多開源模型,可能包括更小規模的模型版本。
OpenAI首席執行官山姆·奧特曼(Sam Altman)此前曾公開表示,公司在技術開源方面“站在了歷史的錯誤面”,并呼吁重新審視開源戰略。
奧特曼在今年1月參加問答活動時指出:“我個人認為,我們需要制定一種新的開源策略。盡管并非所有OpenAI員工都認同這一觀點,目前這也不是我們的首要任務,但今后我們會推出更好的模型,不過領先優勢可能不像以往那樣顯著。”
他還表示,這款即將發布的模型將經歷嚴格的“紅隊測試”和安全評估流程。知情人士透露,OpenAI將為該模型發布“模型卡片”(Model Card),即一份全面的技術文檔,詳盡展示模型在內部與外部基準測試、安全性評估等方面的結果。
奧特曼上月發文稱:“我們會在發布前,依據‘模型準備度框架’對其進行全面評估,并在已知該模型發布后可能被修改的前提下,做更多的安全準備工作。”
盡管如此,OpenAI近年來也因對部分新模型倉促推進安全測試、未及時發布模型卡等問題,受到人工智能倫理學者的批評。奧特曼本人也曾在2023年11月被短暫罷免前,在模型安全審查方面誤導高管。
評論