a一级爱做片免费观看欧美,久久国产一区二区,日本一二三区免费,久草视频手机在线观看

新聞中心

EEPW首頁 > 智能計算 > 業界動態 > OpenAI放大招!GPT-4.1上線,編程戰力全開

OpenAI放大招!GPT-4.1上線,編程戰力全開

作者: 時間:2025-04-15 來源:網易科技 收藏

4月15日消息,美國公司本周一宣布推出一系列全新的模型,這些模型專為任務優化,旨在應對來自谷歌、Anthropic等公司日益激烈的競爭。開發者現已可通過的應用程序接口(API)使用這些模型。

本文引用地址:http://www.j9360.com/article/202504/469391.htm

此次發布三個版本模型: Mini和 Nano。公司首席產品官凱文·韋爾(Kevin Weil)在直播活動中表示,新模型在多方面超越當前主流產品GPT-4o,在某些性能指標上甚至優于最強大的旗艦模型GPT-4.5。

無標題.jpg

在權威的SWE-Bench基準測試中,GPT-4.1獲得55%的得分,較其他OpenAI模型高出幾個百分點。韋爾稱:"這些新模型不僅擅長編程,更能精準執行復雜指令,是開發'智能體'的絕佳選擇。"

近幾個月來,模型的代碼生成能力顯著提升,推動軟件原型開發自動化與"智能體"能力升級。競爭對手Anthropic和谷歌均已推出擅長代碼生成的模型。此前業內盛傳OpenAI將發布GPT-4.1,知情人士透露該公司曾以"Alpha Quasar"為代號在多個評測平臺進行匿名測試。有Reddit用戶反饋該"匿名"模型"修復了其他大語言模型生成的所有不完整代碼"。

新模型能同時分析的代碼量是前代產品的八倍,代碼優化與漏洞修復能力顯著提升。其遵循指令能力也大幅改進,用戶無需反復調整指令即可獲得預期結果。演示中,GPT-4.1僅憑自然語言提示便快速構建出語言學習閃卡應用等程序。

“開發者非常看重編程能力,我們重點提升了模型生成可執行代碼的水平,”OpenAI后續訓練團隊負責人米歇爾·波克拉絲(Michelle Pokrass)透露。“我們持續改進模型遵循多種編程格式的能力,使其能更深入地探索代碼庫、可靠運行單元測試,并編寫可直接編譯的代碼。”

OpenAI表示,GPT-4.1較開發者最常用的GPT-4o提速40%,查詢輸入成本降低80%。

人工智能編程工具Windsurf的首席執行官瓦倫·莫漢(Varun Mohan)在直播中表示,他們在對GPT-4.1進行內部基準測試時發現,新模型性能較GPT-4o提高60%。他透露,新模型錯誤行為明顯減少,新模型錯誤讀取和編輯無關文件所耗費的時間顯著減少。

過去幾年中,OpenAI憑借2022年底推出的卓越聊天機器人ChatGPT引發的狂熱關注,將公眾興趣轉化為不斷擴大的業務,逐步構建起包含多款先進模型的商業版圖。上周,公司首席執行官薩姆·奧特曼(Sam Altman)在TED訪談中透露,OpenAI每周活躍用戶已超過5億且持續快速增長。

如今,OpenAI上線了種類繁多、功能各異、定價各不相同的模型。今年2月份公司發布最強大的旗艦模型GPT-4.5,不過目前仍處于“研究預覽”階段。

此外,OpenAI還上線了具備模擬推理能力的o1和o3模型。這些模型能夠將問題分解為多個部分解決,響應用戶的耗時較長,且使用成本較高。

ChatGPT的成功使得競爭對手近年來紛紛加大研發投入,力圖趕超OpenAI。據斯坦福大學本月發布的一份報告,谷歌、DeepSeek等公司開發的模型性能已經比肩OpenAI。報告還指出,Anthropic、Meta以及法國創企Mistral等公司亦緊隨其后。

華盛頓大學名譽教授奧倫·埃齊奧尼(Oren Etzioni)表示,未來不太可能由單一模型或一家公司壟斷市場。“隨著成本下降、開源普及以及生物、芯片設計等專業領域的專用模型崛起,未來將呈現多元發展格局。”曾任艾倫人工智能研究所(AI2)負責人的埃齊奧尼呼吁行業著眼大模型訓練成本與環境影響。

面對盈利壓力,OpenAI正加速商業化步伐。今年2月份公司首席運營官布拉德·萊特卡普(Brad Lightcap)接受采訪時表示,每周活躍用戶雖已經超過4億,較2024年12月份增長30%,但由于持續重金投資研發和基礎設施建設,OpenAI仍虧損數十億美元。今年1月份,OpenAI宣布將與軟銀、Oracle和MGX合作推進“星際之門”計劃,承諾斥資5000億美元建設人工智能數據中心。

近期OpenAI持續推出新功能。上周,奧特曼宣布ChatGPT將升級“記憶”功能,使聊天機器人能更好地記住并調用此前的對話內容;3月底,奧特曼宣布計劃今年夏季將推出一款開源權重模型,允許開發者免費下載并修改,公司將在未來幾周內開始測試。由于開放權重模型能夠根據不同用途進行定制且使用成本更低,它們已受到研究人員、開發者和初創企業的廣泛歡迎。



評論


相關推薦

技術專區

關閉