a一级爱做片免费观看欧美,久久国产一区二区,日本一二三区免费,久草视频手机在线观看

新聞中心

EEPW首頁 > 智能計算 > 編輯觀點 > OpenAI裝都不裝了,提案要求禁用DeepSeek

OpenAI裝都不裝了,提案要求禁用DeepSeek

作者:陳玲麗 時間:2025-03-20 來源:電子產品世界 收藏

中國大模型公司杭州深度求索(DeepSeek)發布的開源模型DeepSeek-R1如同一股颶風,在市場掀起巨浪。DeepSeek之所以火爆科技圈,關鍵在于其只需要使用比-o1低90%至95%的API調用成本,就可以在數學、編程和推理等關鍵領域達到與-o1相媲美的表現。

本文引用地址:http://www.j9360.com/article/202503/468386.htm

640.jpeg

彭博社這樣描述DeepSeek-R1模型引起的轟動效應:“這一潛在威脅動搖了美國科技公司的行業領先地位,導致與相關的科技股大跌,包括微軟、英偉達、甲骨文以及谷歌母公司Alphabet。”截至1月27日,這些公司的市值合計蒸發近1萬億美元。

DeepSeek打破刻板印象

2024年12月26日,DeepSeek-V3首個版本上線并同步開源,總參數達6710億,采用創新的MoE(Mixture of Experts,混合專家)架構和FP8混合精度訓練,公布了長達53頁的訓練和技術細節;2025年1月20日,新一代推理模型型DeepSeek-R1發布,部分性能與的GPT-4o正式版持平。近期,DeepSeek也發布了圖像模型Janus pro,但是效果一般,在多模態的領域,開源還有更長的路要走。

DeepSeek-R1的開源及其后續的商業化部署,引起了全球用戶和開發者的廣泛關注,尤其是在資本市場上的影響力不容小覷。從技術路徑來看,DeepSeek最大的優勢在于,通過算法優化和資源調配,減少了大語言模型(LLM)預訓練的時間。作為一個預訓練模型,它在某些重要任務上的表現已經接近美國最先進的模型,同時顯著降低了訓練成本。

DeepSeek團隊通過一系列令人印象深刻的創新實現了這一突破,主要集中在提升工程效率方面 —— 在「鍵值緩存」(Key-Value cache)管理方面做出了特別創新的改進,并且將MoE方法推進到了前所未有的水平。

在DeepSeek發表的原始報告中有詳細解釋這筆成本的計算:在預訓練階段,每兆個token上訓練DeepSeek-V3僅需要180K H800 GPU小時,也就是說在擁有2048個H800 GPU的叢集上需要3.7天。因此,預訓練階段在不到兩個月的時間內完成,耗費2664K GPU小時。加上上下文長度擴充所需的119K GPU小時和后制訓練所需的5K GPU小時,DeepSeek-V3的完整訓練僅需2.788M GPU小時。假設H800 GPU的租賃價格為每GPU小時2美元,總訓練成本僅為557.6萬美元。而GPT-4o的約為1億美元,使用25000個GPU芯片。

推理成本上,OpenAI o1每百萬輸入和百萬輸出token分別收取15美元和60美元,而DeepSeek R1同樣輸入與輸出的價格分別只要0.55美元和2.19美元,差不多只是前者的3%。

640-2.jpeg

不論是OpenAI還是其他頭部AI廠商都走的是“大力出奇跡”路線,即通過堆大量來訓練大模型推理能力,但DeepSeek用有限的資源走了一條適合國內的路。與其討論DeepSeek能否成為“中國版”的OpenAI,不如說DeepSeek其實挑戰了OpenAI的模式,畢竟OpenAI也并不一定是大模型的終局。

國外獨立評測機構Artificial Analysis測試了DeepSeek-V3后得出的結論:DeepSeek-V3超越了迄今為止所有開源模型。需要注意的是,對比Android與iOS的生態隔離,開源與閉源大模型均基于Transformer架構,差異是在數據、算法運用、工程等維度,并非是截然不同的技術路線。

DeepSeek不僅提升了國內AI技術的整體水平,還幫助開發者和中小型大模型創業公司完成了AI市場教育。目前,DeepSeek-R1、V3、Coder等系列模型已正式上線國家超算互聯網平臺,這標志著DeepSeek正式進入“國家隊”,同時也代表著一個基于國產深算智能加速卡的普惠、可靠AI大模型時代的到來。

OpenAI提案要求禁用DeepSeek

OpenAI首席執行官Sam Altman在社交平臺X上表示,“DeepSeek的R1是一款令人印象深刻的模型,尤其是考慮到它們能夠以這個價格提供的功能”。OpenAI在DeepSeek-R1模型發布后,為了維持其在AI領域的領先地位,迅速發布了推理模型o3-mini,支持low、medium和high三種推理難度。另外,DeepSeek的崛起迫使OpenAI加速推出免費的搜索引擎功能以應對競爭,2025年2月6日,OpenAI宣布向所有用戶開放ChatGPT搜索功能,并且無需注冊即可使用。

而隨后2025年3月13日,OpenAI全球事務副總裁Christopher Lehane向白宮科學技術政策辦公室(OSTP)提交了一份長達15頁的政策建議報告,DeepSeek在報告中被點名15次。Christopher Lehane表示”盡管美國目前在人工智能領域保持領先,但DeepSeek表明我們的領先優勢并不大,而且正在縮小”,同時,聲稱在關鍵基礎設施和其他高風險應用中使用DeepSeek會「帶來重大風險」,要求美國政府采取行動。

640-3.jpeg

OpenAI指控DeepSeek存在技術安全缺陷,R1模型架構“可能導致敏感任務失控”,威脅美國關鍵基礎設施。報告特別提及歐洲金融機構(如匯豐銀行)測試DeepSeek模型,警示盟友技術依賴轉移風險,呼吁加強「民主AI供應鏈」審查。

提案中,強調當前美國面臨來自中國AI技術的“系統性挑戰”,建議參考拜登政府的出口規則,采取分級制度:第一級(Tier I)是“致力于民主人工智能原則的國家”,包括美國盟友,完全遵循美國技術標準,可以享受補貼與市場準入,但不能使用中國生產的設備以及“侵犯用戶隱私并存在知識產權盜竊等安全風險的人工智能模型”;第二級(Tier II)是沒能阻止受出口管制的芯片被轉移到“第三級國家”的國家,需承諾安全審查后可升級至Tier I;第三級(Tier III)則是中國等國家,嚴格限制AI技術出口。

OpenAI這封信函實際上是響應《人工智能行動計劃》的一份提案,今年2月美國政府為制定新的AI政策向外界公開征求意見。今年1月,特朗普政府直接撤銷了先前美國的AI行政命令《安全、可靠和值得信賴的人工智能開發與使用》,轉而迅速簽署了一項全新《人工智能行動計劃》,要求在短短180天內提交一份AI行動計劃,直言“美國矢志維持并鞏固其在全球人工智能領域的霸主地位”。

美國國會、海軍、五角大樓、NASA等政府機構和部門已經紛紛對DeepSeek下達了禁令,甚至在今年1月29日發布《2025年美國人工智能能力與中國脫鉤法案》(Decoupling America’s Artificial Intelligence Capabilities from China Act of 2025)禁止美國人協助中國推動AI,并禁止美國人下載或使用DeepSeek,否則將被定性為犯罪,最高可判處20年監禁及處以100萬美元的罰款。彭博報道,已有數百家美國公司,尤其是與政府相關的企業,都已經屏蔽了DeepSeek。

曾幾何時,OpenAI堪稱開源界的先鋒,從GPT-3開始,畫風突變,毅然筑起閉源的高墻,通過API訂閱制賺得是盆滿缽滿,全然不顧曾經的開源初心。

OpenAI裝都不裝了

OpenAI提案中同時還呼吁美國聯邦政府應該幫助AI公司免受日益嚴苛的州級AI法規的影響,借機提出了真正的核心議題 —— 聯邦與州法規的博弈、版權數據使用的合法性爭議。

想要獲得州級法規豁免權

OpenAI建議建立一個范圍明確的框架,促成聯邦政府與私營公司之間的自愿合作,在適當的情況下政府能夠從企業獲得經驗和資源,而作為交換,私營公司則能免受今年美國各州已經提出的781項與AI相關提案的影響。美國人工智能安全研究院(US AI Safety Institute)可以充當聯邦政府與私營公司之間的主要政府機構,“企業不必受到各州法規的約束,因為后者顯然遠不及聯邦層面的監管完善”。如果企業自愿與該機構合作,允許其對自家模型進行審查,政府就應該向它們提供“包括免除州級法規在內的責任保護”,尤其是在涉及前沿模型安全法規上。

OpenAI警告若美國不豁免AI公司州級法規束縛,否則在數據獲取受限下,美國技術優勢將迅速消失,中國將贏得AI競賽。政府應鼓勵公私合作,加速AI在政府機構中的應用,并消除已知的障礙,包括過時且冗長的認證流程、限制性測試權限、缺乏靈活性的采購渠道。

想要進行版權改革

已經有包括OpenAI在內的多家公司,因訓練模型的數據而面臨多起版權起訴。對于此前引起巨大爭議的版權問題,OpenAI也強調應該對此進行版權改革 —— 這是因為「合理使用原則」(fair use doctrine)對維持AI領域的領先地位至關重要。

版權法在美國早期技術進步的階段發揮了重要作用。美國擁有眾多AI初創公司,吸引大量投資,并在研究方面取得諸多突破,主要也是得益于合理使用原則。OpenAI主張強化合理使用原則,允許被允許自由使用版權材料訓練模型,同時推動國際版權規則改革,防止中國通過“寬松監管”獲取數據優勢。針對創作者群體的抗議,OpenAI反擊稱,歐盟的嚴格版權法已壓制了AI創新。報告同時建議美國政府向企業開放醫療等敏感數據,以加速AI研發。

硅谷風險投資機構Andreessen Horowitz認為,聯邦豁免權可釋放企業創新潛力,避免“監管碎片化”拖累競爭。而MIT技術政策教授Daron Acemoglu批評OpenAI試圖“用政治手段掩蓋技術焦慮”,其出口管制將分裂全球科技共同體。

科技霸權or科技平權

其實,OpenAI早就盯上了DeepSeek。今年1月,OpenAI就曾公開指控DeepSeek通過「模型蒸餾」(Model Distillation)技術“違規復制”其產品功能,然而,OpenAI卻拒絕透露具體技術細節或法律依據。模型蒸餾是一種通過訓練小型模型模仿大型模型行為的技術,廣泛應用于提高AI效率與降低成本,模型蒸餾本身是公開技術,但若涉及直接復制專有模型的輸出結構或參數,可能構成侵權,但是模型輸出的“功能相似性”難以直接構成侵權。

除非能證明DeepSeek直接竊取了OpenAI的訓練數據或代碼架構,否則訴訟可能無果而終,若指控屬實,OpenAI應公開技術比對報告;若僅是戰略打壓,則可能損害行業創新生態。OpenAI與DeepSeek的爭端,折射出全球AI產業從技術競爭向規則競爭演變的趨勢。無論是模型蒸餾的法律定性,還是數據隱私的合規要求,都可能成為影響市場格局的關鍵變量。

640-4.jpeg

即便美國可以封殺掉DeepSeek的手機、網頁端的應用,但DeepSeek的大模型、思路和代碼都已經融入了全世界的人工智能社區,被包括美國在內的程序人員廣泛使用。Meta首席科學家楊立昆(Yann LeCun)則直指,硅谷部分人擁有一種“錯位的優越感”。OpenAI現在應該做的是調整自己的產品而不是攻擊中國AI,進行毫無依據的污蔑和無理打壓。

由于DeepSeek這次的開源,讓行業最領先的水平平權了,寡頭所謂的“AI霸權”開始動搖,AI競賽的勝利者,不只能是擁有最多芯片的一方。這讓OpenAI重新思考,需要“弄清楚另一種開源戰略”,也是AI普惠的開端,會加速推動AI進化的速度,進而推動必要條件的成熟,帶來新的應用機會。

DeepSeek以較低的成本開發出了一個性能接近美國模型水平的產品,這次的特殊之處在于,首先展示預期成本降低的是一家中國公司。這種情況前所未有,具有重要的地緣政治意義。需要注意的是,中國AI的崛起在基礎層仍需突破芯片、算法等瓶頸的現狀下,通過系統工程優化實現"換道超車"不僅可能,更是必然選擇。

實際上,這是一場關于技術霸權爭奪、地緣政治博弈與全球AI產業格局重塑的縮影。在DeepSeek之前,曾經AI技術被認為是高不可攀的“貴族科技”,只有少數巨頭才能玩得起,OpenAI、微軟、谷歌、Meta就像矗立在AI領域的高山。但這一次,DeepSeek把AI從壟斷中解放出來,重構了全球AI競爭的邏輯:從依賴資本與硬件的“軍備競賽”,轉向算法優化與生態協作的“效率革命”。

DeepSeek-V3極低的訓練成本預示著AI大模型對算力投入的需求將大幅下降,但由經濟學家威廉·斯坦利·杰文斯提出的杰文斯悖論:當某種資源的使用效率提高、獲取變得更容易時,其總體使用量往往不減反增。DeepSeek的發展也呈現出類似的趨勢:算力效率的提升并未減少對算力的需求,反而推動了更多高算力應用的落地,使得行業對算力的需求持續增長。

報告顯示,2025年微軟、亞馬遜以及Meta等“超大規模企業”在人工智能數據中心和算力資源方面的投資將達到3710億美元,較上年增長44%。這一數字將在2032年攀升至5250億美元,增速超過DeepSeek這一現象級產品爆火之前的研究預期。

此前,人工智能方面的投資主要流向用于訓練或開發大規模新AI模型的數據中心和芯片。如今,科技巨頭將投資重點轉向“推理”環節,也就是模型訓練完成后運行并產出結果的過程。彭博行業研究分析師Mandeep Singh在報告中稱,對DeepSeek的空前關注很可能會促使科技公司“追加投資推理環節”,使其成為生成式人工智能市場上增長最快的板塊。



關鍵詞: OpenAI Deepseek 算力 AI

評論


相關推薦

技術專區

關閉