OpenAI裝都不裝了，提案要求禁用DeepSeek

作者：陳玲麗時間：2025-03-20 來源：電子產品世界

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

中國大模型公司杭州深度求索（DeepSeek）發布的開源模型DeepSeek-R1如同一股颶風，在市場掀起巨浪。DeepSeek之所以火爆科技圈，關鍵在于其只需要使用比OpenAI-o1低90%至95%的API調用成本，就可以在數學、編程和推理等關鍵領域達到與OpenAI-o1相媲美的表現。

本文引用地址：http://www.j9360.com/article/202503/468386.htm

彭博社這樣描述DeepSeek-R1模型引起的轟動效應：“這一潛在威脅動搖了美國科技公司的行業領先地位，導致與AI相關的科技股大跌，包括微軟、英偉達、甲骨文以及谷歌母公司Alphabet。”截至1月27日，這些公司的市值合計蒸發近1萬億美元。

DeepSeek打破刻板印象

2024年12月26日，DeepSeek-V3首個版本上線并同步開源，總參數達6710億，采用創新的MoE（Mixture of Experts，混合專家）架構和FP8混合精度訓練，公布了長達53頁的訓練和技術細節；2025年1月20日，新一代推理模型型DeepSeek-R1發布，部分性能與OpenAI的GPT-4o正式版持平。近期，DeepSeek也發布了圖像模型Janus pro，但是效果一般，在多模態的領域，開源還有更長的路要走。

DeepSeek-R1的開源及其后續的商業化部署，引起了全球用戶和開發者的廣泛關注，尤其是在資本市場上的影響力不容小覷。從技術路徑來看，DeepSeek最大的優勢在于，通過算法優化和資源調配，減少了大語言模型（LLM）預訓練的時間。作為一個預訓練模型，它在某些重要任務上的表現已經接近美國最先進的模型，同時顯著降低了訓練成本。

DeepSeek團隊通過一系列令人印象深刻的創新實現了這一突破，主要集中在提升工程效率方面 —— 在「鍵值緩存」（Key-Value cache）管理方面做出了特別創新的改進，并且將MoE方法推進到了前所未有的水平。

在DeepSeek發表的原始報告中有詳細解釋這筆成本的計算：在預訓練階段，每兆個token上訓練DeepSeek-V3僅需要180K H800 GPU小時，也就是說在擁有2048個H800 GPU的叢集上需要3.7天。因此，預訓練階段在不到兩個月的時間內完成，耗費2664K GPU小時。加上上下文長度擴充所需的119K GPU小時和后制訓練所需的5K GPU小時，DeepSeek-V3的完整訓練僅需2.788M GPU小時。假設H800 GPU的租賃價格為每GPU小時2美元，總訓練成本僅為557.6萬美元。而GPT-4o的約為1億美元，使用25000個GPU芯片。

推理成本上，OpenAI o1每百萬輸入和百萬輸出token分別收取15美元和60美元，而DeepSeek R1同樣輸入與輸出的價格分別只要0.55美元和2.19美元，差不多只是前者的3%。

不論是OpenAI還是其他頭部AI廠商都走的是“大力出奇跡”路線，即通過堆大量算力來訓練大模型推理能力，但DeepSeek用有限的資源走了一條適合國內的路。與其討論DeepSeek能否成為“中國版”的OpenAI，不如說DeepSeek其實挑戰了OpenAI的模式，畢竟OpenAI也并不一定是大模型的終局。

國外獨立評測機構Artificial Analysis測試了DeepSeek-V3后得出的結論：DeepSeek-V3超越了迄今為止所有開源模型。需要注意的是，對比Android與iOS的生態隔離，開源與閉源大模型均基于Transformer架構，差異是在數據、算法運用、工程等維度，并非是截然不同的技術路線。

DeepSeek不僅提升了國內AI技術的整體水平，還幫助開發者和中小型大模型創業公司完成了AI市場教育。目前，DeepSeek-R1、V3、Coder等系列模型已正式上線國家超算互聯網平臺，這標志著DeepSeek正式進入“國家隊”，同時也代表著一個基于國產深算智能加速卡的普惠、可靠AI大模型時代的到來。

OpenAI提案要求禁用DeepSeek

OpenAI首席執行官Sam Altman在社交平臺X上表示，“DeepSeek的R1是一款令人印象深刻的模型，尤其是考慮到它們能夠以這個價格提供的功能”。OpenAI在DeepSeek-R1模型發布后，為了維持其在AI領域的領先地位，迅速發布了推理模型o3-mini，支持low、medium和high三種推理難度。另外，DeepSeek的崛起迫使OpenAI加速推出免費的搜索引擎功能以應對競爭，2025年2月6日，OpenAI宣布向所有用戶開放ChatGPT搜索功能，并且無需注冊即可使用。

而隨后2025年3月13日，OpenAI全球事務副總裁Christopher Lehane向白宮科學技術政策辦公室（OSTP）提交了一份長達15頁的政策建議報告，DeepSeek在報告中被點名15次。Christopher Lehane表示”盡管美國目前在人工智能領域保持領先，但DeepSeek表明我們的領先優勢并不大，而且正在縮小”，同時，聲稱在關鍵基礎設施和其他高風險應用中使用DeepSeek會「帶來重大風險」，要求美國政府采取行動。

OpenAI指控DeepSeek存在技術安全缺陷，R1模型架構“可能導致敏感任務失控”，威脅美國關鍵基礎設施。報告特別提及歐洲金融機構（如匯豐銀行）測試DeepSeek模型，警示盟友技術依賴轉移風險，呼吁加強「民主AI供應鏈」審查。

提案中，強調當前美國面臨來自中國AI技術的“系統性挑戰”，建議參考拜登政府的出口規則，采取分級制度：第一級（Tier I）是“致力于民主人工智能原則的國家”，包括美國盟友，完全遵循美國技術標準，可以享受算力補貼與市場準入，但不能使用中國生產的設備以及“侵犯用戶隱私并存在知識產權盜竊等安全風險的人工智能模型”；第二級（Tier II）是沒能阻止受出口管制的芯片被轉移到“第三級國家”的國家，需承諾安全審查后可升級至Tier I；第三級（Tier III）則是中國等國家，嚴格限制AI技術出口。

OpenAI這封信函實際上是響應《人工智能行動計劃》的一份提案，今年2月美國政府為制定新的AI政策向外界公開征求意見。今年1月，特朗普政府直接撤銷了先前美國的AI行政命令《安全、可靠和值得信賴的人工智能開發與使用》，轉而迅速簽署了一項全新《人工智能行動計劃》，要求在短短180天內提交一份AI行動計劃，直言“美國矢志維持并鞏固其在全球人工智能領域的霸主地位”。

美國國會、海軍、五角大樓、NASA等政府機構和部門已經紛紛對DeepSeek下達了禁令，甚至在今年1月29日發布《2025年美國人工智能能力與中國脫鉤法案》（Decoupling America’s Artificial Intelligence Capabilities from China Act of 2025）禁止美國人協助中國推動AI，并禁止美國人下載或使用DeepSeek，否則將被定性為犯罪，最高可判處20年監禁及處以100萬美元的罰款。彭博報道，已有數百家美國公司，尤其是與政府相關的企業，都已經屏蔽了DeepSeek。

曾幾何時，OpenAI堪稱開源界的先鋒，從GPT-3開始，畫風突變，毅然筑起閉源的高墻，通過API訂閱制賺得是盆滿缽滿，全然不顧曾經的開源初心。

OpenAI裝都不裝了

OpenAI提案中同時還呼吁美國聯邦政府應該幫助AI公司免受日益嚴苛的州級AI法規的影響，借機提出了真正的核心議題 —— 聯邦與州法規的博弈、版權數據使用的合法性爭議。

想要獲得州級法規豁免權

OpenAI建議建立一個范圍明確的框架，促成聯邦政府與私營公司之間的自愿合作，在適當的情況下政府能夠從企業獲得經驗和資源，而作為交換，私營公司則能免受今年美國各州已經提出的781項與AI相關提案的影響。美國人工智能安全研究院（US AI Safety Institute）可以充當聯邦政府與私營公司之間的主要政府機構，“企業不必受到各州法規的約束，因為后者顯然遠不及聯邦層面的監管完善”。如果企業自愿與該機構合作，允許其對自家模型進行審查，政府就應該向它們提供“包括免除州級法規在內的責任保護”，尤其是在涉及前沿模型安全法規上。

OpenAI警告若美國不豁免AI公司州級法規束縛，否則在數據獲取受限下，美國技術優勢將迅速消失，中國將贏得AI競賽。政府應鼓勵公私合作，加速AI在政府機構中的應用，并消除已知的障礙，包括過時且冗長的認證流程、限制性測試權限、缺乏靈活性的采購渠道。

想要進行版權改革

已經有包括OpenAI在內的多家公司，因訓練模型的數據而面臨多起版權起訴。對于此前引起巨大爭議的版權問題，OpenAI也強調應該對此進行版權改革 —— 這是因為「合理使用原則」（fair use doctrine）對維持AI領域的領先地位至關重要。

版權法在美國早期技術進步的階段發揮了重要作用。美國擁有眾多AI初創公司，吸引大量投資，并在研究方面取得諸多突破，主要也是得益于合理使用原則。OpenAI主張強化合理使用原則，允許被允許自由使用版權材料訓練模型，同時推動國際版權規則改革，防止中國通過“寬松監管”獲取數據優勢。針對創作者群體的抗議，OpenAI反擊稱，歐盟的嚴格版權法已壓制了AI創新。報告同時建議美國政府向企業開放醫療等敏感數據，以加速AI研發。

硅谷風險投資機構Andreessen Horowitz認為，聯邦豁免權可釋放企業創新潛力，避免“監管碎片化”拖累競爭。而MIT技術政策教授Daron Acemoglu批評OpenAI試圖“用政治手段掩蓋技術焦慮”，其出口管制將分裂全球科技共同體。

科技霸權or科技平權

其實，OpenAI早就盯上了DeepSeek。今年1月，OpenAI就曾公開指控DeepSeek通過「模型蒸餾」（Model Distillation）技術“違規復制”其產品功能，然而，OpenAI卻拒絕透露具體技術細節或法律依據。模型蒸餾是一種通過訓練小型模型模仿大型模型行為的技術，廣泛應用于提高AI效率與降低成本，模型蒸餾本身是公開技術，但若涉及直接復制專有模型的輸出結構或參數，可能構成侵權，但是模型輸出的“功能相似性”難以直接構成侵權。

除非能證明DeepSeek直接竊取了OpenAI的訓練數據或代碼架構，否則訴訟可能無果而終，若指控屬實，OpenAI應公開技術比對報告；若僅是戰略打壓，則可能損害行業創新生態。OpenAI與DeepSeek的爭端，折射出全球AI產業從技術競爭向規則競爭演變的趨勢。無論是模型蒸餾的法律定性，還是數據隱私的合規要求，都可能成為影響市場格局的關鍵變量。

即便美國可以封殺掉DeepSeek的手機、網頁端的應用，但DeepSeek的大模型、思路和代碼都已經融入了全世界的人工智能社區，被包括美國在內的程序人員廣泛使用。Meta首席科學家楊立昆（Yann LeCun）則直指，硅谷部分人擁有一種“錯位的優越感”。OpenAI現在應該做的是調整自己的產品而不是攻擊中國AI，進行毫無依據的污蔑和無理打壓。

由于DeepSeek這次的開源，讓行業最領先的水平平權了，寡頭所謂的“AI霸權”開始動搖，AI競賽的勝利者，不只能是擁有最多芯片的一方。這讓OpenAI重新思考，需要“弄清楚另一種開源戰略”，也是AI普惠的開端，會加速推動AI進化的速度，進而推動必要條件的成熟，帶來新的應用機會。

DeepSeek以較低的成本開發出了一個性能接近美國模型水平的產品，這次的特殊之處在于，首先展示預期成本降低的是一家中國公司。這種情況前所未有，具有重要的地緣政治意義。需要注意的是，中國AI的崛起在基礎層仍需突破芯片、算法等瓶頸的現狀下，通過系統工程優化實現"換道超車"不僅可能，更是必然選擇。

實際上，這是一場關于技術霸權爭奪、地緣政治博弈與全球AI產業格局重塑的縮影。在DeepSeek之前，曾經AI技術被認為是高不可攀的“貴族科技”，只有少數巨頭才能玩得起，OpenAI、微軟、谷歌、Meta就像矗立在AI領域的高山。但這一次，DeepSeek把AI從算力壟斷中解放出來，重構了全球AI競爭的邏輯：從依賴資本與硬件的“軍備競賽”，轉向算法優化與生態協作的“效率革命”。

DeepSeek-V3極低的訓練成本預示著AI大模型對算力投入的需求將大幅下降，但由經濟學家威廉·斯坦利·杰文斯提出的杰文斯悖論：當某種資源的使用效率提高、獲取變得更容易時，其總體使用量往往不減反增。DeepSeek的發展也呈現出類似的趨勢：算力效率的提升并未減少對算力的需求，反而推動了更多高算力應用的落地，使得行業對算力的需求持續增長。

報告顯示，2025年微軟、亞馬遜以及Meta等“超大規模企業”在人工智能數據中心和算力資源方面的投資將達到3710億美元，較上年增長44%。這一數字將在2032年攀升至5250億美元，增速超過DeepSeek這一現象級產品爆火之前的研究預期。

此前，人工智能方面的投資主要流向用于訓練或開發大規模新AI模型的數據中心和芯片。如今，科技巨頭將投資重點轉向“推理”環節，也就是模型訓練完成后運行并產出結果的過程。彭博行業研究分析師Mandeep Singh在報告中稱，對DeepSeek的空前關注很可能會促使科技公司“追加投資推理環節”，使其成為生成式人工智能市場上增長最快的板塊。

a一级爱做片免费观看欧美,久久国产一区二区,日本一二三区免费,久草视频手机在线观看

新聞中心

OpenAI裝都不裝了，提案要求禁用DeepSeek

評論

相關推薦

技術專區