a一级爱做片免费观看欧美,久久国产一区二区,日本一二三区免费,久草视频手机在线观看

新聞中心

EEPW首頁 > 智能計算 > 業界動態 > 外媒:DeepSeek省了訓練費,但推理模型應用成"燒錢黑洞"

外媒:DeepSeek省了訓練費,但推理模型應用成"燒錢黑洞"

作者: 時間:2025-02-24 來源:網易科技 收藏

2月24日消息,盡管投資者曾一度產生疑慮,但來自大型科技企業、各國政府以及風投機構的巨額資金正以前所未有的速度流入領域。要理解這一現象背后的原因,關鍵在于洞察技術本身的演進趨勢。

本文引用地址:http://www.j9360.com/article/202502/467212.htm

當前,技術正從傳統的大語言模型向推理模型和代理轉變。傳統的大語言模型,即多數免費人工智能聊天機器人所使用的模型,其訓練過程需要消耗龐大的電力和計算時間。然而,隨著技術的進步,我們正在迅速找到方法,在用戶調用這些模型時減少其運行所需的資源。與之不同,基于大型語言模型的推理模型,其實際運行過程消耗的計算和電力資源是傳統模型的數倍。

自Open于2024年9月發布其首款推理模型o1以來,人工智能公司紛紛加速推出能與之抗衡的系統。這其中包括 R1,它震撼了整個人工智能行業,并讓許多科技和能源企業的估值出現波動。上周,埃隆·馬斯克(Elon Musk)旗下人工智能初創公司x也推出了其推理模型Grok 3。

的推出之所以引發了一定程度的恐慌,是因為它證明了人工智能模型可以以更低的成本進行訓練,這可能會削減對數據中心和昂貴先進芯片的需求。然而,實際上推動了人工智能行業更堅定地邁向資源密集型的推理模型,這意味著計算基礎設施的需求依然十分強勁。

鑒于推理模型具備更強大的能力,它們可能很快成為人們使用人工智能執行多種任務時的默認方式。OpenAI首席執行官山姆·奧特曼(Sam Altman)曾表示,該公司人工智能模型的下一次重大升級將包含高級推理能力。

那么,為何推理模型及其相關產品(如“深度研究”工具和AI代理)需要如此多的算力資源?答案在于它們的工作原理。

英偉達人工智能產品管理副總裁卡里·布里斯基(Kari Briski)在最近一篇博客中解釋稱,人工智能推理模型消耗的算力資源,通常是傳統大語言模型的100倍以上,這是因為推理模型在“思維鏈”中需要長時間與自己對話,而這些推理過程用戶往往看不見。模型消耗的算力資源與其生成的詞匯量成正比,因此,如果推理模型生成的詞匯量是常規模型的100倍,那么它也將消耗相應的電力和算力資源。

當推理模型接入互聯網時,如谷歌、OpenAI和Perplexity的“深度研究”模型所做的那樣,資源消耗會更多。這些模型對算力資源的需求還只是開始。對此,谷歌、微軟和Meta計劃在2025年總共投入至少2150億美元用于資本支出,其中大部分將用于建設人工智能數據中心。這標志著他們的資本支出較去年增長了45%。

今年1月,隨著中國AI模型DeepSeek R1的發布,每token的算力成本(包括電力與硬件支出)似乎將迎來斷崖式下降。DeepSeek通過論文證明,其AI模型的訓練與部署效率遠超美國AI實驗室此前公開的方法。

表面上看,這似乎預示著人工智能未來對算力資源的需求將大幅降低,可能只有當前需求的十分之一,甚至更少。但隨著推理模型的問世,當它們回答查詢時對算力資源的需求可能會大幅增加。簡而言之,若基于DeepSeek技術的新型高效模型將AI算力需求削減至十分之一,而推理模型的普及使其使用需求激增100倍,未來整體算力需求仍將凈增10倍。

而這只是起點。隨著企業發現新型人工智能模型的能力更強,它們會越來越頻繁地調用這些模型,這使得對算力資源的需求從模型訓練轉向模型使用,即人工智能行業所稱的“推理”。

為其他公司提供人工智能算力資源的Baseten公司首席執行官圖欣·斯里瓦斯塔瓦(Tuhin Srivastava)表示,這種向推理需求的轉變已在進行中。他的客戶包括在應用程序和服務中使用人工智能的科技公司,如允許內容創作者通過轉錄編輯音頻和視頻的Descript,以及處理醫療記錄的初創公司PicnicHealth。

斯里瓦斯塔瓦稱,隨著客戶自身產品需求的快速增長,他們發現需要更多的人工智能處理能力。他補充道:“六個月前,我們幫助一位客戶將算力資源需求降低了60%,但僅僅三個月后,他們的算力消耗已反超原水平。”

OpenAI、谷歌和Meta等公司仍在競相訓練能力更強的人工智能模型。無論成本多高,它們的目標都是盡可能搶占尚處萌芽階段的人工智能市場。Fractional AI首席執行官克里斯·泰勒(Chris Taylor)表示:“我認為,尖端實驗室很可能需要持續投入巨額資金以推動前沿技術的發展。”他的公司,如同Baseten及蓬勃發展的人工智能生態系統中的許多其他企業,依賴這些尖端模型為客戶提供服務。

風險投資家、Theory Ventures創始人托馬斯·通古茲(Tomasz Tunguz)預測,未來幾年,新的創新和更多人工智能專用微芯片可能使得人工智能系統比今天更高效,或使終端系統效率提升千倍。投資者和大型科技公司押注的是,在未來十年內,由于推理模型的普及和快速采用,對人工智能模型的需求可能會急劇增長。

通古茲表示:“你每一次鍵盤敲擊,或對著麥克風說的每一個音節,每個操作節點都將由至少一個AI系統實時處理。”如果真是這樣,他補充道,人工智能市場的規模可能很快會比現在擴大1000倍。



關鍵詞: DeepSeek 人工智能 AI

評論


相關推薦

技術專區

關閉