亞馬遜年終王炸!兩大自研AI芯片性能飆升,推AI助手硬杠微軟,聯手老黃造最強超算
AWS最強自研訓練芯片炸場,還有新一代服務器CPU。
作者 | 芯東西編輯部
芯東西11月28日美國拉斯維加斯報道,北京時間11月29日凌晨,全球第一大公有云巨頭AWS(亞馬遜云科技)扔出了其生成式AI年終“王炸”。搖滾樂開場,AWS的CEO亞當·塞利普斯基(Adam Selipsky)在一陣掌聲中登上re:Invent舞臺。
距離微軟和OpenAI聯盟的GPT-4新品“轟炸”過去還不到一個月,AWS緊接著放出了新的大招,從芯片、大模型平臺、AI應用、生態合作等多個方面秀出“肌肉”:1、推出第四代自研服務器CPU芯片AWS Graviton4,相比三代處理速度快30%,能將處理大型Java應用的速度提升45%。2、推出為生成式AI和機器學習訓練設計的云端AI芯片AWS Trainium2,性能比上一代芯片提高到4倍,可提供65ExaFlops超算性能。3、英偉達創始人兼CEO黃仁勛到場,宣布英偉達與AWS達成戰略合作,針對生成式AI推出全新超級計算基礎設施、軟件及服務。4、推出生成式AI助手Amazon Q,支持聊天、生成內容、編程、插件及定制開發,硬杠微軟Copilot。
▲現場展區展出了Amazon Q免費體驗的申請二維碼入口
5、數據分析平臺Amazon QuickSight、呼叫中心服務Amazon Connect等應用接入Amazon Q,具備生成式AI能力。6、Amazon Bedrock大模型平臺三大升級:支持微調、知識庫RAG(檢索增強生成)和持續預訓練,全面推出Amazon Bedrock Agent、安全產品Guardrails for Amazon Bedrock預覽版。7、S3對象存儲服務更新,推出新的高性能、低延遲層S3存儲類別Amazon S3 Express One Zone,比Amazon S3標準版快10倍,計算成本降低60%。8、推出4項Zero-ETL(提取、轉換、加載)集成功能,使跨數據存儲的數據訪問和分析更快、更容易。9、推出由生成式AI驅動的Amazon DataZone智能推薦功能,可生成數據資產及其模式的詳細說明。10、擴大與OpenAI競爭對手Anthropic的合作,Claude大模型的早期訪問、自動定制和微調功能優先提供給AWS客戶。11、全球最大藥企輝瑞擴大與AWS的合作關系,輝瑞利用生成式AI每年減少了7.5億至10億美元的成本。今年4月,AWS推出了覆蓋IaaS(基礎設施即服務)、PaaS(平臺即服務)、SaaS(軟件即服務)的生成式AI“全家桶”,空降全球AI大模型競賽戰場。(《亞馬遜AIGC全家桶推出!迎戰微軟谷歌,云巨頭們殺瘋了》)彼時,微軟正憑借接入GPT-4的升級產品族風頭正盛。AWS則扔出大模型開發平臺Amazon Bedrock、計算實例EC2 Trn1n實例和EC2 Inf2及AI編程伴侶CodeWhisperer等產品,亮出亞馬遜殺入生成式AI的第一槍。今天,AWS全面披露了亞馬遜生成式AI技術堆棧:底層基礎架構層+中間基礎模型構建工具層+上層基礎模型AI應用層,版圖逐漸完整。
01.新一代服務器CPU、AI訓練芯片來了!
支持數萬億參數大模型訓練
會上,AWS CEO塞利普斯基宣布推出第四代自研服務器CPU芯片AWS Graviton4、為生成式AI和機器學習訓練設計的云端AI芯片AWS Trainium2。此前已有超過5萬個客戶使用Graviton。最新推出的Graviton4是AWS迄今最高能效的自研數據中心處理器,基于Arm架構,相比Graviton3,處理速度快30%,內核增加50%,內存帶寬增加了75%,能將數據庫應用提速40%,將處理大型Java應用的速度提升45%。AWS客戶現可開始測試該處理器,由Graviton4支持的R8g實例已推出預覽版。
Trainium2芯片為擁有數千億甚至數萬億個參數的基礎模型訓練做了優化,性能比上一代芯片提高到4倍,內存容量提高到3倍,能效提高到2倍。OpenAI的競爭對手、明星生成式AI獨角獸Anthropic計劃用Trainium2芯片構建模型。
Trainium2將在Amazon EC2 Trn2實例中提供,單個實例中包含16個Trainium芯片,Trn2實例可幫助在下一代EC2 UltraCluster中擴展到多達10萬個Trainium2芯片,通過搭配AWS Elastic Fabric Adapter (EFA) 網絡互連,提供65ExaFlops超算級性能。基于此,客戶只用幾周就能訓練出有3000億個參數的大模型。AWS Neuron SDK被用于優化跑在AWS自研訓練芯片Trainium和推理芯片Inferentia的機器學習任務,支持主流AI框架。
AWS與英偉達宣布擴大戰略合作。英偉達創始人兼CEO黃仁勛來到re:Invent大會現場,宣布AWS將支持英偉達最新推出的H200 GPU,并將托管一個特殊的計算集群供英偉達使用。
AWS是在云端配備英偉達GH200 Grace Hopper超級芯片的首家云大廠,雙方聯手推出首款結合Grace Hopper超級芯片與亞馬遜UltraCluster擴展功能的云AI超級計算機,以及首次在AWS上提供首個配置GH200 NVL32的英偉達DGX Cloud AI訓練即服務(能加速訓練參數量超1萬億的生成式AI與大模型)。英偉達與AWS合作構建的AI超級計算機Project Ceiba便部署在亞馬遜云科技上,配備GH200 NVL32與Amazon EFA互連技術,包括16384顆GH200超級芯片,能提供65ExaFlops AI算力。此外,AWS宣布其S3對象存儲服務推出重大更新:一種新的高性能、低延遲層S3存儲類別Amazon S3 Express One Zone,旨在為延遲敏感的應用提供個位數、毫秒級的每秒數十萬次數據訪問。
Amazon S3 Express One Zone的數據訪問速度比Amazon S3標準版快10倍,請求成本降低50%,計算成本降低60%。以上從計算到存儲新品的發布,主要是AWS的底層基礎架構層的能力更新,在其生成式AI技術堆棧中的位置如下圖所示。
02.Amazon Bedrock全家桶升級,
聯手OpenAI最強競對反擊微軟
今日,AWS對Amazon Bedrock生成式AI平臺完成了能力新升級。Amazon Bedrock平臺是亞馬遜4月推出、9月全面開放的大模型開發平臺,支持用戶調用來自亞馬遜自己的泰坦(Titan)模型,以及AI21 Labs、Anthropic、Stability AI等第三方的多樣化模型進行調用和定制化開發。
1、Amazon Bedrock推出三個客制化功能塞利普斯基宣布,托管服務Amazon Bedrock今天推出三個客制化自定義功能:微調(Fine-tuning)、知識庫的RAG(檢索增強生成)、持續預訓練。
通過微調,用戶可以提供私有的特定任務標注訓練數據集來提高模型的準確性,進一步使基礎模型(FM)專業化。Amazon Bedrock現在支持對Meta Llama 2、Cohere Command Light和Amazon Titan模型進行微調。
Amazon Bedrock知識庫于今年9月推出預覽版,今日起全面開放。通過知識庫,用戶可以安全地將Amazon Bedrock中的基礎模型與公司的數據連接起來,并進行檢索增強生成,訪問附加數據以生成更相關、更具體和更準確的響應,而無需不斷重新訓練基礎模型。此外,從知識庫中檢索到的所有信息都會注明來源,以提高透明度并減少幻覺。
持續預訓練可用于Amazon Titan Text模型的公開預覽版,包括Titan Text Express和Titan Text Lite。預訓練完成后,用戶可以收到唯一的模型ID,定制模型將由Amazon Bedrock再次存儲。
2、全面推出Agents for Amazon BedrockAWS曾在今年7月推出Agents for Amazon Bedrock預覽版,今天,塞利普斯基宣布其全面上市。
借助Agents for Amazon Bedrock,用戶可以通過簡單的幾個步驟創建和部署完全托管式的Agent,通過動態調用API來執行復雜的業務任務。Amazon Bedrock可以根據用戶提供的自然語言指令,如“你是專門處理未結理賠的保險代理人”,完成任務所需的API架構,并使用來自知識庫的私有數據來源詳細信息創建提示語。
Agents for Amazon Bedrock可將用戶請求的任務分解為較小的子任務,從而做出周密安排。例如,對于“向所有具有待處理文件的保單持有人發送提醒”,它會將任務分解成:獲取特定時間段的理賠,確定所需的文書工作,發送提醒。Agent會確定正確的任務順序,并處理中途出現的任何錯誤狀況。
3、推出Guardrails for Amazon Bedrock預覽版AWS推出Guardrails for Amazon Bedrock預覽版,根據應用程序需求和AI政策定制保障措施。Guardrails可以跨基礎模型,為所有應用程序提供一致的AI安全級別,阻止生成式AI應用程序中不需要的話題,根據AI政策過濾有害內容等。
據稱,Amazon Bedrock平臺目前在全球各行業中已有超10000個客戶,包括阿迪達斯、納斯達克、雷克薩斯等眾多知名企業。
今日,AWS宣布擴大與OpenAI強力競對Anthropic的合作。Bedrock客戶將擁有其他云所沒有的Anthropic旗下Claude大模型的早期訪問、自動定制和微調功能的特供功能。Anthropic由前OpenAI工程師于2021年創立,于近期推出了其聊天機器人Claude的2.1版本,支持20萬Tokens的超長上下文。Anthropic的CEO兼聯合創始人達里奧·阿莫迪(Dario Amodei)親臨了現場,他談道,Anthropic和AWS之間合作由三個部分組成:計算、客戶支持和硬件優化。他們的目標是為客戶提供定制模型、專有數據和獨特的微調功能,目前已基于AWS的服務在生物醫學、法律和金融行業有成功落地案例。與Anthropic擴大合作無疑是AWS反擊微軟OpenAI聯盟的一記重拳。9月25日,亞馬遜與Anthropic宣布達成戰略合作,亞馬遜稱將向Anthropic投資至多40億美元,并擁有該公司的少數股權。
全球最大藥企輝瑞的首席數字與技術官莉迪亞·豐塞卡(Lidia Fonseca)也來到現場,并宣布擴大與AWS的合作關系。豐塞卡稱,輝瑞于2019年開始,通過整合來自多個實驗室和儀器的數據來組織其數字基礎設施,其與AWS的合作始于新冠疫情時期,“如果沒有與AWS的密切關系,我們不可能實現如此巨大的影響力”。她談道,公司在42周內遷移了12000個應用程序和8000臺服務器,退出三個數據中心轉而上云,并減少了4700噸二氧化碳排放——相當于1000個家庭一年的能源使用量,這為輝瑞每年節省了4700萬美元。
這使得輝瑞在生產中的云計算使用率從10%提升到80%,輝瑞還計劃在其癌癥生產線上繼續依賴云計算。此外,使用云服務后,輝瑞的生產效率也得到提升。豐塞卡稱,其疫苗產量提高了20%,即每批次多生產約20000支疫苗,公司的疫苗年度產量從以往的2.2億支增加到2022年的40億支。豐塞卡還提到,利用生成式AI,輝瑞每年減少了7.5億至10億美元的成本。
03.硬剛微軟Copilot!AI助手Amazon Q亮相,三步完成定制
今日,AWS推出了一款新型生成式AI助手Amazon Q。它支持用戶輸入問題,從而進行聊天、生成內容及插件聯動。
AWS的客戶可以選用Amazon Q服務,通過提問的方式快速解答疑惑,有望節省大量的架構和故障排除時間,并優化工作負載。
對于開發者來說,Amazon Q嵌入了AI編程助手CodeWhisperer,將利用其對AWS的深入了解和對代碼庫的理解,幫助開發者提高開發效率。用戶只需編寫一個提示符,Amazon Q將會給出一個初版草案,然后用戶可以用自然語言對話進行協作迭代。
這一功能目前在Amazon Code Catalyst可用,且不久后將向全部客戶開放。AWS稱用戶目前還無法從其他云廠商那獲取這一能力。Amazon Q的使用步驟非常簡單,大致分為三步:第一步,用戶可以通過連接結合自己的組織自定義Amazon Q,它目前支持Salesforce、微軟、谷歌、Slack等40多家公司的商業應用程序開箱即用。
第二步,一旦連接,Amazon Q就會開始索引用戶的所有數據和內容,學習有關業務的所有知識。
第三步,用戶幾乎不需要什么操作,只需在瀏覽器中打開完全定制的Amazon Q。這一智能助手知道用戶身份角色,能針對詳細問題給出量身定制的答案,并給出引用參考來源。
Amazon Q注重隱私和安全,其宣稱不會在外部共享用戶數據,也不會使用它來改進基礎模型。此外,Amazon Q還通過一組可配置的插件支持用戶采取行動。
目前,亞馬遜旗下的數據分析平臺Amazon QuickSight已內置了Amazon Q。業務分析師稱,通過簡單地告知Amazon Q他們想要可視化內容,就可以創建儀表板和報告,耗時從幾小時縮短到了幾分鐘。QuickSight中的Amazon Q功能自今天起提供預覽版。亞馬遜的呼叫中心服務Amazon Connect也接入了Amazon Q。在傳統的聯絡中心,用戶往往會花費大量時間收集客戶信息以了解他們的問題,然后花更多的時間尋找正確答案。但現在,Amazon Connect已通過機器學習、轉錄和分析使這變得更加容易,支持Agent在Amazon Connect中與Amazon Q聊天,幫助他們快速響應客戶問題。
亞馬遜稱,這些應用是Amazon Q落地的一個開始,亞馬遜生成式AI的技術堆棧全景圖如下所示。
04.數據庫推出4項Zero-ETL集成,
生成式AI自動化組織數據
要實現以上所有的功能,背后的數據尤為關鍵。為此,AWS宣布推出4項Zero-ETL(提取、轉換、加載)集成功能:Amazon Aurora PostgreSQL、Amazon DynamoDB、Amazon RDS for MySQL與Amazon Redshift數據庫的集成,以及Amazon DynamoDB與Amazon OpenSearch服務的Zero-ETL集成。新的Amazon Aurora PostgreSQL、Amazon DynamoDB、Amazon RDS for MySQL功能與Amazon Redshift數據庫的集成使用戶可以更輕松地連接和分析來自Amazon Redshift中多個關系型或非關系型數據庫中的數據,以進行綜合分析。
Amazon DynamoDB與Amazon OpenSearch服務的Zero-ETL集成可實現幾乎實時的全文和矢量搜索,從而獲得跨多個應用的整體洞察力,在提高運營效率的同時降低成本。
AWS還宣布推出由生成式AI驅動的Amazon DataZone智能推薦功能,旨在大幅減少為組織數據提供上下文所需的時間。
該功能由Amazon Bedrock的模型提供支持,可生成數據資產及其模式的詳細說明,并提出分析用例。只需單擊一下,即可生成全面的業務上下文。
05.結語:對戰微軟OpenAI聯盟,
亞馬遜如何后發制人?
微軟和OpenAI聯盟風頭正盛,全球第一大云巨頭也在年底面向AI再出一記重拳。雖然亞馬遜對這波生成式反應相對慢一些,但其在IaaS、PaaS、MaaS、SaaS的布局卻一點不少,尤其在底層硬件、生態聚合方面表現突出。當下,美國三大公有云服務巨頭AWS、微軟Azure、谷歌云都已將生成式AI置于重要戰略位置,試圖為增長疲軟的云業務找到新的成長曲線。AWS的打法有所區別,不是對AI公司及消費級產品的重大投資,而是建立平臺匯聚眾多中小企業的模型,側重為大模型及終端客戶提供底層云基座,有望通過其海量客戶及底座規模實現后發制人。
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。