人工智能專題報告:生成式AI,人工智能新范式,重新定義生產力
AI:從判別決策到創造生成
AI模型可大致分為決策式/分析式AI(Discriminant/Analytical AI)和生成式AI (Generative AI)兩類。決策式AI:學習數據中的條件概率分布,根據已有數據進行分析、判斷、預測,主要應用模型有用于推薦系 統和風控系統的輔助決策、用于自動駕駛和機器人的決策智能體。 生成式AI:學習數據中的聯合概率分布,并非簡單分析已有數據而是學習歸納已有數據后進行演技創造,基 于歷史進行模仿式、縫合式創作,生成了全新的內容,也能解決判別問題。
決策式AI:推薦系統、圖像識別等已創造巨大市場
2016年,人工智能技術全面爆發,決策式AI開始大規模應用,包括推薦系統、計算機視覺、自然語言處理等。 全球人工智能市場規模從2016年的約600億美元發展到2021年的近3000億美元,在推薦系統、計算機視覺、自 然語言處理等技術加持下,亞馬遜、字節、商湯、特斯拉等公司快速發展。 我們認為,生成式AI經過前期技術積累進入爆發期,隨著技術與應用的進一步成熟,后續市場空間更為廣闊。
決策式AI應用:推薦系統助力電商、視頻等行業快速發展
電商推薦:深度挖掘用戶和物品的關聯關系,將商品、店鋪精準推送給用戶。2003年,亞馬遜將協同過濾推薦 算法應用到電商行業,憑借推薦商品與用戶需求精準匹配、大幅降低用戶檢索用時,推薦算法在電商交易中心逐 漸成為資源配置的核心。 推薦系統顯著提升電商平臺銷售額。2006年,據VentureBeat,亞馬遜的個性化推薦系統為其貢獻了35%以 上的銷售額;2015年,京東基于大數據個性化推薦算法的訂單占到總訂單的10%。 新聞、音樂、視頻等推薦:分析用戶長期興趣和短期興趣,根據興趣標簽將內容實時推送給用戶。推薦算法通 過對用戶觀看、停留、點贊等行為的實時分析,精準刻畫用戶畫像,將用戶可能感興趣的內容推薦給用戶,降低 人工運營規則的攝入,顯著提高了用戶粘性。
決策式AI應用:圖像識別推動自動駕駛市場快速增長
自動駕駛:AI智能分析、識別路況,滲透率不斷提升。借助決策式AI,自動駕駛汽車可分析判別各種路況,并可 對多種物體進行識別與跟蹤,從而提高行車的安全性,例如行人、空曠行駛空間、地上標注、紅綠燈、車輛等。 目前自動駕駛市場規模快速增長,據Research And Markets,2021年全球無人駕駛汽車的市場規模約273億美 元,2026年全球無人駕駛汽車市場規模將達到594億美元,年復合增長率為16.84%。
帶動產業鏈發展,多環節均有高市值上市公司及高估值公司。判別式AI為自動駕駛汽車提供核心技術支持,自動 駕駛汽車的銷售則帶動整個相關產業鏈的發展,如車用無線通信技術V2X、高精度地圖、激光雷達、芯片、 ADAS駕駛輔助系統、智能車解決方案等。多個產業鏈環節均有高估值、大市值公司誕生,例如蔚來汽車(造 車)、商湯科技(激光雷達、V2X、ADAS等)、Momenta(高精度地圖)等。
生成式AI:范式升級,應用多元
生成式AI VS Web 3.0 :不僅是web3.0的生產工具,更是人工智能的新范式
生成式AI可以作為Web3.0的生產工具,但Web3.0中的應用僅是其應用的冰山一角。 Web3.0圍繞去中心化的理念展開,結合區塊鏈、智能合約、加密貨幣等技術,核心是產生的數據由用戶擁有, 能夠改變用戶數據及原創內容等均由互聯網中心化實體控制的現狀,在創作者經濟中取得更好的平衡從而提 升用戶創作內容的積極性。生成式AI在內容領域的應用能夠滿足用戶不斷提升的創作需求,但這僅是其應用的 冰山一角。 生成式AI在廣大垂直領域的應用帶來的是AI用途的結構性改變以及生產力的進一步提高,未來可能創造巨大 的市場價值。
生成式AI VS Web 3.0 :不追求生產關系的重塑,但將大幅度提升和創造生產力
創造是生成式AI的核心,本質是對生產力的大幅度提升和創造。生成式AI通過從數據中學習要素,進而生成 全新的、原創的內容或產品,不僅能夠實現傳統AI的分析、判斷、決策功能,還能夠實現傳統AI力所不及的創 造性功能。生成式AI已催生了營銷、設計、建筑和內容領域的創造性工作,并開始在生命科學、醫療、制造、 材料科學、媒體、娛樂、汽車、航空航天進行初步應用,為各個領域帶來巨大的生產力提升。
生成式AI將促進生產關系高效發展,而不是像Web3.0重塑生產關系。Web3.0通過底層的分布式與去中心化、 密碼學的應用、加密貨幣的結算方式,為集體協作、分工、收益提供了更好的結算方式,去中心化自治組織 (Decentralized Autonomous Organization,DAO)將是常見的組織形態,打破了原有的生產關系。生成式 AI不是打破傳統的生產關系,而是通過提高生產力促進現有生產關系高效發展。
資本:海外一級投資涌入
多家生成式AI公司進入Madrona、高盛、微軟、亞馬遜網絡服務和 PitchBook聯合發布的2022年智能應用前40 名榜單(Intelligent Applications 40,IA40)。IA40招募了來自40多家頂級風險投資和投資公司的50多名風險 投資人,提名并投票選出塑造智能應用未來的頂級公司,這些公司自成立以來募資超160億美元,今年募資超過 50億美元,其中包括Runway、Jasper、Copy.ai在內的14家生成式AI相關公司,占比達35%。
技術:模型迭代
變分自編碼器(Variational Autoencoder,VAE):2013年由Diederik P. Kingma和Max Welling提出,編碼器 將原始高維輸入轉換為對潛在空間的概率分布描述,從中采樣輸入解碼器,得到新生成的結果,可用于圖像生成、 語音合成等,生成的圖像較為模糊。
生成式對抗網絡(Generative Adversarial Nets,GAN):2014年由Ian J. Goodfellow等人提出,模型由生成 器和判別器組成,以圖像生成為例,生成器輸入訓練噪聲后生成圖像,判別器用來判斷圖像是真實的還是由生成 器生成的,隨著訓練不斷進行,生成器水平提升,判別器不再分辨圖像真偽,固定生成器對判別器進行馴良,直 到判別器能夠分辨圖像真偽,固定判別器再次訓練生成器,不斷循環,獲得生成效果好的生成器。GAN模型能夠 生成圖像、3D模型甚至視頻,但對輸出結果控制較弱,易產生隨機結果。
生成式AI應用:內容制作,從輔助人到“替代”人
生成式AI應用:娛樂媒體內容制作
當前階段生成式AI最常見的應用場景為娛樂媒體內容的輔助生產。以文字續寫或糾錯、文字轉語音、文字生成語 音、圖像智能編輯、視頻智能剪輯等方式替代既有創意產生后的專業性機械勞動,同時通過內容生成滿足用戶的 娛樂需求或者為其提供創作靈感。
隨著生成式AI的不斷成熟,部分專業內容生產者將被替代。數據、算力的進一步提升將帶來具有更強生成效果的 AI,能夠根據用戶需求生成個性化定制內容終稿,并且AI生成內容達到專業內容生產者水平且具有獨特新穎的創 意,從而替代部分文字作者、翻譯人員、插畫創作者、配音人員、音樂制作人、視頻編輯人員等等。
AIGC:生成式AI在娛樂媒體領域的應用
AIGC(AI-Generated Content)指利用人工智能技術自動生成的內容,是繼專業生成內容(PGC)和用戶生成 內容(UGC)之后一種新型生成內容的方式。國際上被稱為人工智能合成媒體(AI-generated Media或Synthetic media),是通過人工智能算法對數據或媒體進行生產、操作和修改的統稱。
AI繪畫作品出圈、一級投資活躍,2022年AIGC爆發式發展。2022年8月,在美國科羅拉多州舉辦的新興數字藝 術家競賽中,參賽者提交AIGC繪畫作品《太空歌劇院》獲得了此次比賽“數字藝術/數字修飾照片”類別一等獎, 而參賽者沒有繪畫基礎,通過AI繪圖軟件MidJourney耗時80個小時創作了該作品。AI繪畫技術發展快速,從年初 的技藝生疏到目前能夠生成專業級別的圖像僅過去幾個月的時間,目前國外已有Stable Diffusion Midjourney等多 個成熟的AIGC平臺。其中技術領先的AI公司Open AI當前估值或達290億美元,Stable Diffusion背后的Stability AI 估值也達到10億美元。
文本生成:對話機器人、新聞稿撰寫廣泛應用
文本生成是生成式AI最早應用的領域之一,已經在對話機器人、內容續寫、新聞稿撰寫、詩歌小說創作等領域具 有廣泛的應用。 對話機器人:包括問答型機器人、閑聊型機器人、任務型機器人、知識圖譜型機器人、多輪對話機器人,在智能 客服場景中能夠顯著降低企業人力成本。 新聞稿撰寫:在全球范圍具有廣泛的應用,很多新聞機構使用AI生成稿件,尤其是體育、天氣、股市交易變動、 公司業績報道等結構性新聞報道。自然語言生成公司Automated Insights僅在2014年就產生了10億篇新聞文章, 每秒可撰寫多達2000篇新聞報道,用戶包括雅虎、美聯社等。
音頻生成:語音生成廣泛應用,大廠均有布局
自動語音生成:將文本轉化為語音,廣泛應用于新聞閱讀、有聲書、出行導航、通知播報、視頻配音等領域。目 前,谷歌、微軟、亞馬遜、騰訊、阿里、百度、科大訊飛等均推出了相關平臺,支持在不同場景下將文本轉化為 流暢逼真的語音。 谷歌Text-to-Speech:谷歌基于DeepMind 的語音合成專業技術打造,支持40多種語言、220多種語音和參數 調整,并且支持用戶上傳自己錄制的音頻來訓練自定義語音模型。 科大訊飛在線語音合成:提供了100+發音人,支持多語種、多方言和中英混合,可靈活配置音頻參數,只需 用戶上傳15分鐘錄音便能夠生成專屬聲音。
生成式AI應用:多行業垂直應用
代碼生成:大廠廣泛布局,極大提升編程效率
代碼生成:生成式AI將自然語言翻譯成代碼,極大提升了計算機編程的智能化、自動化,使得程序員能夠在相 同時間內編寫更多的代碼,同時提高debug的效率。目前,OpenAI、微軟、谷歌、亞馬遜、華為等均在AI代碼 生成領域有所布局。
Codex:2021年8月由OpenAI基于GPT-3推出,精通Python、JavaScript、Go、Perl、PHP、Ruby、Swift、 TypeScript、SQL甚至 Shell 等十幾種編程語言,其中最為擅長Python。具有將注釋變成代碼、為代碼生成 注釋、代碼自動補全、查找可用庫或API、代碼檢查、代碼重構、代碼語言轉換等功能,是Github Copilot的 底層支持,目前免費開放,需要通過API或 Playground 訪問。
代碼生成:ChatGPT調試代碼表現優于傳統搜索引擎
ChatGPT:2022年11月由OpenAI推出,是一個對話語言模型,但在代碼生成領域具有優秀的表現,能夠將 自然語言轉為代碼、找出代碼的問題并給出修改意見,且支持用戶和AI連續對話,在調試代碼過程中的使用 體驗優于傳統的搜索引擎。
代碼生成:Github Copilot每年節約開發人員成本或達百億美元
Github Copilot:2021年6月由微軟旗下GitHub推出,由OpenAI Codex 提供支持,可以集成到Neovim, JetBrains IDEs, Visual Studio, and Visual Studio Code等編輯器中,支持 Python、JavaScript、TypeScript、 Java、Ruby 和 Go 等編程語言。可以根據上下文自動寫代碼,包括文檔字符串、注釋、函數名稱、代碼, 只要用戶給出提示,就可以寫出完整的函數。
Github Copilot每年節約開發人員成本或達百億美元。在2021年6月-2022年6月中,超過120萬開發者注冊 使用 GitHub Copilot 預覽版,在啟用的文件中,有近 40% 的代碼是由 Copilot 編寫的。以使用人數120萬、 開發人員時薪20-200美元,Copilot每年可節省開發成本48-1920億美元。
海內外發展:多家科技巨頭、初創公司積極布局
創業公司嶄露頭角,科技巨頭積極布局
國外多家生成式AI創業公司獲得大筆融資且擁有較高估值。主要包括OpenAI、 Stability AI、 Midjourney、 Jasper等,其中OpenAI技術積累最強,發布了多款生成式AI底層算法,估值或達290億美元。 國內外科技巨頭在生成式AI領域多有布局。國內公司百度、騰訊、阿里、字節、網易等及國外公司谷歌、Meta、 微軟等均推出了生成式AI的應用產品,其中谷歌通過谷歌大腦、旗下Deepmind布局最為豐富。
Open AI:提供底層算法,開發水平強、算法通用性高的AI技術公司
OpenAI是一家大型人工智能研究公司。公司AI開發水平處于第一梯隊,研發人員包括世界著名AI專家,2022年 6月,量子計算專家、ACM計算獎得主Scott Aaronson宣布將加盟公司。公司以實現安全的通用人工智能(AGI) 為核心宗旨。 2015年成立之初,公司為一家非營利性研究機構,2019年接受微軟10億美元的注資,由非營利性機構轉為盈利 性公司。公司的投資者包括微軟 、Reid Hoffman’s charitable foundation和 Khosla Ventures。The Information稱公司2021年估值已經達200億美元。 據Semafor報道,微軟正商談以 290 億美元估值,向 OpenAI 投資 100 億美元,這筆投資還將引入其他風投公司。 2022年公司收入約2500萬-4000萬美元,以290億美元的估值測算,市銷率達725-1160倍。
評論