- 2月10日,豆包大模型團隊聯合北京交通大學、中國科學技術大學,發布了視頻生成模型——VideoWorld,并且已開源代碼與模型。與Sora、DALL-E等主流多模態模型不同,VideoWorld開辟了新的路徑,打破對語言模型的依賴,實現僅靠“視覺信息”認知世界。就像幼兒能在不依賴語言的情況下理解真實世界一樣,VideoWorld通過瀏覽視頻數據,讓機器掌握推理、規劃和決策等復雜能力。在僅有300M參數量時,它就已展現出可觀的性能,達到專業5段9x9圍棋水平,還能在多種環境中執行機器人任務。在模型構建方面,
- 關鍵字:
VideoWorld 模型 機器視覺
videoworld介紹
您好,目前還沒有人創建詞條videoworld!
歡迎您創建該詞條,闡述對videoworld的理解,并與今后在此搜索videoworld的朋友們分享。
創建詞條
關于我們 -
廣告服務 -
企業會員服務 -
網站地圖 -
聯系我們 -
征稿 -
友情鏈接 -
手機EEPW
Copyright ?2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《電子產品世界》雜志社 版權所有 北京東曉國際技術信息咨詢有限公司

京ICP備12027778號-2 北京市公安局備案:1101082052 京公網安備11010802012473