DeepMind為推進機器人研究收購 MuJoCo ,并將其對所有人免費開放
機器人研究人員很多都會選擇物理模擬引擎 MuJoCo(Multi-Joint Dynamics with Contact)上的接觸模型來進行模擬。 而近日 MuJoCo 已被人工智能公司 DeepMind 所收購。DeepMind 表示將會使 MuJoCo 成為對所有人免費的開源軟件。 能夠免費使用 MuJoCo,眾多機器人開發者對此表示歡喜之極。畢竟之前 MuJoCo 的使用費用并不便宜。 我們先通過幾個示例,初步了解利用 MuJoCo 能夠做什么,并體驗下它對現實中物理運動的模擬到底有多真實。 首先是倒立陀螺在平面之上的翻轉運動。 再比如牛頓擺(Newton’s Cradle)運動。 可以看到,MuJoCo 能夠精確地捕捉到牛頓擺中的脈沖傳播。 MuJoCo 對在失重下的運動模擬也極其真實。 此外,MuJoCo 還能對人或者動物的復雜生物肌肉進行模擬。 圖 | 模擬的人腿擺動(來源:DeepMind)
很多模擬器起初是為游戲、電影等設計,準確性并不是它們的優先考慮事項。對比其他模擬器易失真的情況,MuJoCo 能夠有效捕捉接觸物體的特征,從而準確模擬現實世界中真實的物理運動。同時 MuJoCo 也很靈活,可通過調整參數模擬更廣范圍的接觸現象。 而且,MuJoCo 是一個全功能模擬器,不僅能夠擴展計算密集型技術,還能在物理機器人部署之前測試和驗證控制方案、交互式科學可視化、虛擬環境等。 據了解,一開始 MuJoCo 是被用在華盛頓大學運動控制實驗室,在 2015 年才作為付費商品推出。其在機器人和生物力學,還有動畫等領域都有著廣泛應用。 然而,盡管 MuJoCo 足夠優秀,但并不能說沒有缺點,或者說沒有模擬器是完美無缺的。 現有模擬器,包括 MuJoCo,都存在一些共性問題,比如,模擬環境并不能完全等同物理現實,與真正的真實仍有差距。模擬計算需要專用的硬件,成本較高。而且,不管多優秀的模擬器,都會包含“非決定性”元素,這使得測試無法進行復制。 這些問題是模擬研究需要面臨的挑戰。有些專家認為,在要解決的問題和需要的資源方面,開發具有百分之百準確性的模擬器也許和開發機器人本身同樣多。 回到本次收購的問題上。對于 DeepMind 選擇收購 MuJoCo 的原因,也許我們可以從發表在PNAS 上的一篇論文中窺見一二。 相關論文以《關于在機器人中使用模擬:機遇、挑戰和前進的建議》(On the use of simulation in robotics: Opportunities, challenges, and suggestions for moving forward)為題發表在 PNAS 上,第一作者為賓夕法尼亞大學博士后研究員崔熙順(HeeSun Choi)[1]。
該論文中提到,“經過良好驗證的計算機模擬可以提供一個虛擬的試驗場,在許多情況下,它有助于安全、快速、低成本地理解未來的機器人如何設計和控制,以便安全操作和提高性能。” 論文進一步討論了模擬如何幫助機器人研發: 一、迅速和低成本地生成大量機器學習培訓數據。 機器學習在定義控制策略中的激增,以及相關對大量培訓數據的需求,為機器人模擬的使用提供了主要動力。經過驗證的模擬平臺成為開發系統的理想試驗場,既能從錯誤中吸取教訓,又能進行驗證。 二、加快工程設計周期,降低成本。 機器人的設計有兩個較為耗時的階段,即機械設計和控制策略設計。而在模擬中執行迭代循環,可以縮短與設計過程相關的時間。 三、提供加速、安全、完全控制的虛擬測試和驗證環境。 自主系統驗證的方法還處于起步階段。驗證和“調試”在線學習的自主機器人系統的方法基本上不存在。在此背景下,模擬在對協作式多機器人系統提供見解方面可以發揮重要作用。 四、促進更智能機器人的發展和人與機器人相互作用的理解。 模擬可以成為智能機器人進化下一階段的催化劑,正如道德概念(設定規則)、經驗和預測行為后果的能力塑造了人類的決策過程一樣。而模擬機器人與人之間的相互作用的能力可以減少危險工作環境中的個人風險。 對于 MuJoCo 模擬的作用,DeepMind 非常認可,其表示,“我們的機器人團隊一直使用 MuJoCo 作為各種項目的模擬平臺。MuJoCo 緊密地遵循了支配我們世界的方程式。” 目前,DeepMind 正在為 MuJoCo 完全開源做準備,并向“對突破現實物理模擬的界限感到興奮”的研究人員們發出邀請,希望與他們一同將 MuJoCo 打造成一個社區驅動的、具有頂尖功能的項目。
-End- 參考: [1] HeeSun Choi et al. PNAS 5, (2021)https://doi.org/10.1073/pnas.1907856118
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。