垃圾分類不用愁 機器人來幫你
從上海,到北京,每個城市都在搞垃圾分類。
干垃圾、濕垃圾、有害垃圾,豬不能吃、豬能吃、豬吃了會死……你是不是還在為這些垃圾分別是什么而苦惱呢?
要是能自動給垃圾分類就好了。
Alphabet X,就是之前孵化了無人車的Google X,終于造出了垃圾分類機器人。
這些機器人可以把垃圾分類、把分錯類的垃圾放到正確的地方,還能在辦公室里游走撿垃圾。
比如,放錯地方的礦泉水瓶,機器人可以撿起來放到正確的地方去:
放錯地方的易拉罐,也要讓它和別的罐罐在一起:?
他們在Alphabet公司的辦公室測試后,發現這臺機器人可以顯著降低垃圾造成的污染,將本能回收利用卻被送去垃圾填埋場的垃圾占比從20%降到不到5%。
怎么做到的
想讓機器人學會垃圾分類,需要用到感知、移動和操作,借助計算機視覺技術進行感知以及幫助機器人前行的自動駕駛能力都是業界熟悉的,但如何學會在復雜環境中用“手”拉開柜子、打開抽屜、撿走垃圾則是必須要讓機器自行學會的操作。
因此,Alphabet X用到了三個方法來讓機器人學會靈活用“手”。
跟人類學習
第一種是跟人類學習,模仿人類的動作和做法。
這里就用到了Play-LMP算法,它在沒有特定數據集訓練的情況下,讓機器人跟人類的演示學習,最終實現平均成功率85.5%。
學出來的成績,大概是這樣的,左邊是任務要求,右邊是執行過程:
跟其他機器人學習
和其他機器人學習是通過無模型的強化學習,讓許多個機器人共享經驗。
具體的實現方式是這樣的:
讓機器人學習借助門把手開門這個技巧,一起學習的每個機器人都裝了一份神經網絡,并且他們每臺機器人都連到了一個中央服務器上。
每個機器人開始對著這個門和門把手琢磨,摸索著考慮怎么開。
這個過程中,每個機器人每一步的行動和結果都被傳輸到背后的中央服務器上,中央服務器里的神經網絡就開始借助這些傳輸來的經驗,迭代改進神經網絡。
這樣整個過程就好像司令部派了幾個士兵出去偵查,再把每個士兵送回來的線索匯總,形成整體的作戰思路,再告訴士兵們應該如何如何行動。
所以改進之后,機器人們就都學會了開門這項技能。
在云端學習
機器人要撿垃圾,必須學會靈活的使用自己的“手”來抓東西,要不斷的練習,有大量數據來訓練模型才可以。
現實世界里,機器人一天只能練習5000次抓取,數據量是遠遠不夠的。
而借助隨機到規范適應網絡(Randomized-to-Canonical Adaptation Networks,簡稱RCANs),在云中模擬訓練的數據就可以用在模型的實際訓練中,這樣機器人抓物體的成功率就提升到了70%。
之后,再結合5000次在現實世界抓取的數據,對模型進行微調,成功率就到了91%。
這個過程,相當于在真實世界抓了58萬次的結果,一下子省了99%的練習次數。
這樣,原來需要花3個月的時間來訓練機器人學習抓取,現在只要不到一天就可以了。
開發人員每天觀察機器人的垃圾分類工作,并標注正確和錯誤。AI程序每晚根據標注內容,自動模擬更新數千個模塊的數據。第二天,更新的結果會被重新整合到機器人軟件中,并再次開啟新的學習周期,日復一日地改善性能。
經數月學習,分類機器人的垃圾污染率從20%降至5%。垃圾污染率,即垃圾中混入不正確分類物料的比例。
機器人頭部的視覺傳感器可掃描環境并識別物體,內部設有多個攝像頭,可使頭部和雙臂獨立工作。機器人還會對掃描到的物品進行顏色編碼,并識別可能需要移動、清理或丟棄的物品。
評論