咨詢電話
021-80392549
美國(guó)加州大學(xué)伯克利分校、西蒙弗雷澤大學(xué)和喬治亞理工學(xué)院的聯(lián)合機(jī)器人團(tuán)隊(duì)最近創(chuàng)建了一種強(qiáng)化學(xué)習(xí)模型,能讓四足機(jī)器人以守門員的身份高效踢足球。在arXiv上預(yù)先發(fā)表的一篇論文中介紹的該模型,通過反復(fù)試驗(yàn)不斷提高了機(jī)器人的技能。
研究人員稱,通過讓四足機(jī)器人踢足球,可突破四足機(jī)器人的人工智能極限。守門員是一項(xiàng)有趣但具有挑戰(zhàn)性的任務(wù),它需要機(jī)器人對(duì)快速移動(dòng)的球作出反應(yīng),有時(shí)需在空中飛行,并在很短的時(shí)間內(nèi)(通常在一秒鐘內(nèi))動(dòng)態(tài)攔截它。
▲四足機(jī)器人攔截足球?qū)嶒?yàn)
新研究的主要目標(biāo)是創(chuàng)造一個(gè)四足機(jī)器人守門員,它可像人類守門員一樣在比賽中完善其技能。為此,研究人員開發(fā)了一種強(qiáng)化學(xué)習(xí)模型,讓該模型通過試錯(cuò)而不是固定的人工設(shè)計(jì)策略來訓(xùn)練機(jī)器人。
研究人員解釋說,機(jī)器人首先學(xué)習(xí)不同的運(yùn)動(dòng)控制策略來執(zhí)行不同的技能,例如躲避、前撲和跳躍,同時(shí)記錄機(jī)器人腳趾的隨機(jī)軌跡。基于這些控制策略,機(jī)器人接著學(xué)習(xí)高級(jí)規(guī)劃策略,在檢測(cè)到球的位置和自身狀態(tài)后,選擇最佳技能和動(dòng)作來攔截球。
經(jīng)過一系列模擬足球比賽,團(tuán)隊(duì)訓(xùn)練了強(qiáng)化學(xué)習(xí)模型。隨后他們將它學(xué)到的策略部署在麻省理工學(xué)院開發(fā)的四足機(jī)器人Mini Cheetah上,并在現(xiàn)實(shí)世界中測(cè)試了它的性能。
研究表明,強(qiáng)化學(xué)習(xí)框架可極大地提高M(jìn)ini Cheetah作為足球守門員的能力。在真實(shí)世界測(cè)試的40次隨機(jī)射門中,機(jī)器人撲救成功率達(dá)87.5%。
研究人員稱,此項(xiàng)工作最酷炫的是,四足機(jī)器人Mini Cheetah能執(zhí)行跳躍和前撲等非常敏捷的運(yùn)動(dòng)技能,以及快速和精確的操作技能,例如在一瞬間擺動(dòng)機(jī)器腿把球推開。這實(shí)際上突破了機(jī)器人領(lǐng)域“腿運(yùn)動(dòng)”的界限,表明腿也可以是一個(gè)機(jī)械手。
由于該模型可提高四足機(jī)器人的敏捷性和身體能力,因此這些機(jī)器人還可用于處理完全不同的任務(wù),例如搜索和救援任務(wù)。也許不久的將來,四足機(jī)器人也可與人類足球運(yùn)動(dòng)員同場(chǎng)競(jìng)技。
【總編輯圈點(diǎn)】
踢球和守門有多難?對(duì)某些球隊(duì)來說,確實(shí)很難,但對(duì)機(jī)器人來說,更不容易。其實(shí),大多數(shù)人類做起來流暢自如、渾然天成的運(yùn)動(dòng)動(dòng)作,對(duì)機(jī)器人來說都可能是技術(shù)上的重大障礙。這就是“算法”與“天然”之間的鴻溝。現(xiàn)在,工程師們嘗試用機(jī)器學(xué)習(xí)跨越這道鴻溝,不是預(yù)先編好程序,而是讓人工智能在練習(xí)和試錯(cuò)中,逐漸掌握動(dòng)作。最終,連機(jī)器人都成了不錯(cuò)的守門員。