欧美色在线视频播放 视频,国产精品亚洲精品日韩已方,日本特级婬片中文免费看,亚洲 另类 在线 欧美 制服

<td id="8pdsg"><strong id="8pdsg"></strong></td>
<mark id="8pdsg"><menu id="8pdsg"><acronym id="8pdsg"></acronym></menu></mark>
<noscript id="8pdsg"><progress id="8pdsg"></progress></noscript>

    首頁 >> 人工智能 >

    在現(xiàn)實世界中安全地學(xué)習(xí)運動技能

    2022-05-10 16:21:57 來源: 用戶: 

    深度強化學(xué)習(xí) (RL) 的最新進展能夠解決機器人技術(shù)中復(fù)雜的高維問題。然而,有效地訓(xùn)練 RL 策略需要探索可能對機器人不安全的機器人狀態(tài)和動作。因此,Google Research 最近的一篇論文介紹了一種 RL 框架,用于學(xué)習(xí)腿部運動,同時滿足訓(xùn)練期間的安全約束。

    該框架由兩個政策組成。“安全恢復(fù)策略”將機器人從接近不安全的狀態(tài)中恢復(fù),“學(xué)習(xí)者策略”執(zhí)行所需的控制任務(wù)。該算法的有效性在三個運動任務(wù)上得到證明。對于高效的步態(tài)和走秀任務(wù),實現(xiàn)了沒有跌倒且無需手動重置的策略。

    只用四次跌倒訓(xùn)練了一條兩條腿的平衡任務(wù)。該論文表明,在現(xiàn)實世界中自主安全地學(xué)習(xí)腿部運動技能是可能的。

      免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔。 如有侵權(quán)請聯(lián)系刪除!

     
    分享:
    最新文章
    站長推薦