欧美色在线视频播放 视频,国产精品亚洲精品日韩已方,日本特级婬片中文免费看,亚洲 另类 在线 欧美 制服

<td id="8pdsg"><strong id="8pdsg"></strong></td>
<mark id="8pdsg"><menu id="8pdsg"><acronym id="8pdsg"></acronym></menu></mark>
<noscript id="8pdsg"><progress id="8pdsg"></progress></noscript>

    首頁 >> 人工智能 >

    狗訓(xùn)練方法可幫助教機(jī)器人學(xué)習(xí)新技巧

    2020-10-27 11:40:20 來源: 用戶: 

    約翰霍普金斯大學(xué)的計(jì)算機(jī)科學(xué)家采用一種通常用于教狗坐下和坐下的訓(xùn)練技術(shù),向機(jī)器人展示了一種如何自學(xué)幾種新技巧的機(jī)器人,包括堆砌塊。通過這種方法,名為Spot的機(jī)器人可以在幾天內(nèi)學(xué)習(xí)通常需要一個(gè)月的時(shí)間。

    通過使用正強(qiáng)化,這是任何使用過的對(duì)待改變狗行為的人都熟悉的方法,團(tuán)隊(duì)極大地提高了機(jī)器人的技能,并且很快地完成了訓(xùn)練,使訓(xùn)練實(shí)際工作的機(jī)器人成為一個(gè)更可行的企業(yè)。這些發(fā)現(xiàn)新發(fā)表在名為“ Good Robot!”的論文中。

    “這里的問題是我們?nèi)绾巫寵C(jī)器人學(xué)習(xí)技能?” 主要作者安德魯·洪特(Andrew Hundt)說。在約翰·霍普金斯大學(xué)計(jì)算互動(dòng)與機(jī)器人實(shí)驗(yàn)室工作的學(xué)生。“我有狗,所以我知道獎(jiǎng)勵(lì)的工作,這就是我設(shè)計(jì)學(xué)習(xí)算法的靈感。”

    與天生具有高度直覺的大腦的人和動(dòng)物不同,計(jì)算機(jī)是空白板,必須從頭開始學(xué)習(xí)一切。但是,真正的學(xué)習(xí)通常是通過反復(fù)試驗(yàn)來完成的,機(jī)器人專家仍在研究如何從錯(cuò)誤中有效學(xué)習(xí)。

    該團(tuán)隊(duì)在這里通過設(shè)計(jì)一種獎(jiǎng)勵(lì)系統(tǒng)來實(shí)現(xiàn)這一目標(biāo),該獎(jiǎng)勵(lì)系統(tǒng)可以像對(duì)待狗一樣對(duì)待機(jī)器人,為機(jī)器人工作。狗可能會(huì)因?yàn)樽龅煤玫墓ぷ鞫玫斤灨?,而機(jī)器人則獲得了數(shù)字積分。

    洪特回憶說,他曾經(jīng)教過他的小混混小狗叫利亞(Leah)命令“離開它”,這樣她就可以無視步行中的松鼠。他使用兩種類型的零食,普通的教練零食和更好的東西,例如奶酪。當(dāng)莉亞興奮而無所事事時(shí),她一無所有。但是當(dāng)她冷靜下來并移開視線時(shí),她得到了好東西。“那時(shí)候我給了她奶酪,然后說,'離開!好呀!'”

    同樣,要堆積塊,發(fā)現(xiàn)機(jī)器人需要學(xué)習(xí)如何專注于建設(shè)性行動(dòng)。當(dāng)機(jī)器人探索積木時(shí),它很快了解到正確的堆疊行為可以賺取高分,而錯(cuò)誤的堆疊則不能賺到高分。伸出手,但不理解障礙?沒有分?jǐn)?shù) 敲一堆?絕對(duì)沒有分。通過將最后一個(gè)區(qū)塊放在四個(gè)區(qū)塊的堆棧之上,Spot獲得了最大的收益。

    訓(xùn)練策略不僅有效,而且花了幾天的時(shí)間來告訴機(jī)器人過去需要數(shù)周的時(shí)間。通過首先訓(xùn)練類似于視頻游戲的模擬機(jī)器人,然后使用Spot運(yùn)行測(cè)試,該團(tuán)隊(duì)能夠減少練習(xí)時(shí)間。

    亨特說:“機(jī)器人想要更高的分?jǐn)?shù)。” “它可以迅速學(xué)習(xí)正確的行為以獲得最佳回報(bào)。實(shí)際上,機(jī)器人過去通常要花一個(gè)月的時(shí)間才能達(dá)到100%的精度。我們能夠在兩天內(nèi)做到這一點(diǎn)。”

    正強(qiáng)化不僅可以幫助機(jī)器人自學(xué)積木,而且通過點(diǎn)系統(tǒng),機(jī)器人可以很快學(xué)會(huì)其他幾個(gè)任務(wù),甚至包括如何玩模擬的導(dǎo)航游戲。在所有情況下都可以從錯(cuò)誤中學(xué)習(xí),這對(duì)于設(shè)計(jì)一種可以適應(yīng)新環(huán)境的機(jī)器人至關(guān)重要。

    洪特說:“起初,機(jī)器人不知道自己在做什么,但是每次練習(xí)都會(huì)越來越好。它永遠(yuǎn)不會(huì)放棄,并且會(huì)不斷嘗試堆疊,并且能夠100%地完成任務(wù)。”

    該團(tuán)隊(duì)認(rèn)為,這些發(fā)現(xiàn)可以幫助訓(xùn)練家用機(jī)器人去洗衣服和洗碗,這些任務(wù)在公開市場(chǎng)上很流行,并且可以幫助老年人獨(dú)立生活。它還可以幫助設(shè)計(jì)改進(jìn)的自動(dòng)駕駛汽車。

    哈格說:“我們的目標(biāo)是最終開發(fā)出可以在現(xiàn)實(shí)世界中完成復(fù)雜任務(wù)的機(jī)器人,例如產(chǎn)品組裝,照顧老人和手術(shù)。” “我們目前不知道如何編程這樣的任務(wù)-世界太復(fù)雜了。但是這樣的工作向我們表明,機(jī)器人可以學(xué)習(xí)如何以安全有效的方式完成此類現(xiàn)實(shí)任務(wù)的想法是有希望的辦法。”

      免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!

     
    分享:
    最新文章
    站長(zhǎng)推薦