欧美色在线视频播放 视频,国产精品亚洲精品日韩已方,日本特级婬片中文免费看,亚洲 另类 在线 欧美 制服

<td id="8pdsg"><strong id="8pdsg"></strong></td>
<mark id="8pdsg"><menu id="8pdsg"><acronym id="8pdsg"></acronym></menu></mark>
<noscript id="8pdsg"><progress id="8pdsg"></progress></noscript>

    首頁 >> 數(shù)碼產(chǎn)品 >

    研究人員教機器人人類想要什么

    2021-10-10 09:18:18 來源: 用戶: 

    在電腦游戲中,賽車應(yīng)該被優(yōu)化,以提高其速度,同時沿著賽道行駛,然后汽車將踏板推到金屬上,然后繼續(xù)轉(zhuǎn)彎。說明書上沒有告訴汽車直行,所以是臨時起意的。

    研究人員教機器人人類想要什么

    這個例子——在電腦游戲中很有趣,但在生活中并不多——是一個促使斯坦福大學(xué)研究人員建立更好的方法來設(shè)定自主系統(tǒng)目標(biāo)的例子。

    計算機科學(xué)和電氣工程助理教授多爾薩薩迪格和她的實驗室將機器人設(shè)定目標(biāo)的兩種不同方法結(jié)合到一個過程中,在模擬和實際實驗中,它們的表現(xiàn)都優(yōu)于單個部分。研究人員在6月24日的機器人學(xué):科學(xué)與系統(tǒng)會議上介紹了這項工作。

    研究人員教機器人人類想要什么

    計算機科學(xué)研究生、《安迪帕蘭》的主要作者安迪帕蘭說:“未來,我完全希望世界上會有更多的自治系統(tǒng),它們需要理解什么是好的或壞的概念。紙?!爸陵P(guān)重要的是,如果我們想在未來部署這些自治系統(tǒng),那么我們必須這樣做?!?

    一種新的團隊向機器人提供指令的系統(tǒng)——稱為獎勵功能——結(jié)合了演示(人類向機器人展示該做什么)和用戶偏好調(diào)查,在用戶偏好調(diào)查中,人們回答關(guān)于他們希望機器人如何行為的問題。

    研究人員教機器人人類想要什么

    扎迪格說:“示威是有益的,但可能會帶來干擾。另一方面,偏好最多只能提供一點信息,但更準(zhǔn)確。”“我們的目標(biāo)是充分利用兩個世界的優(yōu)勢,更智能地合并這兩個來源的數(shù)據(jù),以更好地理解人類偏好的獎勵功能。”

    鄭重聲明:本文版權(quán)歸原作者所有。轉(zhuǎn)載文章只是為了傳播更多的信息。如果作者信息標(biāo)注有誤,請第一時間聯(lián)系我們修改或刪除。謝謝你。

      免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔(dān)。 如有侵權(quán)請聯(lián)系刪除!

     
    分享:
    最新文章
    站長推薦