欧美色在线视频播放 视频,国产精品亚洲精品日韩已方,日本特级婬片中文免费看,亚洲 另类 在线 欧美 制服

<td id="8pdsg"><strong id="8pdsg"></strong></td>
<mark id="8pdsg"><menu id="8pdsg"><acronym id="8pdsg"></acronym></menu></mark>
<noscript id="8pdsg"><progress id="8pdsg"></progress></noscript>

    首頁(yè) >> 人工智能 >

    內(nèi)心獨(dú)白通過(guò)語(yǔ)言模型規(guī)劃的具體推理

    2022-07-27 17:14:50 來(lái)源: 用戶: 

    大型語(yǔ)言模型(LLM)擁有豐富的關(guān)于世界的內(nèi)化知識(shí),并且能夠進(jìn)行一定程度的演繹并回答需要推理和推理的問(wèn)題。因此,arXiv.org上最近的一篇論文提出使用語(yǔ)言模型作為具體任務(wù)的交互式問(wèn)題解決器,例如機(jī)器人操作。

    研究人員將多個(gè)感知模型與機(jī)器人正在與之合作的人類用戶提供的反饋結(jié)合起來(lái)。為了執(zhí)行用戶給出的命令,從一組預(yù)先訓(xùn)練的機(jī)器人操作技能及其文本描述中選擇動(dòng)作。

    InnerMonologue系統(tǒng)的創(chuàng)建是為了在共享語(yǔ)言提示中將這些組件鏈接在一起。因此,該系統(tǒng)可以在仿真中以及在現(xiàn)實(shí)世界的機(jī)器人平臺(tái)上完成復(fù)雜、長(zhǎng)期和看不見(jiàn)的任務(wù)。

    最近的工作展示了如何將大型語(yǔ)言模型(LLM)的推理能力應(yīng)用于自然語(yǔ)言處理之外的領(lǐng)域,例如機(jī)器人的規(guī)劃和交互。這些體現(xiàn)的問(wèn)題需要智能體理解世界的許多語(yǔ)義方面:可用的技能庫(kù)、這些技能如何影響世界,以及世界的變化如何映射回語(yǔ)言。在具體環(huán)境中進(jìn)行規(guī)劃的LLM不僅需要考慮要做什么技能,還要考慮如何以及何時(shí)去做——答案會(huì)隨著時(shí)間的推移而變化,以響應(yīng)代理人自己的選擇。在這項(xiàng)工作中,我們調(diào)查了在這種具體情境中使用的LLM在多大程度上可以推理通過(guò)自然語(yǔ)言提供的反饋來(lái)源,而無(wú)需任何額外的培訓(xùn)。我們建議通過(guò)利用環(huán)境反饋,LLM能夠形成內(nèi)心獨(dú)白,使他們能夠在機(jī)器人控制場(chǎng)景中進(jìn)行更豐富的處理和計(jì)劃。我們調(diào)查各種反饋來(lái)源,例如成功檢測(cè)、場(chǎng)景描述和人機(jī)交互。我們發(fā)現(xiàn)閉環(huán)語(yǔ)言反饋顯著提高了三個(gè)領(lǐng)域的高級(jí)指令完成度,包括模擬和真實(shí)的桌面重新排列任務(wù)以及現(xiàn)實(shí)世界廚房環(huán)境中的長(zhǎng)視野移動(dòng)操作任務(wù)。

      免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!

     
    分享:
    最新文章
    站長(zhǎng)推薦