機(jī)器人通過(guò)觀看視頻來(lái)學(xué)習(xí)
想象一下,有一個(gè)私人機(jī)器人每天早上準(zhǔn)備您的早餐?,F(xiàn)在,想象一下該機(jī)器人不需要任何幫助來(lái)確定如何制作完美的煎蛋卷,因?yàn)樗ㄟ^(guò)在YouTube上觀看視頻學(xué)習(xí)了所有必要的步驟。這聽(tīng)起來(lái)像科幻小說(shuō),但是馬里蘭大學(xué)的一個(gè)團(tuán)隊(duì)剛剛?cè)〉昧酥卮笸黄?,這將使這種情況更加接近現(xiàn)實(shí)。
UMD計(jì)算機(jī)科學(xué)家Yiannis Aloimonos(中心)正在開(kāi)發(fā)能夠視覺(jué)識(shí)別物體并根據(jù)這些觀察結(jié)果產(chǎn)生新行為的機(jī)器人系統(tǒng)。 照片:約翰·T·康索利(John T. Consoli)在研究人員馬里蘭學(xué)院高級(jí)計(jì)算機(jī)研究所(UMIACS)大學(xué)與在科學(xué)家合作, 國(guó)家信息通信技術(shù)研究卓越的澳大利亞中心(NICTA)開(kāi)發(fā)能夠自學(xué)機(jī)器人系統(tǒng)。具體而言,這些機(jī)器人能夠通過(guò)觀看在線烹飪視頻來(lái)學(xué)習(xí)烹飪所需的復(fù)雜抓握和操縱動(dòng)作。關(guān)鍵的突破在于,機(jī)器人可以自己“思考”,確定觀察到的運(yùn)動(dòng)的最佳組合,從而使它們能夠有效地完成給定的任務(wù)。
這項(xiàng)工作將于2015年1月29日在德克薩斯州奧斯汀舉行的人工智能促進(jìn)協(xié)會(huì)會(huì)議上發(fā)表。研究人員通過(guò)結(jié)合三個(gè)不同研究領(lǐng)域的方法實(shí)現(xiàn)了這一里程碑:人工智能或可以自行決定的計(jì)算機(jī)設(shè)計(jì);計(jì)算機(jī)視覺(jué)或可以準(zhǔn)確識(shí)別形狀和運(yùn)動(dòng)的系統(tǒng)工程;和自然語(yǔ)言處理,或者開(kāi)發(fā)可以理解口語(yǔ)命令的強(qiáng)大系統(tǒng)。盡管基礎(chǔ)工作很復(fù)雜,但團(tuán)隊(duì)希望結(jié)果能反映出與人們的日常生活相關(guān)的實(shí)用和相關(guān)的內(nèi)容。
“我們之所以選擇烹飪視頻因?yàn)榇蠹叶家呀?jīng)做到了,并理解它,說(shuō):”雅尼斯Aloimonos,計(jì)算機(jī)科學(xué)與計(jì)算機(jī)視覺(jué)實(shí)驗(yàn)室主任的UMD教授,16個(gè)實(shí)驗(yàn)室和中心UMIACS之一。“但是就操作,所涉及的步驟和您使用的工具而言,烹飪很復(fù)雜。例如,如果要切黃瓜,則需要抓住刀,將其移動(dòng)到位,進(jìn)行切割并觀察結(jié)果,以確保正確地進(jìn)行了操作。”
一個(gè)關(guān)鍵的挑戰(zhàn)是設(shè)計(jì)一種方法,讓機(jī)器人在從質(zhì)量和一致性各異的視頻中收集信息的同時(shí),適當(dāng)?shù)亟馕龈鱾€(gè)步驟。機(jī)器人需要能夠識(shí)別每個(gè)不同的步驟,將其分配給指示某種行為的“規(guī)則”,然后以適當(dāng)?shù)捻樞驅(qū)⑦@些行為組合在一起。
UMD研究人員CorneliaFermüller(左)與研究生Yezhou Yang(右)合作開(kāi)發(fā)了能夠準(zhǔn)確識(shí)別和復(fù)制復(fù)雜手部動(dòng)作的計(jì)算機(jī)視覺(jué)系統(tǒng)。 照片:約翰·T·康索利(John T. Consoli)UMIACS的副研究科學(xué)家CorneliaFermüller說(shuō):“我們正在嘗試創(chuàng)造一種技術(shù),以使機(jī)器人最終能夠與人類互動(dòng) 。” “因此,他們需要了解人類在做什么。為此,我們需要工具,以便機(jī)器人可以拾取人類的動(dòng)作并實(shí)時(shí)跟蹤它們。我們有興趣了解所有這些組件。人如何執(zhí)行動(dòng)作?人們?nèi)绾慰创?它背后的認(rèn)知過(guò)程是什么?”
Aloimonos和Fermüller將這些單獨(dú)的動(dòng)作與句子中的單詞進(jìn)行了比較。機(jī)器人學(xué)習(xí)到動(dòng)作的“詞匯”后,便可以按照實(shí)現(xiàn)給定目標(biāo)的方式將它們串在一起。實(shí)際上,這正是他們的工作與以前的工作區(qū)別開(kāi)的地方。
“其他人試圖模仿這些運(yùn)動(dòng)。相反,我們嘗試復(fù)制目標(biāo)。這是突破,” Aloimonos解釋說(shuō)。這種方法允許機(jī)器人自己決定如何最好地組合各種動(dòng)作,而不是再現(xiàn)預(yù)定的一系列動(dòng)作。
這項(xiàng)工作還依賴于稱為深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的專用軟件體系結(jié)構(gòu)。盡管這種方法不是什么新方法,但它需要大量的處理能力才能正常工作,并且計(jì)算技術(shù)需要一段時(shí)間才能趕上。類似版本的神經(jīng)網(wǎng)絡(luò)負(fù)責(zé)智能手機(jī)中的語(yǔ)音識(shí)別功能以及Facebook和其他網(wǎng)站使用的面部識(shí)別軟件。
數(shù)十年來(lái),機(jī)器人一直被用來(lái)執(zhí)行復(fù)雜的任務(wù)(例如汽車裝配線),但這些必須由人類技術(shù)人員進(jìn)行仔細(xì)的編程和校準(zhǔn)。自學(xué)機(jī)器人可以通過(guò)觀察他人來(lái)收集必要的信息,這與人類學(xué)習(xí)的方式相同。Aloimonos和Fermüller設(shè)想了一個(gè)未來(lái),其中機(jī)器人趨向于處理日?,嵤拢祟悇t可以自由地從事更具刺激性的任務(wù)。
“通過(guò)擁有靈活的機(jī)器人,我們?yōu)樽詣?dòng)化的下一階段做出了貢獻(xiàn)。這將是下一次工業(yè)革命。” Aloimonos說(shuō)。“我們將擁有智能的制造環(huán)境和完全自動(dòng)化的倉(cāng)庫(kù)。使用自動(dòng)駕駛機(jī)器人進(jìn)行危險(xiǎn)工作非常好,以減輕炸彈爆炸和清理核事故,例如福島事件。我們已經(jīng)證明,類人機(jī)器人可以完成我們的人類工作。”
除了Aloimonos和Fermüller,研究的作者包括Yezhou陽(yáng),一個(gè)UMD計(jì)算機(jī)科學(xué)的博士生,以及易立,從NICTA Aloimonos和Fermüller的前博士生。
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!
- 借用外帶杯蓋的形狀無(wú)人機(jī)機(jī)翼可以學(xué)習(xí)如何更快地感知危險(xiǎn)
- 可以感覺(jué)到布料層的機(jī)器人有一天可能會(huì)幫助洗衣服
- 半導(dǎo)體生產(chǎn)廢水處理新技術(shù)的開(kāi)發(fā)
- Meta吹捧只翻譯口語(yǔ)的人工智能
- 使用模型和深度學(xué)習(xí)改進(jìn)人體皮膚的映射
- 為目標(biāo)檢測(cè)技術(shù)開(kāi)發(fā)的新人工智能框架
- 研究評(píng)估了用于VR耳機(jī)的免提文本選擇系統(tǒng)的功效
- 使用機(jī)器學(xué)習(xí)從匿名手機(jī)數(shù)據(jù)中提取個(gè)人信息
-
安徽淮南長(zhǎng)安獵手K50作為一款備受關(guān)注的皮卡車型,其2025款在配置和性能上都有所升級(jí)。對(duì)于想要購(gòu)買這款車的消...瀏覽全文>>
-
安徽阜陽(yáng)的大眾高爾夫GTI作為一款備受年輕消費(fèi)者喜愛(ài)的性能車型,其價(jià)格和配置一直是大家關(guān)注的重點(diǎn)。高爾夫GT...瀏覽全文>>
-
近年來(lái),新能源汽車市場(chǎng)發(fā)展迅猛,大眾品牌憑借其深厚的技術(shù)積累和可靠的產(chǎn)品品質(zhì),在國(guó)內(nèi)市場(chǎng)上占據(jù)了重要地...瀏覽全文>>
-
QQ多米作為一款備受關(guān)注的小型車,憑借其時(shí)尚的外觀設(shè)計(jì)和實(shí)用的配置,吸引了眾多消費(fèi)者的關(guān)注。為了幫助大家...瀏覽全文>>
-
隨著新能源汽車市場(chǎng)的持續(xù)升溫,上汽大眾ID 6 X憑借其寬敞的7座空間和出色的續(xù)航能力,成為不少家庭用戶的關(guān)...瀏覽全文>>
-
淮南途銳新能源2024款車型以其卓越的性能和環(huán)保特性吸引了眾多消費(fèi)者的關(guān)注。作為一款高端插電式混合動(dòng)力SUV,...瀏覽全文>>
-
近年來(lái),隨著新能源汽車的普及和政策支持的不斷加大,越來(lái)越多消費(fèi)者將目光投向了插電混動(dòng)車型。作為一款備受...瀏覽全文>>
-
2025款生活家PHEV作為一款備受關(guān)注的新能源車型,憑借其出色的性能和環(huán)保特性,吸引了眾多消費(fèi)者的目光。在購(gòu)...瀏覽全文>>
-
長(zhǎng)安汽車旗下高端新能源品牌——啟源,在2024款新車的推出中再次吸引了廣泛關(guān)注。作為該品牌的旗艦車型之一,...瀏覽全文>>
-
近年來(lái),新能源汽車市場(chǎng)持續(xù)火熱,各大品牌紛紛推出新款車型以滿足消費(fèi)者需求。在眾多選擇中,2025款安徽池州I...瀏覽全文>>
- iPhone用戶現(xiàn)在可以通過(guò)iOS18.1更新更改其Apple帳戶的主要電子郵件地址
- 當(dāng)你看到T-Mobile用戶贏得手機(jī)手表和耳機(jī)時(shí)你會(huì)羨慕不已
- Ubuntu24.10OracularOriole推出最新內(nèi)核工具鏈GNOME47和增強(qiáng)的安全性
- 搭載M4的MacBookPro在Cinebench上擊敗了CoreUltra9288V和Ryzen9AI370HX
- EarFun推出功能強(qiáng)大的159美元UBoomX便攜式揚(yáng)聲器
- iPhone16Pro iPhone16ProMax表現(xiàn)優(yōu)于基本機(jī)型扭轉(zhuǎn)了之前的趨勢(shì)
- Waze迎來(lái)魔獸世界改版
- SquareEnix將心愛(ài)的RPG移植到MetaQuest3
- 蘋果正在設(shè)計(jì)全新操作系統(tǒng)瞄準(zhǔn)新類別的產(chǎn)品
- 小米R(shí)edmiA27U顯示器采用4K面板和90WUSBC端口
- QQ多米落地價(jià),各配置車型售價(jià)一目了然
- 生活家PHEV多少錢?購(gòu)車攻略在此
- 現(xiàn)代伊蘭特試駕,暢享豪華駕乘,體驗(yàn)卓越性能
- 試駕領(lǐng)克03,從預(yù)約到試駕的完美旅程
- QQ多米最新價(jià)格2025款,各配置車型售價(jià)全揭曉,性價(jià)比之王
- 淮北途觀L多少錢 2025款落地價(jià),價(jià)格再創(chuàng)新低,性價(jià)比爆棚
- 山東濟(jì)南帕薩特新能源新款價(jià)格2025款多少錢?最低售價(jià)17.715萬(wàn)起,性價(jià)比大揭秘
- SWM斯威G01FF新款價(jià)格2024款多少錢?看完這篇購(gòu)車攻略再做決定
- 淮南ID.4 X價(jià)格,最低售價(jià)13.9888萬(wàn)起,價(jià)格再創(chuàng)新低
- 滁州途鎧多少錢 2023款落地價(jià)與配置的完美平衡
- 蘋果將為iPhone17系列采用新電池技術(shù)
- Adobe推出PhotoshopElements和PremiereElements2025取消Elements軟件的永久許可
- AppleiPhoneSE4將配備更新的OLED顯示屏
- InfinixZeroFlip首次亮相作為新款可折疊Android智能手機(jī)其價(jià)格低于摩托羅拉Razr2024
- OnePlus13型號(hào) 充電規(guī)格在最新泄漏中被登記
- Insta360AcePro2主要規(guī)格終于泄露GoPro和DJI運(yùn)動(dòng)相機(jī)競(jìng)爭(zhēng)對(duì)手將配備50MP傳感器5nm和2倍數(shù)碼變焦
- XboxElite無(wú)線控制器系列2通過(guò)Xbox設(shè)計(jì)實(shí)驗(yàn)室獲得透明面板
- 索尼INZONEM10S華碩ROGSwiftOLEDPG27AQDP新品上市但售價(jià)更高
- 谷歌終止PixelBuds的點(diǎn)擊通知功能
- 谷歌正在努力完善iOS中缺少的RCS支持重要功能
- 對(duì)AppleIntelligence功能的評(píng)價(jià)從一般到還可以
- GalaxyS25Plus看起來(lái)很時(shí)髦但三星是否選擇像iPhone一樣的通用設(shè)計(jì)
- 優(yōu)質(zhì)48英寸三星S90DOLED電視在亞馬遜上降至歷史最低價(jià)同時(shí)贈(zèng)送100美元Xbox禮品卡和1年保護(hù)計(jì)劃
- AOC推出四款新型游戲顯示器具有快速刷新率和低價(jià)格
- Valve出售部分SteamDeck型號(hào)-GBLCD型號(hào)售價(jià)296.65美元512GBLCD型號(hào)售價(jià)336.75美元
- Beats在其產(chǎn)品線中增加了手機(jī)保護(hù)殼推出適用于iPhone16系列的MagSafe保護(hù)殼
- 三星在IFA2024上展示AI產(chǎn)品
- 新的AIPlaygroundDesign工具你可以簡(jiǎn)單地與之交談就像ChatGPT一樣
- 極簡(jiǎn)主義Linux發(fā)行版Peropesis2.7附帶存檔和ISO管理工具
- GAMEBABY控制器和外殼混合套裝現(xiàn)已接受預(yù)訂