為目標(biāo)檢測(cè)技術(shù)開(kāi)發(fā)的新人工智能框架
中國(guó)科學(xué)院合肥物理科學(xué)研究院(HFIPS)的研究人員提出了一種新的目標(biāo)檢測(cè)人工智能框架,為快速、高精度的實(shí)時(shí)在線目標(biāo)檢測(cè)提供了新的解決方案。
相關(guān)結(jié)果發(fā)表在ExpertSystemswithApplications中。
近年來(lái),深度學(xué)習(xí)理論推動(dòng)了人工智能技術(shù)的快速發(fā)展。基于深度學(xué)習(xí)理論的目標(biāo)檢測(cè)技術(shù)在許多工業(yè)應(yīng)用中也取得了成功。目前的研究側(cè)重于提高目標(biāo)檢測(cè)的速度或準(zhǔn)確性,并沒(méi)有考慮到效率和準(zhǔn)確性。如何實(shí)現(xiàn)快速準(zhǔn)確的目標(biāo)檢測(cè)成為人工智能領(lǐng)域的重要挑戰(zhàn)。
在這項(xiàng)研究中,研究人員發(fā)現(xiàn)基于深度學(xué)習(xí)的目標(biāo)檢測(cè)技術(shù)的主要缺陷之一在于深度網(wǎng)絡(luò)結(jié)構(gòu)的重復(fù)特征提取和融合,導(dǎo)致不必要的計(jì)算成本。
因此,他們提出了一種多輸入單輸出目標(biāo)識(shí)別框架(MiSo),它有別于傳統(tǒng)的多輸入多輸出模型,降低了模型復(fù)雜度和推理時(shí)間開(kāi)銷。
此外,在此框架下,研究人員基于早先提出的eRF檢測(cè)理論,設(shè)計(jì)了三種新的學(xué)習(xí)機(jī)制來(lái)更準(zhǔn)確、更高效地提取熱點(diǎn)特征信息,分別是感受野調(diào)整機(jī)制、殘差注意力自學(xué)習(xí)機(jī)制和eRF-基于動(dòng)態(tài)平衡的采樣策略。
“我們將它們命名為M2YOLOF,”領(lǐng)導(dǎo)團(tuán)隊(duì)的王宏強(qiáng)說(shuō),“它在一張?zhí)卣鲌D上檢測(cè)物體,在小物體上表現(xiàn)良好。它與YOLOF(YouOnlyLookOne-levelFeature)一樣快,但更準(zhǔn)確。"
他們?cè)跇?biāo)準(zhǔn)數(shù)據(jù)集基準(zhǔn)上進(jìn)行了嘗試,并以每秒29幀的速度達(dá)到了39.2的平均精度(AP)。它比現(xiàn)有最先進(jìn)的TridenNet-R50高2.6AP。
該方法為目標(biāo)檢測(cè)的研究和工業(yè)應(yīng)用提供了新的思路。
標(biāo)簽: